고객 로그데이터를 이용한 고객 세분화 – 클러스터링


프로세스 마이닝과 클러스터링을 이용하면

고객 동선뿐만 아니라 그룹별 고객 동선 또한 확인할 수 있습니다.

또한, 데이터에 여러가지 속성을 결합하면 그룹별 특징을 확인할 수 있으며,

이에 따라 많은 전략적 시사점을 도출할 수 있습니다.

이는 회사 전략을 세우는데 타당한 근거로 사용될 수 있습니다.

로그 데이터는 실제 현실에서 발생하는 사건을 데이터로 기록한 것으로, 로그 데이터를 분석하면 실제 현황에 대해서 자세히 확인할 수 있습니다. 프로세스 마이닝을 이용해 로그 데이터를 분석할 수 있으며, 이번 편에서는 클러스터링과 프로세스 마이닝을 이용한 웹 로그 데이터 분석을 소개하겠습니다.

애견 쇼핑몰 가공 데이터를 프로세스 마이닝에 적용하여 프로세스 맵을 그렸으며 이는 [그림 1]에 나타나 있습니다. 프로세스 맵은 실제 고객이 웹페이지에서 움직인 동선을 그려주며, 프로세스 맵을 통하여 어디로부터 고객이 많이 방문했는지, 어떤 곳을 많이 방문했는지 등을 확인할 수 있습니다. 빨간색이 진할수록 많이 방문한 웹페이지로, 해당 애견 사이트는 메인홈페이지, 검색, 기본상품, 장바구니, 이벤트 웹페이지를 많이 방문한 것을 알 수 있습니다.

[그림1] 프로세스 맵

위의 프로세스 맵으로 웹사이트를 방문한 전체적인 고객 동선을 확인할 수 있지만, 모든 고객들이 위의 동선처럼 웹사이트를 이용하지 않습니다. 고객을 특징별로 분류한 후 분류된 고객의 동선이 어떻게 달라지는 확인해 보겠습니다. 분류에는 클러스터링 방법론 중 가장 대표적인 K-means를 이용하였으며, K-means는 데이터를 K개의 군집으로 묶어주는 알고리즘입니다. 방법론에 대한 자세한 내용은 K-Means(위키)를 참조해주시면 됩니다.

방문한 웹페이지를 이용하여 애견 웹사이트 고객을 5개의 그룹으로 나누었으며, 그룹별 특징은 [그림2]에서 확인할 수 있습니다. 왼쪽 위부터 1번, 2번, 3번 그룹, 아래는 4번, 5번 그룹의 특징을 Radar 그림으로 나타냈습니다. 중앙에서 많이 떨어질수록 해당 웹페이지를 많이 이용한 것을 나타내며, radar 그림으로 각 그룹의 특징을 확인해 보겠습니다. 2번 그룹에 속한 고객은 다른 그룹보다 세일상품을 많이 본 고객 비율이 높은 것으로 확인됩니다. 3번 그룹은 다른 그룹보다 프리미엄상품을 많이 본 고객 비율이 높으며, 5번 그룹은 전체적으로 다른 그룹보다 웹페이지 이용 비율이 높으며, 특히 검색, 기본상품, 장바구니를 많이 본 고객 비율이 높습니다.

[그림2] K-means 결과 (Radar)

위의 그룹이 프로세스 맵에 어떤 영향을 주는지 확인해 보겠습니다. 2번 그룹에 속한 고객 동선을 프로세스 맵으로 그려보았으며, 해당 그림은 [그림 3]을 통해 확인이 가능합니다. 위의 결과와 동일하게 2번 그룹 고객들은 세일상품을 많이 이용하였으며, [메인 홈페이지 > 세일상품 > 기본상품] 순으로 웹페이지를 많이 이용 하였습니다. 또한, 기본상품과 세일상품을 서로 번갈아보며 이용한 것으로 확인됩니다.

[그림3] 프로세스 맵 – 2번 그룹

4번 그룹에 속한 고객 동선의 프로세스 맵은 [그림 4]에 나타나 있으며, 위의 결과와 동일하게 프리미엄상품을 많이 이용하였습니다. 페이지를 순차적으로 이용하는 3번 그룹과는 다르게 메인홈페이지를 중심으로 여러 페이지를 이용한 것으로 확인되며, 특히 프리미엄상품 다음으로 이벤트를 많이 이용하였습니다.

[그림4] 프로세스 맵 – 4번 그룹

마지막으로 5번 그룹에 속한 고객 동선을 프로세스 맵으로 그려보았으며, 해당 그림은 [그림 5]를 통해 확인이 가능합니다. 위의 결과와 동일하게 5번 그룹 고객들은 검색, 이벤트, 장바구니를 많이 이용하였으며, 검색과 기본상품을 서로 연계하여 이용한 것으로 확인됩니다.

[그림5] 프로세스 맵 – 5번 그룹

이처럼 프로세스 마이닝과 클러스터링을 이용하면 전체적인 고객 동선뿐만 아니라 그룹별 고객 동선 또한 확인할 수 있습니다. 또한 지금은 단순히 웹페이지 데이터만 이용하였지만, 데이터에 여러가지 속성을 결합하면 여러 그룹별 특징을 확인할 수 있으며, 이에 따라 많은 전략적 시사점을 도출할 수 있습니다. 이는 회사 전략을 세우는데 타당한 근거로 사용될 수 있습니다.