Экспертный подход и машинное обучение для разработки CJM

Чтобы наглядно показать траекторию взаимодействия потребителя с продуктом и разработать стратегию его улучшения, маркетологи используют Customer Journey Map (CJM) – направленный граф, вершины которого означают текущий контакт с клиентом, а ребра – вероятности перехода к следующему (рис. 1)

Если направить клиента по той ветке графа, которая приносит наибольшую конверсию, можно существенно увеличить прибыль или достичь другой целевой бизнес-метрики, например, снизить отток, повысить средний чек и т.д.

Существует 3 подхода к построению CJM:

экспертный метод – разработка карты вручную в виде простой Excel-таблицы, без использования специальных техник и инструментов, как описано в этой статье на примере Pult.ru. Такой способ позволяет получить результаты быстро и просто, но его невозможно масштабировать и сложно автоматизировать.
сведение к задаче анализа текстов – автоматизированный разбор пользовательских лог-файлов, кодирование каждого действия клиента буквой из заранее разработанного алфавита, кластеризация слов и дальнейшая классификация потребительских сегментов, как я рассказывал в кейсе про Банк. Этот независимый от экспертного мнения метод хорошо подойдет там, где цели клиента известны точно и можно отследить всю траекторию его движения по сайту или мобильному приложению. Однако, результаты сильно зависят от подобранного алфавита, на разработку которого тратится очень много времени и сил.
использование машинного обучения (Machine Learning, ML) вместе с экспертными знаниями. Как это сделать на практике, а также каковы основные достоинства и недостатки такого подхода, рассмотрено в данной статье.

Постановка задачи

Задачи прогнозирования продукта, интересующего пользователя, и оперативная генерация персонального маркетингового предложения актуальны для каждого монобрендового бизнеса с широкой, но однотипной продуктовой линейкой. Например, производитель мобильных телефонов или автодилер. Предугадывая предпочтения клиента, можно предложить ему товар, максимально отвечающий его ожиданиям. Это значительно повысит частную вероятность покупки и общую лояльность к бренду или продавцу. Однако, проблема в том, при наличии множества товаров с близкими характеристиками, неизвестно, чего именно хочет потенциальный покупатель, т.е. каковы основные мотивы его выбора. Например, какие качества продукта являются для клиента ключевыми: имидж (марка, дизайн), надежность, экологичность, безопасность, функциональные или ценовые характеристики.

После того, как главный мотив выбора по каждому потребительскому сегменту определен, можно разрабатывать для него точную маркетинговую стратегию и реализовывать ее с помощью таргетированной рекламы, сократив таким образом количество показов, но увеличив конверсию продаж. В рамках такого подхода задача построения CJM (рис. 2.) сводится к сегментации целевой аудитории на основе клиентских предпочтений, которые заранее неизвестны и в явном виде никак не регламентированы.

Рис. 2. Пример CJM с учетом цикла готовности потребителя к покупке

Особенности реализации

Чтобы выявить различные мотивы потребительского поведения, сначала следует определить типовые категории клиентов. Для этого проще и быстрее всего обратиться к экспертам, т.е. поинтересоваться у бизнеса, какие группы клиентов он выделяют на основе своего опыта. Одновременно с этим следует собрать данные о поведении пользователей на сайте: участки веб-страниц с наибольшим временем просмотра, кликабельность ссылок, кнопок и других элементов графического интерфейса (UI/UX – user interface/user expirience). Получить эту информацию можно с помощью вебвизора – технологии, которая записывает действия посетителя в режиме онлайн-видео [1] через систему аналитики Яндекс.Метрика или аналогичные сервисы.

Полученные таким образом данные о потребительском поведении необходимо соотнести с выделенными экспертом сегментами. Например, если посетитель сайта долго изучает характеристики продукта, то, скорей всего, основной мотив выбора данного клиента – это функциональные качества товара, а не лояльность к марке. Для этого пользователя целесообразно показать такой рекламный ролик, который показывает красоту и техничность реализации продуктовых характеристик в продукции бренда, чтобы подчеркнуть превосходство этого бренда относительно других. Это поможет сформировать у человека лояльность к марке. Если же клиент просматривает весь модельный ряд, не концентрируясь на описании товарных свойств, можно считать приверженность бренду ключевым мотивом выбора и запускать для такого потребителя другую рекламную кампанию.

Чтобы понять, к какой группе потребителей относится зашедший на сайт пользователь, следует, прежде всего, кластеризовать UI/UX-элементы [2], характер взаимодействия с которыми определяет потребительский сегмент. Таким образом, сегментирование посетителей сайта сводится к типовой задаче классификации, успешно решаемой алгоритмами машинного обучения [3].

После того, как определена принадлежность клиента к определенному сегменту, для него автоматически формируется персональное pop-up окно с рекламой товара или марки с важной для потребителя точки зрения. Анализируя реакцию клиента на такие всплывающие окна, можно дальше корректировать маркетинговую стратегию, подстраивая рекламные предложения под ожидания потребителя с учетом его готовности к покупке. Так, на основании экспертного опыта, частично размеченной выборки и ML-алгоритмов мы получаем интерактивную CJM, которая автоматически масштабируется и может быть использована в случае добавления новых товаров или выхода в другие регионы.

Задача одноклассовой классификации

Поскольку поведение пользователей в различных сегментах отличается друг от друга, будем считать, что классы не пересекаются и являются изолированными друг от друга. Для упрощения задачи сведем ее к одноклассовой классификации, когда нужно установить принадлежность объектов к единственной выделенной группе. Например, идентифицировать, является ли новый пользователь, пришедший на сайт, лояльным к бренду. Наиболее популярным методом решения задач одноклассовой классификации явлется машина опорных векторов (SVM, support vector machine) [3].

В качестве основы ML-алгоритма будем использовать one-class SVM with non-linear kernel [4], который отлично подходит для задач классификации и кластеризации

Суть обычного SVM-алгоритма состоит в нахождении точек, которые расположены непосредственно к линии разделения (разделяющей гиперплоскости) ближе всего. Эти точки называются опорными векторами. Алгоритм вычисляет зазор – расстояние между опорными векторами и разделяющей гиперплоскостью. Лучшей гиперплоскостью считается та, для которой этот зазор является максимально большим (рис. 3) [5].

Графическая интерпретация метода опорных векторов: а – набор гиперпрямых, разделяющих объекты 2-х классов; б – оптимальная разделяющая гиперпрямая с максимальным зазором от опорных векторов – наблюдений, лежащих на границе максимизации — Рис. 3. Графическая интерпретация метода опорных векторов:
а – набор гиперпрямых, разделяющих объекты 2-х классов; б – оптимальная разделяющая гиперпрямая с максимальным зазором от опорных векторов – наблюдений, лежащих на границе максимизации

Задача одноклассовой классификации решается аналогичным способом с использованием опорных векторов и разделяющей гиперплоскости (гиперпрямой).

На вход алгоритма подаются подготовленные к ML-моделированию (очищенные и нормализованные) данные из вебвизора, а на выходе мы получаем оценку, принадлежит ли объект с этими значениями признаков к исследуемому классу или нет.

После обучения алгоритма на частично размеченной выборке с учетом комментариев эксперта, модель тестируется и запускается в промышленную эксплуатацию, о чем рассказано в следующем пункте настоящей статьи.

Пример внедрения

Данный подход был использован для российского сайта популярных импортных автомобилей с целью прогноза модели машины, которая заинтересует посетителя так, что он захочет ее приобрести. Успешность применения подхода оценивалась по прямым бизнес-метрикам: процент отказов по рекламе и уровень продаж.

Сперва эксперт разделил пользователей на следующие категории (рис. 4):

низкий ценовой диапазон – те, кто выбирают машину по цене, без учета марки;
средний ценовой диапазон, в котором ключевым фактором выбора машины является набор определенных характеристик, а не приверженность бренду;
средний ценовой диапазон лояльных к марке клиентов, которые выбирают авто из продуктовой линейки любимого бренда;
клиенты в поиске бренда, которые сначала определяются с маркой желаемого автомобиля, а затем ищут конкретную модель.

Рис. 4. Выделенные экспертом исходные категории пользователей и вероятности их изменения

Была поставлена задача сфокусироваться на посетителях, которые находятся на этапе поиска марки, чтобы показывать им соответствующую рекламу о преимуществах машин этого бренда относительно продукции конкурентов. Чтобы определить принадлежность посетителя сайта к этому сегменту с помощью ML, сначала мы сформировали кластеры UI/UX-элементов. Далее с помощью эксперта полученная выборка была частично размечена (рис. 5): например, посетители, которые больше внимания уделяют той части экрана, где представлены характеристики машины, выбирают авто по характеристикам и не относятся к целевой группе. Аналогично, если пользователь сразу просматривает только конкретную модель, не обращая внимания на остальной товарный ряд. Оставшиеся 2 сегмента связаны с маркой, причем среди них есть посетители сайта, которые просто смотрят машины, но не заинтересованы в покупке. В большинстве случаев они не просматривали среднюю и нижнюю части экрана, концентрируя свое внимание слайдере с фотографиями машин. Отбросив посетителей с таким поведением, мы получили искомый сегмент – людей в поиске марки, которые хотят разобраться в том, какой бренд лучше. Для них была запущена специальная таргетированная кампания в рекламных сетях, которая рассказывала о преимуществах наших автомобилей по сравнению с конкурентами.

Рис. 5. Частично размеченная выборка потребительских сегментов: синим цветом отмечены пользователи, которые выбирают машину, красным – те, кто выбирает характеристики

В результате 3-х месячного проекта, процент отказов по рекламе снизился в 3 раза, а продажи выросли на 12%. Оценив потенциал всех вероятных точек контакта с пользователем, компания эффективно распределила финансовые и управленческие ресурсы и повысила эффективность маркетинговых каналов.

Заключение

Построение CJM на основе экспертных знаний и ML-моделей отлично подходит для разработки узкопрофильных рекламных кампаний, нацеленных на специализированную аудиторию. Этот комплексный подход позволяет получить результаты с высоким качеством и устойчивые к изменениям. В частности, если появится новая модель изделий или изменятся цены, ML-модель перестроится автоматически. Однако, метод достаточно трудоемок в использовании и его сложно применить к большим CJM. Например, если потребуется решать задачу многоклассовой классификации, сложность и время разработки существенно возрастут. Тем не менее, данный подход в очередной раз доказывает, что слаженная работа экспертов предметной области и специалистов по Data Science с бизнесом дают отличные результаты при правильной постановке целей и прикладных задач.

Источники