Чернобровов АлексейАналитик

Экспертный подход и машинное обучение для разработки CJM

Чтобы наглядно показать траекторию взаимодействия потребителя с продуктом и разработать стратегию его улучшения, маркетологи используют Customer Journey Map (CJM) – направленный граф, вершины которого означают текущий контакт с клиентом, а ребра – вероятности перехода к следующему (рис. 1)

Схематичное изображение CJM
Рис. 1. Схематичное изображение CJM

 

Если направить клиента по той ветке графа, которая приносит наибольшую конверсию, можно существенно увеличить прибыль или достичь другой целевой бизнес-метрики, например, снизить отток, повысить средний чек и т.д.

 

Существует 3 подхода к построению CJM:

  • экспертный метод – разработка карты вручную в виде простой Excel-таблицы, без использования специальных техник и инструментов, как описано в этой статье на примере Pult.ru. Такой способ позволяет получить результаты быстро и просто, но его невозможно масштабировать и сложно автоматизировать.
  • сведение к задаче анализа текстов – автоматизированный разбор пользовательских лог-файлов, кодирование каждого действия клиента буквой из заранее разработанного алфавита, кластеризация слов и дальнейшая классификация потребительских сегментов, как я рассказывал в кейсе про Банк. Этот независимый от экспертного мнения метод хорошо подойдет там, где цели клиента известны точно и можно отследить всю траекторию его движения по сайту или мобильному приложению. Однако, результаты сильно зависят от подобранного алфавита, на разработку которого тратится очень много времени и сил.
  • использование машинного обучения (Machine Learning, ML) вместе с экспертными знаниями. Как это сделать на практике, а также каковы основные достоинства и недостатки такого подхода, рассмотрено в данной статье.

Постановка задачи

Задачи прогнозирования продукта, интересующего пользователя, и оперативная генерация персонального маркетингового предложения актуальны для каждого монобрендового бизнеса с широкой, но однотипной продуктовой линейкой. Например, производитель мобильных телефонов или автодилер. Предугадывая предпочтения клиента, можно предложить ему товар, максимально отвечающий его ожиданиям. Это значительно повысит частную вероятность покупки и общую лояльность к бренду или продавцу. Однако, проблема в том, при наличии множества товаров с близкими характеристиками, неизвестно, чего именно хочет потенциальный покупатель, т.е. каковы основные мотивы его выбора. Например, какие качества продукта являются для клиента ключевыми: имидж (марка, дизайн), надежность, экологичность, безопасность, функциональные или ценовые характеристики.

После того, как главный мотив выбора по каждому потребительскому сегменту определен, можно разрабатывать для него точную маркетинговую стратегию и реализовывать ее с помощью таргетированной рекламы, сократив таким образом количество показов, но увеличив конверсию продаж. В рамках такого подхода задача построения CJM (рис. 2.) сводится к сегментации целевой аудитории на основе клиентских предпочтений, которые заранее неизвестны и в явном виде никак не регламентированы.

Пример CJM с учетом цикла готовности потребителя к покупке

Рис. 2. Пример CJM с учетом цикла готовности потребителя к покупке

 

Особенности реализации

Чтобы выявить различные мотивы потребительского поведения, сначала следует определить типовые категории клиентов. Для этого проще и быстрее всего обратиться к экспертам, т.е. поинтересоваться у бизнеса, какие группы клиентов он выделяют на основе своего опыта. Одновременно с этим следует собрать данные о поведении пользователей на сайте: участки веб-страниц с наибольшим временем просмотра, кликабельность ссылок, кнопок и других элементов графического интерфейса (UI/UX – user interface/user expirience). Получить эту информацию можно с помощью вебвизора – технологии, которая записывает действия посетителя в режиме онлайн-видео [1] через систему аналитики Яндекс.Метрика или аналогичные сервисы.

Полученные таким образом данные о потребительском поведении необходимо соотнести с выделенными экспертом сегментами. Например, если посетитель сайта долго изучает характеристики продукта, то, скорей всего, основной мотив выбора данного клиента – это функциональные качества товара, а не лояльность к марке. Для этого пользователя целесообразно показать такой рекламный ролик, который показывает красоту и техничность реализации продуктовых характеристик в продукции бренда, чтобы подчеркнуть превосходство этого бренда относительно других. Это поможет сформировать у человека лояльность к марке. Если же клиент просматривает весь модельный ряд, не концентрируясь на описании товарных свойств, можно считать приверженность бренду ключевым мотивом выбора и запускать для такого потребителя другую рекламную кампанию.

Чтобы понять, к какой группе потребителей относится зашедший на сайт пользователь, следует, прежде всего, кластеризовать UI/UX-элементы [2], характер взаимодействия с которыми определяет потребительский сегмент. Таким образом, сегментирование посетителей сайта сводится к типовой задаче классификации, успешно решаемой алгоритмами машинного обучения [3].

После того, как определена принадлежность клиента к определенному сегменту, для него автоматически формируется персональное pop-up окно с рекламой товара или марки с важной для потребителя точки зрения. Анализируя реакцию клиента на такие всплывающие окна, можно дальше корректировать маркетинговую стратегию, подстраивая рекламные предложения под ожидания потребителя с учетом его готовности к покупке. Так, на основании экспертного опыта, частично размеченной выборки и ML-алгоритмов мы получаем интерактивную CJM, которая автоматически масштабируется и может быть использована в случае добавления новых товаров или выхода в другие регионы.

 

Задача одноклассовой классификации

Поскольку поведение пользователей в различных сегментах отличается друг от друга, будем считать, что классы не пересекаются и являются изолированными друг от друга. Для упрощения задачи сведем ее к одноклассовой классификации, когда нужно установить принадлежность объектов к единственной выделенной группе. Например, идентифицировать, является ли новый пользователь, пришедший на сайт, лояльным к бренду. Наиболее популярным методом решения задач одноклассовой классификации явлется машина опорных векторов (SVM, support vector machine) [3].

В качестве основы ML-алгоритма будем использовать one-class SVM with non-linear kernel [4], который отлично подходит для задач классификации и кластеризации

Суть обычного SVM-алгоритма состоит в нахождении точек, которые расположены непосредственно к линии разделения (разделяющей гиперплоскости) ближе всего. Эти точки называются опорными векторами. Алгоритм вычисляет зазор – расстояние между опорными векторами и разделяющей гиперплоскостью. Лучшей гиперплоскостью считается та, для которой этот зазор является максимально большим (рис. 3) [5].

Графическая интерпретация метода опорных векторов: а – набор гиперпрямых, разделяющих объекты 2-х классов; б – оптимальная разделяющая гиперпрямая с максимальным зазором от опорных векторов – наблюдений, лежащих на границе максимизации

Рис. 3. Графическая интерпретация метода опорных векторов:

а – набор гиперпрямых, разделяющих объекты 2-х классов; б – оптимальная разделяющая гиперпрямая с максимальным зазором от опорных векторов – наблюдений, лежащих на границе максимизации

 

Задача одноклассовой классификации решается аналогичным способом с использованием опорных векторов и разделяющей гиперплоскости (гиперпрямой).

На вход алгоритма подаются подготовленные к ML-моделированию (очищенные и нормализованные) данные из вебвизора, а на выходе мы получаем оценку, принадлежит ли объект с этими значениями признаков к исследуемому классу или нет.

После обучения алгоритма на частично размеченной выборке с учетом комментариев эксперта, модель тестируется и запускается в промышленную эксплуатацию, о чем рассказано в следующем пункте настоящей статьи.

 

Пример внедрения

Данный подход был использован для российского сайта популярных импортных автомобилей с целью прогноза модели машины, которая заинтересует посетителя так, что он захочет ее приобрести. Успешность применения подхода оценивалась по прямым бизнес-метрикам: процент отказов по рекламе и уровень продаж.

Сперва эксперт разделил пользователей на следующие категории (рис. 4):

  1. низкий ценовой диапазон – те, кто выбирают машину по цене, без учета марки;
  2. средний ценовой диапазон, в котором ключевым фактором выбора машины является набор определенных характеристик, а не приверженность бренду;
  3. средний ценовой диапазон лояльных к марке клиентов, которые выбирают авто из продуктовой линейки любимого бренда;
  4. клиенты в поиске бренда, которые сначала определяются с маркой желаемого автомобиля, а затем ищут конкретную модель.
Выделенные экспертом исходные категории пользователей и вероятности их изменения
Рис. 4. Выделенные экспертом исходные категории пользователей и вероятности их изменения

 

Была поставлена задача сфокусироваться на посетителях, которые находятся на этапе поиска марки, чтобы показывать им соответствующую рекламу о преимуществах машин этого бренда относительно продукции конкурентов. Чтобы определить принадлежность посетителя сайта к этому сегменту с помощью ML, сначала мы сформировали кластеры UI/UX-элементов. Далее с помощью эксперта полученная выборка была частично размечена (рис. 5): например, посетители, которые больше внимания уделяют той части экрана, где представлены характеристики машины, выбирают авто по характеристикам и не относятся к целевой группе. Аналогично, если пользователь сразу просматривает только конкретную модель, не обращая внимания на остальной товарный ряд. Оставшиеся 2 сегмента связаны с маркой, причем среди них есть посетители сайта, которые просто смотрят машины, но не заинтересованы в покупке. В большинстве случаев они не просматривали среднюю и нижнюю части экрана, концентрируя свое внимание слайдере с фотографиями машин. Отбросив посетителей с таким поведением, мы получили искомый сегмент – людей в поиске марки, которые хотят разобраться в том, какой бренд лучше. Для них была запущена специальная таргетированная кампания в рекламных сетях, которая рассказывала о преимуществах наших автомобилей по сравнению с конкурентами.

Частично размеченная выборка потребительских сегментов: синим цветом отмечены пользователи, которые выбирают машину, красным – те, кто выбирает характеристики

Рис. 5. Частично размеченная выборка потребительских сегментов: синим цветом отмечены пользователи, которые выбирают машину, красным – те, кто выбирает характеристики

 

В результате 3-х месячного проекта, процент отказов по рекламе снизился в 3 раза, а продажи выросли на 12%. Оценив потенциал всех вероятных точек контакта с пользователем, компания эффективно распределила финансовые и управленческие ресурсы и повысила эффективность маркетинговых каналов.

 

Заключение

Построение CJM на основе экспертных знаний и ML-моделей отлично подходит для разработки узкопрофильных рекламных кампаний, нацеленных на специализированную аудиторию. Этот комплексный подход позволяет получить результаты с высоким качеством и устойчивые к изменениям. В частности, если появится новая модель изделий или изменятся цены, ML-модель перестроится автоматически. Однако, метод достаточно трудоемок в использовании и его сложно применить к большим CJM. Например, если потребуется решать задачу многоклассовой классификации, сложность и время разработки существенно возрастут. Тем не менее, данный подход в очередной раз доказывает, что слаженная работа экспертов предметной области и специалистов по Data Science с бизнесом дают отличные результаты при правильной постановке целей и прикладных задач.

 

Источники

  1. Вебвизор
  2. Кластеризация
  3. Классификация
  4. Одноклассовая классификация scikit-learn
  5. Краткий обзор алгоритма машинного обучения: Метод Опорных Векторов (SVM)

Контакты