Сегодня, когда большие данные бороздят просторы облачного блокчейна, каждая организация стремится стать data-driven. Руководители рассматривают Data Science как панацею для избавления от всех стратегических и операционных проблем. А специалист по данным считается универсальным солдатом с серебряными пулями. Почему это не правда, зачем нужны разные Data Professional’ы и можно ли сэкономить на дорогой аналитике, я расскажу в данной статье.
Кому, когда и зачем нужна аналитика данных
Определить наиболее прибыльные направления, выявить источники скрытых затрат, оценить эффективность маркетинговых стратегий, уточнить портрет целевой аудитории, составить план повышения конверсии – это далеко не полный список типичных задач аналитика данных. Собрав разрозненную информацию из различных источников (веб-сервисов «Яндекс.Метрика» и/или Google Analytics, систем email-рассылок, корпоративных хранилищ данных, 1С и т.д.), Data Analyst (аналитик) сделает краткие и понятные отчеты, чтобы руководитель наглядно видел все самые важные показатели своего бизнеса и мог своевременно принимать нужные управленческие решения. Например, увеличить инвестиции в те рекламные каналы, которые приводят на сайт интернет-магазина больше посетителей, заинтересованных в продукции, или внедрить систему рекомендаций для повышения среднего чека с помощью кросс-продаж [1].
Анализ данных понадобится при выходе на новые рынки сбыта, разработке нового продукта или расширении географии продаж. Детальное исследование потенциальных покупателей поможет сформировать максимально результативные маркетинговые кампании, основанные на реальных нуждах и возможностях потребителей. Также менеджмент получит достаточно точные ответы на вопросы о целесообразности открытия нового филиала и прогнозы о достижении самоокупаемости.
Цельная картина исторических данных (статистика расходов, динамика продаж, рост целевой аудитории, влияние сезонности и политической обстановки на бизнес, а также другие внешние и внутренние факторы) способствует системному видению и выявлению новых возможностей роста и развития. Поэтому без преувеличения можно сказать, что аналитика данных сегодня нужна каждому руководителю любой компании.
Кто анализирует данные и сколько это стоит
Считается (и не без оснований), что аналитика данных – это дорогое удовольствие, а опытный Data Professional может стоить, как ТОП-менеджер крупной корпорации. В частности, зарплата экспертов по Big Data в 2018 году находилась на уровне 200 тысяч рублей – почти в 2 раза больше, чем средняя зарплата в IT на тот момент [2]. HR-исследования соцсети «Мой круг» за 1-ое полугодие 2018 года показывают, что месячная стоимость аналитиков различных специализаций варьируется от 50 до 300 тысяч (рис.1) [3].
Во втором полугодии 2018 года, согласно исследованию соцсети «Мой круг», зарплаты Data Professional’ов слегка изменились: работа ученого по данным (Data Scientist’а) оценивается немного дороже, а стоимость услуг аналитиков других профилей осталась примерно на прежнем уровне (рис.2) [4].
В 2019 году ситуация не слишком изменилась. Например, обзор рынка ИТ-вакансий, составленный службой исследований Яндекса по данным Яндекс.Практикума и аналитической службы HeadHunter, показывает медианную зарплату Data Scientist’а равной 115 тысячам рублей в месяц. При этом отмечается существенное увеличение спроса на этих специалистов по сравнению с прошлым годом [5]. Аналогичное исследование зарубежного ИТ-портала Stack OverFlow называет следующие данные по заработной плате аналитиков [6]:
- ученый по данным и специалист по машинному обучению зарабатывают около 61 тысячи долларов в год, что составляет более 300 тысяч рублей в месяц;
- аналитик данных и BI-специалист получают 59 тысяч долларов в год, т.е. почти 300 тысяч рублей в месяц.
Как правило, стоимость услуг специалиста напрямую коррелирует с его опытом (рис.3) [6]. При этом, с учетом повышенного спроса на Data Professional’ов в условиях ограниченного предложения, зарплаты ученого и инженера по данным остаются достаточно высокими даже недостаточно длительном опыте практической работы. Это наблюдение подтверждает исследование Яндекса: доля вакансий для кандидатов с опытом работы меньше года в области анализа данных и машинного обучения на 25% выше, чем в целом по рынку [5].
Однако, большие данные – это не всегда большие расходы. Например, стартапам и маленьким компаниям нецелесообразно нанимать дорогостоящего специалиста и самостоятельно разворачивать собственный Hadoop-кластер для хранения и обработки информации. Лучше временно привлечь внештатного консультанта и воспользоваться облачными сервисами для вычислений и прикладных задач. В частности, многие CRM-системы и Task-менеджеры (AmoCRM, 1C, Мегаплан и т.д.) содержат встроенные дэшборды – визуальные витрины с графическим отображением всех бизнес-метрик. Бесплатные Business Inteligence (BI) платформы, такие как Pentaho, Microsoft Power BI и др., позволяют интегрировать данные из нескольких источников (CRM, локальные файлы таблиц и базы данных) и оперативно просматривать их на любом устройстве (рис. 4) [7]. Разумеется, они уступают в качестве платным версиям, но для стартапа даже Tableau может быть достаточно дорогим решением.
Иногда специалистов по BI-системам называют BI-аналитик. И они выполняют задачи и по BI, и по аналитике. Несмотря на достаточно широкие возможности готовых BI-систем, их инструментария недостаточно для решения задач среднего и крупного бизнеса. В частности, аналитик данных сможет сформулировать нетривиальную гипотезу, например, о повышении спроса на строительно-монтажную продукцию в районе новостроек и проверить ее, самостоятельно составив датасет из открытых источников [8]. Также, скорей всего, понадобится глубокая интеграция BI-системы с другими компонентами корпоративной ИТ-инфраструктуры, которая не решится через простой обмен файлами или API-интерфейсы. Кроме того, всегда следует помнить о характере и объеме анализируемых данных. Например, если информация поступает непрерывно с различных датчиков производственного оборудования, следует всерьез подумать о специализированных дэшборд-решениях для Big Data, таких как InetSoft's Style Intelligence и другие аналоги.
С точки зрения человеческих ресурсов, для организации средних размеров и оборотов достаточно будет одного специалиста по данным широкого профиля, который обладает компетенциями в анализе информации и маркетинге, разбирается в предметной области и статистике, а также умеет работать со специализированными BI-системами (рис. 5).
Поскольку в крупной компании объем анализируемых данных еще больше, а ИТ-инфраструктура – насыщеннее, ей потребуются Data Professional’ы с профильным разделением [1]:
- архитектор данных (Data Architect) отвечает за проектирование новой системы сбора, хранения и обработки данных, включая особенности всех текущих и будущих источников и моделей данных, процессов их интеграции и представления, а также технических средств реализации;
- аналитик данных (Data Analyst) строит гипотезы и извлекает полезные для бизнеса сведения из «сырых» массивов информации, очищая их от некорректных значений и выбросов, а также отбирая переменные, необходимые для моделирования – машинного обучения;
- ETL-специалист работает с дэшбордами и структурированными хранилищами (Extract – Transform – Load, ETL), создавая аналитические отчеты.
- инженер данных (Data Engineer) создает и сопровождает инфраструктуру Big Data проекта, обеспечивая сбор, хранение и управление потоками данных в реальном времени;
- ML-специалист разрабатывает модели и алгоритмы машинного обучения, а также отвечает за их реализацию в программных приложениях;
- исследователь данных (Data Scientist) занимается анализом информации, а также разрабатывает модели и алгоритмы машинного обучения, которые проверяют или опровергают гипотезы аналитиков;
- директор по данным (Chief Data Officer, CDO) управляет жизненным циклом данных так, чтобы каждый корпоративный клиент (пользователь, информационная система или облачный сервис) вовремя получал нужную информацию в подходящем виде и приемлемом качестве [9]. Также CDO контролирует работу всех Data Professional’ов: архитектора, аналитика, инженера и исследователя. Подробнее про обязанности и компетенции CDO я расскажу в следующей статье.
На практике один человек может владеть несколькими компетенциями и совмещать смежные роли. С организационной точки зрения аналитики могут подчиняться как генеральному руководителю, так и топ-менеджеру направления, например, директору по маркетингу или финансам [1], т.к. пока далеко не каждая даже крупная компания выделяет отдельную должность CDO. Поэтому очень часто аналитику приходится работать на стыке BI и Data Science, что, разумеется, усиливает нагрузку на специалиста, но и дает синергетический эффект, позволяя видеть цифровую картину всего предприятия в целом.
С чего начать: первые шаги к аналитике данных
Прежде чем искать опытных аналитиков или срочно обучать собственных сотрудников, стоит максимально точно ответить на следующие вопросы:
- зачем вам аналитика данных: какую именно пользу для бизнеса вы хотите извлечь из массивов информации? Ставьте понятные, измеримые и достижимые цели, например, повысить конверсию продаж на 20% или сократить финансовые и временные затраты на логистику между производственными площадками.
- какие у вас данные и насколько их много: опишите источники и характер представления информации, которую вы собираетесь анализировать. Например, локальная ERP-система, облачная CRM, сервисы веб-аналитики (Яндекс.Метрика и Google.Analytics), 1C и «волшебный» Excel-файл главного бухгалтера.
- насколько управляем ваш бизнес: устоялись ли управленческие и операционные процессы и процедуры, четко ли соблюдается их периодичность и повторяемость, как ведется учет важных метрик и показателей. Как правило, для определения уровня зрелости корпоративного управления используется методология оценки бизнес-процессов CMMI – Capability Maturity Model Integration(рис. 6) [10].
Идентифицировав свои цели, объекты и процессы, вы сможете определиться с инструментами – системами и специалистами, которые заставят ваши данные работать, извлекая из них реальную пользу для бизнеса. Стремясь к поставленной цели, не забывайте об окружающей реальности: объеме данных и характере деятельности. К примеру, если компания еще не достигла хотя бы 3-го уровня CMMI, говорить об аналитике данных пока рановато – сначала следует привести в порядок процессы. Затем, с постепенным продвижением по ступеням CMMI, целесообразно расширять область анализируемых данных, наращивая мощь корпоративных хранилищ и компетенции аналитиков данных.
Где искать и как нанимать аналитика данных
Как правило, хороший профессионал не ищет работу – она находит его сама. Поэтому не стоит ожидать быстрого и качественного результата, просто разместив объявление на сайте вакансий. Лучше всего самостоятельно «открыть охоту» на аналитика там, где они обитают – на тематических площадках по анализу данных, Data Science, Big Data и Machine Learning. Например, очень популярны следующие онлайн-ресурсы: Data Science Central, Kdnuggets, SmartData Collective, раздел Cross Validated на Stack Overflow, а также соревновательные платформы Kaggle и Boosters. Также полезно будет посетить оффлайновые мероприятия для аналитиков: конференции, фестивали, чемпионаты, которые проводятся достаточно часто. В частности, DataFest, митапы от Яндекс, Mail.ru, Авито и других data-driven компаний. Там вы не только встретите множество потенциальных кандидатов, но и сможете сразу оценить их опыт, послушав доклады и оценив ответы на вопросы, а также пообщаться в неформальной обстановке.
Что касается необходимых компетенций аналитика, здесь сложно дать какие-то универсальные рекомендации, поскольку это зависит от ваших задач, уровня зрелости корпоративного управления и характера данных. Например, для стартапов и малых предприятий подойдет бизнес-аналитик с навыками маркетолога и опытом работы с бесплатными BI-решениями, а также веб-сервисами «Яндекс.Метрика», Google Analytics и пр. Полезным будет продвинутое владение Excel, CRM-системами, знание статистики и нескольких языков программирования, чтобы аналитик мог сам написать элементарный скрипт для обработки информации или сформировать запрос к базе данных.
Среднему бизнесу имеет смысл дополнительно к BI-аналитику нанять ETL-специалиста, который настроит инфраструктуру для корпоративных хранилищ данных и интегрирует их с удобными дэшбордами. Крупной компании, скорей всего, понадобится полный набор дорогих Data Professional’ов: от архитектора до CDO, включая различных аналитиков, инженеров Big Data, исследователей данных и ML-специалистов (рис. 7). В этом случае вашему HR- и ИТ-директорам придется хорошо потрудиться, чтобы найти свободные или переманить к себе опытные кадры из конкурирующих фирм [11].
Наконец, для бизнеса любого масштаба очень полезным будет наличие у кандидата релевантного опыта в конкретной отрасли: интернет-маркетинг, ресторанная сфера, ритейл и т.д. Практические знания и умения значат намного больше тех слов, которые написаны в дипломе у вашего потенциального сотрудника. Помните, что профильное образование – это лишь дополнительный бонус к реальным компетенциям кандидата, а не жесткий критерий отбора.
Вместо заключения
Учитывая повсеместную цифровизацию, можно сделать вывод, что аналитика данных становится неотъемлемой частью современного предприятия, независимо от его масштаба и специфики деятельности. Информация – это жизненная сила любого бизнеса, но, чтобы не потонуть в ее потоках, нужно уметь выделить главное среди множества показателей. В этом помогут специалисты по анализу данных и соответствующие программные продукты. Принимая во внимание их достаточно высокую стоимость, рассматривайте расходы на аналитику данных как инвестиции, которые, при грамотной постановке целей и задач, принесут вам гораздо большие дивиденды. Нанимайте Data Professional’ов и внедряйте программные решения постепенно, в зависимости от уровня зрелости бизнес-процессов, характера анализируемой информации и ИТ-инфраструктуры своего предприятия. Малому бизнесу достаточно недорогих облачных сервисов, а крупным компаниям нужны решения сложнее и точнее, а, значит, и более «дорогие» специалисты. Однако, эти вложения помогут бизнесу сэкономить время и деньги, решив с помощью аналитики множество стратегических и операционных задач, от маркетинга до производства.
Источники
- Специалисты по аналитике данных: когда нанимать и какие задачи делегировать
- Зарплаты в ИИ: где больше денег и кого ищут в России
- Зарплаты ИТ-специалистов на середину 2018 года
- Зарплаты в ИТ во втором полугодии 2018 года
- Обзор рынка ИТ-вакансий
- Developer Survey Results 2019
- Self-service analytics in the cloud with Tableau Online
- Фабричная аналитика. 5 шагов к внедрению Business Intelligence на производстве
- CDO без искусственного интеллекта — деньги на ветер?
- CMMI
- Карл Андерсон. Аналитическая культура. От сбора данных до бизнес-результатов. – М.: Манн, Иванов и Фербер, 2017. – 336 с.