Чернобровов АлексейАналитик

Как не разориться на Data Science

Сегодня аналитика данных нужна практически каждой частной компании и бюджетной организации. Но опытный Data Scientist стоит достаточно дорого на рынке труда и далеко не каждое предприятие может позволить себе иметь в постоянном штате такого специалиста. В этом случае разумным решением кажется привлечь стороннего консультанта к организации процессов сбора, обработки и интерпретации корпоративных данных, чтобы извлечь из этого ценные для бизнеса сведения. Однако, не все так просто – в реальности около 85% проектов по большим данным (Big Data) терпят неудачу [1]. Сложно назвать точную долю провалов по аналитике данных, но общая цифра впечатляет. В этой статья я расскажу, как избежать такой участи и сделать свой проект по аналитике данных успешным с привлечением стороннего консультанта – практические советы бизнесу «с той стороны баррикад».

 

Предпосылки успеха проекта по аналитике данных: определяем исходное состояние

PMBOK, наиболее популярный свод знаний по управлению проектами, не случайно выделяет инициацию и планирование в отдельные группы управленческих процессов. Именно на этих стадиях разрабатываются и утверждаются основополагающие концепции и Устав проекта, а также определяется его содержание (Project Scope) [2]. При этом следует подробно идентифицировать всех заинтересованных участников (стейкхолдеров), описав характер и степень их вовлеченности в проект. У заказчика (инвестора) или потенциального пользователя должно быть четкое понимание результатов, которые принесет им проект по аналитике данных, а также каких усилий (не считая вознаграждения привлеченного консультанта) это будет им стоить. В отсутствие этого проект заранее обречен на неудачу.

Поскольку бюджет стартапов и малого бизнеса на R&D-деятельность, к чему относятся консалтинговые услуги по аналитике данных, достаточно ограничен, следует еще до привлечения стороннего Data Scientist’а понять, где и в каком виде находятся ваши информационные массивы. От характера хранения и представления данных напрямую зависит стоимость работ аналитика. Например, если на предприятии имеются базы данных, облачные CRM-системы и другие хранилища корпоративной информации, аналитику не придется тратить свое время (и ваши деньги) на организацию процессов сбора информационных массивов.

Также следует самостоятельно определить уровень зрелости своих бизнес-процессов по модели CMMI [3]. Начинать проект по аналитике данных и платить дорогому специалисту не имеет смысла, если вы не достигли хотя бы 3-го уровня CMMI – хаос не поддается анализу (рис. 1).

 

Рис. 1. Уровни зрелости процессов по модели CMMI
Рис. 1. Уровни зрелости процессов по модели CMMI

 

Чего и от кого ждать: закрепляем ответственность

Поняв свое исходное состояние, определите желаемое – чего именно вы ждете от аналитика данных. Именно заказчик должен сам четко идентифицировать цели и результаты проекта по аналитике данных. К примеру, Data Analyst обязуется развернуть для вас облачную BI-систему Tableau [4] и настроить непрерывный мониторинг 10 важнейших показателей бизнеса (общая прибыль и выручка, конверсия, детализированные расходы и доходы по различным статьям, эффективность рекламных каналов и пр.).

Важно понимать, что Data Scientist – не единственный участник проекта по аналитике данных. Вы, как заказчик и будущий пользователь создаваемого им продукта (BI-системы, статистических моделей и основанных на них рекомендаций по изменению производственных процессов), напрямую вовлечены в проектную деятельность. При этом не следует оказывать чрезмерное давление на консультанта, проверяя любое его действие или самостоятельно разбираться с каждой математической формулой и SQL-запросом. Однако, если игнорировать вопросы аналитика или не интересоваться промежуточными результатами проекта, на выходе можно получить совсем не то, что ожидалось изначально. Также можно существенно превысить бюджет проекта, выйдя за временные рамки или предоставив консультанту полнейшую свободу по выбору инструментария. Если Data Scientist, увлекшись задачей, выберет слишком дорогой пакет статистического моделирования или «чрезмерно навороченную» ETL-систему, платить за это придется вам. А широта функциональных возможностей аналитического средства не является гарантией успешного выполнения проекта по аналитике данных. Поэтому очень важно заранее определить процедуры взаимодействия с внешним консультантом, точно прописав характер и периодичность коммуникаций. Например, краткий отчет по электронной почте раз в неделю и личная встреча 2 раза в месяц с заказчиком. Также следует закрепить ответственность за выполнение проекта на стороне заказчика, создав временную команду из собственных сотрудников, вместе с которыми будет работать консультант. Например, в такую команду могут входить менеджер продукта, маркетолог, администратор баз данных и другие специалисты, занимающиеся обработкой и использованием анализируемой информации. В организации работы такого проектного офиса помогут популярные сегодня гибкие методологии управления проектами (Agile) и поддерживающие их методы (Scrum, Kanban, Lean и пр.) [5], реализованные в большинстве современных ИТ-средств удаленного взаимодействия (Trello и другие подобные такс-менеджеры).

Наконец, заключая договор с внешним консультантом по аналитике данных, не забудьте подписать NDA (Non-disclosure agreement) – cоглашения о конфиденциальности и неразглашении информации.

 

 

Как выбрать консультанта

В этой статье я уже немного рассказывал про онлайн- и офлайн-площадки для поиска аналитиков данных. Многие начинающие и опытные специалисты общаются друг с другом в тематических форумах по анализу данных, Data Science, Big Data и Machine Learning, например, Data Science CentralKdnuggetsSmartData Collective, раздел Cross Validated на Stack Overflow. Также в поисках Data Professional’а можно заглянуть на соревновательные платформы Kaggle и Boosters или оффлайновые конференции, фестивали, чемпионаты и прочие подобные мероприятия (DataFest, митапы от Яндекс, Mail.ru, Авито и других data-driven компаний).

Наличие профильного образования у кандидата – не гарантия отличного результата. Гораздо большую роль играет опыт практической работы в нужной вам сфере, например, маркетинг, телекоммуникации, HoReCa и т.д. Тем не менее, подтвержденная дипломом или сертификатами квалификация в области математики, информатики, системного анализа, Data Science, Data Mining или Business Intelligence будет весьма значимым фактором при выборе консультанта по аналитике данных. Рекомендации коллег, конкурентов и отзывы заказчиков с прошлых проектов – еще один важный критерий поиска подходящего Data Scientist’а.

При оценке кандидата особое внимание уделите навыкам его работы в условиях, подобным вашим, например, сталкивался ли он с аналогичными объемами и системами хранения данных, а также насколько успешно (быстро и результативно) решал похожие задачи.  Наконец, помимо технических компетенций (hard skills), не забывайте про общечеловеческие качества надежного сотрудника: работоспособность, адаптивность, стрессоустойчивость, коммуникабельность, внимательность к деталям и другие подобные soft skills. Для эффективной работы даже временный внештатный консультант должен соответствовать вашим корпоративным ценностям и отраслевым требованиям.

 

 

Резюме

Подводя итог вышеописанному, выделим следующие ключевые факторы успеха проекта по аналитике данных с привлечением внешнего консультанта:

  • наличие у заказчика адекватного понимания исходного состояния своих бизнес-процессов, корпоративных данных и результатов работы аналитика с ними;
  • точное определение целей и результатов проекта в четких формулировках и измеримых показателях;
  • детальное описание всех нюансов проекта перед его выполнением в Уставе проекта и других документах (Project Scope, календарные планы, бюджет, процедуры взаимодействия участников, перечень стейкхолдеров и т.д.);
  • высокая степень вовлеченности заказчика в процесс выполнения проекта с постоянной коммуникацией онлайн и офлайн;
  • подробное закрепление ответственности за консультантом и штатными сотрудниками заказчика по каждому показателю проекта;
  • фиксация всех изначальных договорённостей и возникающих в процессе работы промежуточных итогов в документальном виде;
  • наличие у консультанта релевантного опыта работы с подобными задачами, информационными системами и объемами данных.

При отсутствии вышеуказанных факторов проект по аналитике данных, скорей всего, будет потерпит неудачу и пополнит копилку негативного опыта человечества в практике Big Data (рис.2).

 

Рис. 2. Топ-5 причин провала Big Data проектов [1]

Рис. 2. Топ-5 причин провала Big Data проектов [1]

 

Источники

  1. WHY 85% OF BIG DATA PROJECTS FAIL
  2. Процессы управления проектами
  3. CMMI – модель уровней зрелости управленческих процессов
  4. BI-платформа Tableau. Официальный сайт 
  5. Топ-7 методов управления проектами: Agile, Scrum, Kanban, PRINCE2 и другие

Контакты