Чернобровов АлексейАналитик

Станьте data-driven: кто такой дата-стратег и чем Data Strategist занимается

Примерно с 2010 года в области Data Science возникла новая профессия: стратег по данным или Data Strategist. В этой статье рассмотрено, чем занимается этот специалист, какую пользу он приносит бизнесу, что должен знать и уметь, а также чем отличается от CDO, Data Scientist’a, архитектора, инженера и аналитика данных.

Кто такой дата-стратег и зачем он нужен

Сегодня каждый бизнес осознает ценность данных, стремясь стать data-driven компанией. Предприятия вводят должности директора по данным (Chief Data Officer, CDO), нанимают Data Scientist’ов и ищут аналитиков данных. Однако все эти специалисты не покрывают брешь между узкопрофильными задачами конвейера обработки данных (data pipeline), которая становится все больше при увеличении степени цифровизации бизнеса. При общем понимании информации как корпоративного актива, локальный смысл этого термина зависит от контекста его использования. Данные для Data Analyst’a – это совокупность метрик и показателей из различных бизнес-приложений, для Data Engineer’а – объект хранения и трансфера между разными информационными системами, а для Data Scientist’a – датасет для ML-моделей. Аналогично, архитектор данных и Data Steward рассматривают информацию каждый со своей технической точки зрения, проектируя хранилища и озера данных или обеспечивая качество и чистоту датасетов.

Таким образом, ни один из этих Data-специалистов не обладает общим видением ситуации, фокусируясь лишь на своем участке data pipeline. При том, что генеральная задача управления данными находится под ответственностью CDO, директор по данным – это, прежде всего, топ-менеджер, который решает управленческие вопросы, не слишком вдаваясь в технические детали. Поэтому организация корпоративного конвейера данных требует непрерывного сопровождения информации на каждом этапе работы с ней, от сбора до представления в дэшбордах BI-систем (рис. 1). Именно этим и занимается стратег по данным, обладая знанием предметной области в каждой точке data pipeline, а также организационными возможностями для их плавного соединения. Можно сказать, что Data Strategist превращает бизнес-требования к данным в готовый продукт (инсайт), совмещая роли системного аналитика, менеджера проектов и технолога в процессах сбора и обработки информации [1].

Конвейер данных и задачи обработки информации на каждом из его этапов
Рис. 1. Конвейер данных и задачи обработки информации на каждом из его этапов

 

Data Strategist vs Data Scientist и другие специалисты по данным: сходства и отличия

Итак, дата стратег не конкурирует с аналитиком, исследователем, инженером, стюардом или директором по данным, а дополняет работу каждого из этих специалистов. Data Strategist реализует эффективное проектирование и непрерывное сопровождение конвейера данных, обеспечивая непрерывное движение информационных потоков с учетом бизнес-потребностей и технических деталей.

Прежде всего, наличие стратегии данных трансформирует типичный data pipeline. Дата стратег начинает проектировать конвейер с вопроса о том, какие данные и инсайты важны для краткосрочного, среднесрочного и долгосрочного роста бизнеса. При том, что с каждым днем стоимость хранения и обработки данных становится дешевле, цена информации возрастает по мере цифровизации бизнеса, т.е. когда все больше процессов становятся data-driven. Поэтому стратегия данных должна коррелировать с бизнес-стратегией, с учетом приоритетов потенциальных возможностей и рисков. Таким образом, стратег по данным думает как бизнес-оператор [1].

Также Data Strategist выполняет роль аналитика, который понимает, кому и какие вопросы следует задавать, чтобы выявить показатели оценки бизнес-потребностей и степень их удовлетворенности. Он знает, как данные становятся метриками, а затем превращаются в инсайты. Дата стратег хорошо ориентируется в процессах сбора и трансформации данных, их подготовки к ML-моделированию и интерпретации результатов. Он в курсе всех узких мест этого конвейера, имеет профессиональное представление о каждой платформе хранения и обработки информации, знает особенности датасетов и инструментов работы с ними. Однако, Data Strategist, в отличие от инженера данных, не занимается непосредственной настройкой программного обеспечения для ETL/ELT-процессов, не проектирует хранилища и озера данных, как архитектор Big Data, и не разрабатывает новые ML-алгоритмы, как Data Scientist.

Кроме того, стратег по данным ориентируется в регуляторных аспектах работы с информацией. Например, совместно с юристами он разрабатывает корпоративную политику обработки персональных данных в соответствии с требованиями GDPR и локальных законов отдельных стран. Подробнее про персональные данные и методы их защиты читайте здесь.

Таким образом, дата стратег, как и CDO, выполняет организационную роль, координируя передачу данных от одной узкопрофильной области к другой. Однако, как было уже отмечено выше, директор по данным решает эти вопросы на более высоком уровне абстракции, тогда как стратег погружается до уровня технических деталей. В частности, Data Strategist может отличить типичный кейс обработки данных от уникального, чтобы сократить накладные расходы на разработку нового программного решения за счет унификации отдельных этапов конвейера. При этом дата стратег учитывает потенциальную пользу такого решения для бизнеса, сложность его технической реализации и возможные риски [2]. Тем не менее, в отличие от CDO, стратег по данным не занимается вопросами проектирования архитектуры предприятия, хотя может консультировать его в части информационного сопровождения бизнес-процессов. Data Strategist, как и прочие специалисты по данным (инженер, аналитик, архитектор, исследователь) функционально подчиняется CDO, выполняя роль линейного сотрудника, а не менеджера.

На операционном уровне стратег по данным ближе всего находится к DataOps-инженеру, работая с набором практик непрерывной интеграции данных между процессами, командами и системами для повышения эффективности корпоративного управления или отраслевого взаимодействия (рис. 2). Это достигается с помощью Big Data технологий распределенного сбора и обработки информации, централизованной аналитики и гибкой политики доступа к данным с учетом их конфиденциальности, ограничений на использование и соблюдения целостности. Однако, деятельность DataOps-инженера – это операционный процесс автоматизации и мониторинга управления данными в течение всего их жизненного цикла [3]. Работа стратега по данным предполагает стратегическое видение процессов Data Governance с учетом текущих условий и будущих перспектив бизнеса, а потому больше привязана к проектным циклам, чем у DataOps.

С чем работает Data Strategist
Рис. 2. С чем работает Data Strategist

 

Основные обязанности и функции Data Strategist’а

Как уже было отмечено ранее, основная цель профессиональной деятельности дата стратега – трансформация данных в бизнес-инсайты через непрерывное сопровождение информационных потоков и эффективное управление датасетами с помощью технологий Big Data и методов Data Science. Ключевой задачей здесь является проектирование data pipeline’ов с учетом среднесрочных и долгосрочных перспектив развития бизнеса, управляемого данными. Таким образом, Data Strategist выполняет следующие обязанности:

  • экспертная оценка и аналитика тенденций в доменной области и сферах Big Data, Data Science, бизнес-анализ, машинное обучение и искусственный интеллект;
  • определение требований к данным и процессам их обработки на основе бизнес-потребностей;
  • выявление корреляций рыночных и государственных регуляторов и трендов с корпоративными проблемами, возможностями, ограничениями и потенциальными рисками;
  • выявление потребностей по хранению, обработке и представлению данных через интервью, мозговые штурмы и семинары с бизнес-экспертами, пользователями и руководителями;
  • разработка стратегических дорожных карт, планов проектов и подробных планов действий по организации процессов работы с данными;
  • сопровождение проектов по внедрению новых технологий и инструментов сбора, обработки и использования данных;
  • проектирование и реализация конвейеров обработки данных;
  • анализ, оптимизация и реинжиниринг процессов работы с данными;
  • организация командной работы с другими Data-специалистами – инженерами, учеными, аналитиками, разработчиками, администраторами и пользователями.

 

Профессиональные знания и навыки дата-стратега

На первый взгляд, компетенции дата стратега пересекаются с знаниями, умениями и навыками архитектора, инженера, аналитика и ученого по данным. Всем этим специалистам необходим технический бэкграунд, системный склад ума и аналитические способности. Однако, Data Strategist обладает более широким набором знаний, чем его вышеотмеченные коллеги. Если провести аналогию с врачебной деятельностью, то стратег по данным выполняет роль врача общей практики, тогда как аналитик, инженер и исследователь – это узкие специалисты. Поэтому знание доменной области и понимание процессов работы с данными с точки зрения бизнеса для дата стратега гораздо важнее, чем, например, умение написать эффективный ML-алгоритм или HiveQL-запрос в озеро данных на Hadoop. Тем не менее, можно выделить необходимый минимум того, что должен знать и уметь Data Strategist (рис. 3):

  • стек технологий Big Data, от Apache Hadoop до Kafka Streams – хотя бы на уровне знакомства с назначением и основными функциональными возможностями того или иного фреймворка;
  • методы Data Science и Data Mining, от статистического анализа до нейронных сетей и прочих алгоритмов машинного обучения, чтобы понимать характер используемых данных и спланировать процессы их подготовки и использования;
  • архитектурные модели корпоративных хранилищ, озер и баз данных, чтобы эффективно проектировать конвейеры загрузки и выгрузки информации – Лямбда, Каппа, SQL, NoSQL и NewSQL;
  • методы интеграции данных и информационных систем – консолидация, федерализация, распространение, SOA (Service Oriented Architecture);
  • инженерия программного обеспечения, особенно методы системного анализа и управления проектами, в т.ч. Agile-подходы;
  • техники определения и выявления бизнес-потребностей, от интервью до мозгового штурма, а также методы оценки потенциальной пользы и рисков будущего решения.

Наконец, для дата стратега особенно важны так называемые soft skills – навыки командной работы, стратегического видения и эффективных коммуникаций. Data Strategist работает, в первую очередь, с людьми, и лишь потом – с данными, выступая в роли универсального транслятора между бизнесом и техническими специалистами в каждой точке data pipeline’а [4].

Области знаний Data Strategist'а
Рис. 3. Области знаний Data Strategist'а

 

Вместо заключения

Цифровизация современного мира приводит к появлению новых профессий на стыке технологий и бизнеса. Дата стратег – одна из таких уникальных специализаций. И, хотя мир уже осознал потребность в Data Strategist’ах, спрос на них пока меньше, чем на аналитиков и исследователей данных. На момент написания этой статьи, в апреле 2020 года, отечественные сайты с вакансиями не выдали ни одного релевантного результата по запросам «дата стратег», «стратег по данным», «Data Strategist». Тем не менее, зарубежные площадки выдают множество объявлений о вакансиях на эту должность с годовой зарплатой от 50 до 160 тысяч долларов, что составляет от 330 тысяч до миллиона российских рублей по текущему курсу. При этом спрос формируют компании крупного бизнеса с развитой ИТ-инфраструктурой, большим объемом данных, высоким уровнем управленческой зрелости и степенью цифровизации. Поскольку западные тенденции приходят в Россию с некоторым опозданием, можно спрогнозировать интерес отечественных HR-менеджеров к стратегам по данным в перспективе ближайших 5 лет.

Впрочем, некоторые предприятия предпочитают «вырастить» собственного специалиста, а не нанимать его извне ввиду важности знания доменных особенностей [5]. Таким образом, должность дата стратега может стать новой ступенью профессиональной карьеры Data Scientist’a или аналитика данных, которые хотят работать с информацией на новом уровне [6].

Тем не менее, сегодня большинство отечественных компаний только вступили на путь своего цифрового развития. Поэтому говорить о том, что Data Strategist уже остро необходим каждому бизнесу, пока преждевременно. Потребность в таком специалисте возникает у предприятий на 4-5 уровнях управленческой зрелости по модели CMMI, когда все бизнес-процессы и процедуры работы с данными отлажены и автоматизированы. Если компания лишь начинает систематизировать свою деятельность и пробует монетизировать производственные данные, с их описанием и разработкой процессов Data Governance справится штатный аналитик или даже внешний консультант.

 

Источники

  1. https://medium.com/@eventbrite/the-elevator-pitch-from-a-data-strategist-21bc36e995fa
  2. https://towardsdatascience.com/the-rise-of-the-data-strategist-2402abd62866
  3. https://www.bigdataschool.ru/bigdata/dataops-vs-devops-v-big-data.html
  4. https://www.forbes.com/sites/bernardmarr/2018/03/12/forget-data-scientists-and-hire-a-data-translator-instead/
  5. https://www.mckinsey.com/business-functions/mckinsey-analytics/our-insights/analytics-translator
  6. https://idalab.de/blog/big-data/roles-data-science

Контакты