Анализ временных рядов - одна из самых популярных прикладных областей машинного обучения. Такие задачи встречается практически во всех областях от трейдинга до прогноза спроса.
Много разговоров ведётся вокруг будущего ИИ, каждый раз открывая новые факты в обучении и отслеживая его поведение - меняются и взгляды. Но короткий и правильный ответ: Конечно, нет!
Самые интересные конференции в 2022 году по Data Science, Big Data и Artificial Intelligence: от прикладных конференций по машинному обучения до научных по нейронных сетям и рекомендательным системам. Подборка конференция с датами и ссылками на сайты.
Самим уследить за всеми новинками в мире Data Science очень сложно. Чтобы держать вас в курсе самого интересного за 2021 год, я собрал краткие обзоры с наиболее важных конференций, которые выиграли значимые награды и/или показали особенно впечатляющие результаты: перспективные библиотеки, полезные датасеты и подробные репозитории.
Ключевые принципы работы современных рекомендательных систем и датасеты для обучения ML-алгоритмов. Что такое рекомендательные системы, как они устроены и где взять данные для обучения ML-моделей особенностям пользовательских предпочтений
ТОП-5 советов junior’у «Как найти работу в Data Science» из личного опыта и практики коллег
Про AutoML-фреймворки вообще и FEDOT в частности - open-source инструмент от Национального центра когнитивных исследований Университета ИТМО: история развития, преимущества и примеры использования
Большие данные в малом бизнесе: кому и зачем это нужно, как собрать Big Data и из каких шагов состоит планирование проекта внедрения BI-системы
Шаблонные решения, выбросы CO2, общество потребления, отсутствие приватности и еще 2 темных стороны искусственного интеллекта: можно ли предупредить опасности, связанные с внедрением AI-решений в нашу жизнь, и как это сделать
От предвзятости до необъяснимости: 6 темных сторон ИИ - что такое искусственный интеллект, как это работает, стоит ли людям бояться своего же изобретения и почему такие опасения не беспочвенны
О том, как датские ученые провели АБ-тест на ношение масок, чем возможно ввели в заблуждение большое колличество людей.
Почему нейросети выдают неверные результаты, можно ли взломать ML-модель, что такое состязательные атаки (Adversarial attack), где они используются и чем отличаются от GAN-методов, а также при чем здесь камуфляжный макияж и системы распознавания лиц
Что такое видеоаналитика, как машинное обучение ищет преступников по записям с камер наружного наблюдения, чем полезны и опасны алгоритмы распознавания лиц, как работает эта система в Москве и при чем тут социальный рейтинг гражданина в Китае
Про Tinder, Badoo и прочие приложения онлайн-знакомств: как ML-алгоритмы подбирают вам пару – основные принципы работы дейтинговых сервисов с точки зрения Data Science с примерами взлома мэтчинговых правил
Как интерпретировать результаты машинного обучения, каким образом библиотека SHAP поможет Data Scientist’у объяснить решения ML-модели и при чем здесь теория игр
Что такое визуализация и разведочный анализ данных, зачем это нужно в Data Science, какие графики подходят для отображения Big Data и какие инструменты позволяют визуализировать большие данные
Что такое мапирование данных, зачем это нужно в Data Science, когда и как часто нужно делать mapping Big Data, какие инструменты позволяют маппировать большие данные
Кто такой дата стратег, что он делает и зачем нужен бизнесу, чем Data Strategist отличается от Data Scientist’a и аналитика данных, какими знаниями обладает этот ИТ-специалист и сколько ему за это платят
Что такое озеро данных, чем оно отличается от корпоративного хранилища данных, как построить Data Lake и при чем тут Data Science: краткий ликбез для начинающих дата-инженеров
В этой статье я расскажу о некоторых практических успехах DS вообще и ML в частности по мотивам новогоднего митапа Data Толк#4, состоявшегося в декабре прошлого года. Обзор продуктивной декады 2010-2019, от Big Data до Deep Learning и будущие перспективы Data Science.
Что такое биометрические персональные данные, зачем банки собирают фотографии и образцы голоса своих клиентов, можно ли обмануть биометрический сканер и как злоумышленники устраивают тотальный Deep Fake с помощью нейросетей.
Кто, где и зачем проводит практические конференции, митапы, тренинги, мастер-классы, хакатоны и прочие тематические мероприятия для специалистов и любителей DataScience. Чем полезны эти неформальные тусовки, что такое DS-завтраки и как на них попасть.
Cамые крупные утечки персональных данных в России за последнюю пару лет, какие законы защищают конфиденциальную информацию и чем грозит их нарушение, почему такие инциденты происходят и что можно сделать для защиты сведений о своей частной жизни.
Что такое нейросети, как они работают и почему стали так популярны сегодня – разбираемся с самым известным методом Machine Learning: история возникновения и тенденции развития в обозримом будущем.
Что такое ETL, OLAP, OLTP, витрины и хранилища данных, зачем оно нужно и как все это связано с аналитикой и технологиями Big Data. Читайте в новой статье, какие факторы являются критичными при выборе ETL-системы и почему даже дорогие промышленные решения не избавят Data Analyst’а от всех проблем сбора и анализа бизнес-информации.
Что такое NLP и при чем здесь Data Science, как ML помогает анализировать тексты и предсказывать будущее, почему глубокое обучение стало так популярно сегодня. Читайте в новой статье, как устроены искусственные нейронные сети типа BERT и когда они смогут опередить человека в задачах обработки естественного языка.
3 способа заработка на данных, актуальных для любого бизнеса. Какую информацию о своих пользователях можно выгодно продать бирже данных и как это сделать легальным образом, не нарушая требования Роскомнадзора и GDPR. Кто и зачем продает/покупает данные о пользователях – краткий обзор рынка поставщиков данных в России и за рубежом.
Что такое выгода одного градуса, как оптимизировать маркетинговый бюджет и повысить эффективность инвестиций в рекламу на основании анализа данных о погодных условиях – Data Science и метеочувствительный маркетинг на примере практических кейсов отечественных и зарубежных компаний.
Почему 85% Big Data проектов обречены на неудачу и как запустить успешный проект по аналитике данных с привлечением внештатного консультанта – практические рекомендации бизнесу.
Почему Data Science – это больше, чем просто анализ информации, чем Data Scientist отличается от Data Analyst’а, в каких случаях и для чего бизнесу необходимы оба этих профессионала
Вложения в ML - это затраты или инвестиции? Оцениваем эффективность использования машинного обучения на примере прогнозирования оттока клиентов (Churn Rate).
Что такое Customer Journey Map (CJM), зачем нужна карта взаимодействия с потребителем, как ее построить и где использовать – подходы и cпособы разработки CJM: аналитический обзор, достоинства и недостатки, примеры внедрения.
Как построить CJM на основе автоматизированного анализа поведения пользователей сайта с помощью задачи текстовой кластеризации
Как определить категорию потенциального клиента по его поведению на сайте с помощью машинного обучения и экспертных знаний
Когда, кому и зачем требуется директор по данным, где искать и как нанимать такого ТОП-менеджера, а также сколько ему платить
Когда возникает необходимость в аналитике корпоративных данных, какого специалиста нужно нанимать для этой работы, где его найти и сколько это стоит
Что такое прокси-метрики,как они помогают в оценке эффективности рекламных кампаний и при чем тут машинное обучение
Как проанализировать поведение потребителя, понять его потребности и ожидания, чтобы выстроить с клиентом более эффективное взаимодействие - построение CJM на примере разработки маркетинговой стратегии для Pult.ru – крупнейшего отечественного ресейлера HI-FI/HI-END техники.
3 легальных способа сбора чужих больших данных для собственных бизнес-задач: готовые датасеты, веб-платформы со статистикой и информация со сторонних сайтов
Немного о соревновании Tinkoff Data Science Challenge. Ошибки в данных, подходы к решению, тюнинг моделей.
Применение машинного обучения для эффективного динамического ценообразования
Подробный отзыв о майской Data Science тусовке в Москве
Аналитика — это процесс превращения любых данных в полезную информацию. С помощью полученной информации можно точнее влиять на ключевые показатели бизнеса. А решения, принятые на основе аналитики, как правило с большей вероятностью ведут к успеху. В этой статье мы расскажем о том, как работать с командой аналитиков максимально эффективно, какую роль играют аналитики данных в развитии компании, а также каких специалистов вам стоит нанимать и на каких этапах развития бизнеса.