Data Science: как растет сфера и какие профессии выбирать
Главные тренды в сфере данных Разобраться в обилии информации о рынке Data Science бывает сложно. Поэтому мы проанализировали и собрали последние тренды дата-индустрии. Интеграция данных и искусственного интеллекта во все сферы Думаете, что не соприкасаетесь с данными, пока не работаете с ними напрямую? Ошибаетесь: сегодня компании во всем мире внедряют ИИ и системы по сбору, обработке и анализу данных о клиентах и сотрудниках. Это касается многих сфер: ритейла, робототехники, автомобильной индустрии, медицины. Cегодня можно предсказать, когда вы купите машину, захотите сменить профессию, просто собрав и проанализировав данные о вас в сети. В США в 2012 году произошел публичный случай, когда родители шестнадцатилетней девочки подали в суд на магазин, от которого приходили купоны на имя дочери со скидками на детские товары. Претензия состояла в том, что дочери всего 16 лет, она еще ребенок, а магазин ошибся в ЦА при настройке рекламы. Но оказалось, что девочка действительно беременна, но еще не сказала родителям. Магазин это понял с помощью искусственного интеллекта — у девочки сменились предпочтения в покупках, она начала по-другому питаться и покупать тесты на беременность. Принятие ключевых решений в бизнесе на основе данных Крупные российские компании, такие, как «Яндекс», Uber, Mail.ru, уже используют подход Data-informed в бизнес-процессах: теперь данные нужны не только для подтверждения гипотез, но и для принятия решений, управления бизнес-процессами. Постепенная интеграция данных распространяется во все отделы, включая маркетинг, продажи и дизайн, помогая более точно сформировать портрет клиента и определить факторы, влияющие на выбор продуктов или услуг. А в ближайшем будущем популярным станет другой подход — Data-driven, который подразумевает, что данные становятся единственно верным фактором для принятия решений в бизнесе. Развитие генеративно-состязательных сетей GAN — generative adversarial network — алгоритмы машинного обучения без участия человека. Они построены на комбинации двух нейронных сетей: первая предлагает образы, а вторая — пытается найти среди них подлинные. Таким образом нейросети обучаются сами. Например, deep fake: пользователям предлагают отличить изображения, сделанные нейронными сетями, от реальных картин. Технология также умеет создавать новые образы, смешивая исходные. Поэтому GAN часто используют в бизнесе для получения новых элементов: в дизайне интерьеров, одежды, компьютерных игр и мультипликации. Всего за четыре года появилось более 500 таких алгоритмов. Как дата-тренды изменили бизнес и образование Развитие искусственного интеллекта и работы с данными повлияли на бизнес-процессы компаний и рынок образования. Появился спрос на сотрудников типа T-shaped. Они не только глубоко знают свою основную специализацию, но также развиваются в смежных областях. Кроссфункциональность помогает им легко взаимодействовать и понимать специфику других отделов. Появился спрос на специалистов по Data Science с небольшим опытом в этой сфере. Согласно исследованию HeadHunter и «Яндекс.Практикум», доля вакансий с опытом работы менее года в Data Science сейчас выше, чем в целом по IT-рынку. А более 60% всех вакансий по работе с данными относятся к кандидатам с опытом до трех лет. Помимо этого, работодатели идут на уступку: если вы в течение года обучались по профессии Data Scientist, ваш учебный опыт могут зачесть за рабочий. В целом, сегодня конкуренцию техническим специалистам вполне могут составить «гуманитарии»: сотрудников в Data Science теперь ценят не за знание математики, а за умение принести пользу бизнесу, управлять алгоритмами на основе математической составляющей, для работы с которой появилось множество «умных» библиотек. Увеличился рост образования в сфере Data Science. Получить такую специальность в современных вузах пока нельзя: трансформация высших учебных заведений требует гораздо больше времени, чем запуск программы длительностью в полтора года. Поэтому нишу активно занимают проекты дополнительного и онлайн-обучения, которые стараются предлагать актуальные программы и знания, ориентированные на практику. Так, за последние пару лет свои программы по Data Science запустили Skillfactory, GeekBrains, Otus, «Яндекс.Практикум». В «Нетологии» направление Data Science существует с 2017 года, и сейчас факультет также расширяется в сторону кроссфункциональности, поэтому его переименовали в «Аналитика и Data Science». На каких специалистов есть спрос уже сейчас По данным исследования компании McKinsey, в США постоянно существует большой дефицит сотрудников из сферы Data Science. В 2018 году не хватало более 1,7 млн менеджеров. В России спрос на представителей этой профессии также растет. Востребованы они не только в IT и Digital, но и в других отраслях — от ритейла до производства. Кроме отделов по Data Science или Machine Learning таких специалистов ищут и продуктовые команды, и маркетинг, и контент, и даже разработчики игр. Чтобы вам было проще понять, в каких областях нужно разбираться, и претендовать на позиции в Data Science, мы разместили основные функции, роли и инструменты для сотрудников по работе с данными на графике. Изображение предоставлено автором Знание основных инструментов становится большим преимуществом для маркетолога и позволяет самостоятельно решать различные задачи. Python, будучи простым и доступным языком, остается мощным инструментом для визуализации, сегментирования и обработки данных. В отличие от агентств, в больших компаниях знание Python и Power BI — необязательное условие, поскольку есть специальные подразделения по работе с данными. Но для малого и среднего бизнеса знание подобных инструментов позволяет самостоятельно решать простые задачи. Для визуализации и дашбордов я пользуюсь Tableau, а для сбора инсайтов об аудитории — YouScan. Екатерина Середа, специалист по цифровым коммуникациям агентства CROS.MARKETING Российский рынок Вот несколько профессий, которые подразумевают работу с данными, кроссфункциональность, и востребованы в России уже сейчас. Data-маркетолог (маркетинговый аналитик) Этот сотрудник — ключевое звено для роста и развития бизнеса. Он знает, какие цифры взять для анализа, откуда их выгрузить, как интерпретировать и какие изменения в коммуникацию внести. Он может спрогнозировать спрос и оценить возможности для продвижения продуктов. В отличие от маркетолога в традиционном виде, этот специалист понимает принципы сквозной аналитики, знает языки R или Python, умеет визуализировать данные в Power BI или Tableau, а также применяет подход data-driven в работе. На сегодняшний день в России открыто около тысячи позиций data-маркетолога, из них — 500 в Москве с уровнем зарплат от 80 до 130 тысяч рублей. Таких специалистов ищут как крупные холдинги, так и стремительно развивающиеся средние и малые компании. Например, Mail.ru, «Яндекс.Маркет», Lamoda, Nestle, Profi.ru, «Едадил». Продуктовый аналитик Продуктовый аналитик понимает принципы работы искусственного интеллекта и машинного обучения, способен собирать и анализировать данные из разрозненных источников и создавать прототипы алгоритмов. Часто продуктовые аналитики вырастают в product-менеджеров: данные помогают им находить идеи, потенциал для роста компании. Менеджерам продукта с опытом в аналитике проще разрабатывать стратегию, достигать KPI по аудитории или деньгам. Сегодня в России открыто около семи тысяч подобных вакансий. Аналитики со знанием Python/R получают 90-250 тысяч рублей в месяц. Ищут таких сотрудников очень разные «продуктовые» компании и сервисы, нацеленные на стремительный рост: Aviasales, «Райффайзенбанк», Qiwi, Avito, Okko, ivi.ru, Skyeng, «Альфа-банк», «ВКонтакте», DocDoc. Gamedev-аналитик Аналитик в игровой индустрии помогает улучшить пользовательский опыт, удержать клиента, прогнозировать рост продукта на основе данных. Для работы ему нужно знание языка Python, SQL, визуализации в Tableau и понимание систем хранения данных типа Clickhouse. Подобных вакансий в России чуть меньше полутора тысяч, с заработком от 100 тысяч рублей. А ищут Gamedev-аналитиков — Blizzard, Wargaming, Playrix, G5 Entertainment, FunCorp, ZavodGames, Zeptolab, Game Insight. Дата-журналист Профессия журналиста кажется одной из самых традиционных и понятных. Но сегодня и этот специалист должен работать с цифрами: извлекать из данных важные для бизнеса и общества инсайты, объяснять их читателям в доступном виде. Современные журналисты нередко прибегают к помощи Excel, Python, Tableau, строят гипотезы и проверяют их на практике в своих расследованиях. А для многих СМИ наличие навыков работы с данными — ключевое преимущество кандидата. Подобных вакансий на рынке не так много, но спрос будет расти. Учитывая, что профессия обычного журналиста недавно вошла в список исчезающих в России, за дата-журналистикой будущее. Например, крупные медиа РБК и ТАСС уже ищут дата-журналистов и предлагают зарплату от 100 тысяч рублей. Отзыв специалиста Андрей Дорожный, дата-журналист: «Я занимаюсь дата-журналистикой около трех лет. До этого был дизайнером и рисовал графики, но в какой-то момент понял, что нужно больше внимания уделять поиску данных — чтобы сделать правильный график, нужно сначала найти правильные данные». Он рассказывает: «Долгое время в редакции я сам выбирал тему материала, собирал для нее данные, рисовал инфографику, а уже затем готовил текст. И когда я начал углубляться в эту сферу, понятия «дата-журналистика» еще не существовало, я и сам себя так не называл. Само определение профессии формируется только сегодня, хотя по России я до сих пор могу выделить не более 10-15 журналистов, которые анализируют данные и готовят материалы на их основе». По словам Андрея, «инструменты дата-журналистики могут применяться и в других направлениях, например, в маркетинге, аналитике или проведении отраслевых исследований. Но не стоит полагаться в материалах data-driven только на данные, потому что читателю не важно, как появился инсайт, рассказал ли его кто-то или вы взяли его из данных». Он добавляет: «В опубликованной статье имеет значение, какую проблему мы подняли с помощью данных и графиков, и как эта проблема соотносится с конкретным читателем. Иногда бывает такое, что данные нам указывают только само направление, в котором нужно проводить исследование, а статья получается в конечном итоге без данных и совершенно по другой теме. Но весь процесс поиска, анализа и интерпретации очень интересный». Что в итоге Все перечисленные профессии — реальность уже сегодня. Во многих компаниях развивается направления аналитики в продукте, маркетинге и дизайне, просто мало кто их правильно называет. А Иван Голунов — типичный пример data-журналиста, который проводит правильные исследования, подкрепленные данными. Судя по текущим трендам, уже в перспективе 10-20 лет навык работы с данными будет необходим даже для специальностей, которые не связаны с технологиями. Например, могут появиться художники и писатели в сфере искусственного интеллекта, авторы образовательных программ на основе данных, а также утилизаторы цифрового мусора в сфере Big Data. К этим процессам необходимо адаптироваться. Если вы сейчас научитесь работать с данными и востребованными инструментами, а также сохраните исследовательский интерес и не побоитесь назваться «новым профессиональным именем» — вы сможете «продать» себя без труда в любую компанию, в ДНК которой есть подход data-driven и желание стать «единорогом». Фото в тексте и на обложке: Unsplash