Чем занимается дата-аналитик

Чем занимается дата-аналитик

Как работать с данными: специалисты делятся опытом.

Гипотезы, не подкрепленные данными, могут привести к ошибке, когда факты подгоняют под теории, а не наоборот. Эта идея лежит в основе анализа данных: извлечь смысл из информации, чтобы принимать обоснованные решения.

Чат-боты для отслеживания посылок, рекомендации фильмов и музыки, распознавание лиц, беспилотные автомобили, персонализированное взаимодействие банков с клиентами — все это не было бы возможным без дата-аналитики.

В отчете Всемирного экономического форума The Future of Jobs Report 2020 аналитики данных названы в числе самых популярных профессий. Ожидается, что к 2023 году индустрия больших данных будет стоить около $77 млрд. 94% предприятий говорят, что анализ данных важен для роста их бизнеса и цифровой трансформации.

Количество данных постоянно растет — и аналитиков для работы с ними нужно все больше.

Своим опытом поделились Лилия Луценко, Product Analyst в BetterMe и лектор курса «Продуктовая аналитика: как понять продукт через метрики», и Дмитрий Усманов, Head of Analytics в United Tech и автор телеграм-канала об аналитике.

Лилия: «Мой рабочий день начинается с health check продуктовых метрик и анализа текущих A/B-тестов. Ближе к обеду — встречи и обсуждения, груминги, а под конец дня — работа с задачами от команд.

В мои обязанности входит подготовка к A/B-тестам, анализ результатов внедрения новых или улучшения старых фич, подготовка рекомендаций о том, как развивать функционал».

Дмитрий: «Я працював у проєктах з мобільними додатками та в eGov-сфері. Робота дата-аналітика потрібна всюди, щоб допомогти продукту заробляти більше грошей завдяки дослідженням та A/B-тестам, а також оптимізувати витрати».

Типы анализа данных

Существует несколько подходов к определению типов дата-аналитики. Назовем основные.

Статистический анализ. Помогает найти ответ на вопрос «что произошло?», описывает и обобщает количественные данные. Например, статистический анализ может продемонстрировать распределение продаж по группе сотрудников и средний показатель продаж на одного сотрудника.

Диагностический анализ. Определяет, «почему это произошло». Допустим, в больницу обращается много пациентов. Анализ данных может показать, что у них есть общие симптомы определенного вируса. Это поможет определить, что за вирус — «почему» — спровоцировал эпидемию.

Предиктивный анализ. В отличие от предыдущих типов анализа, которые исследуют и делают выводы о прошлом, предиктивная аналитика использует данные для прогнозирования будущего. Отвечает на вопрос «что может произойти в будущем?». Например, помогает заметить, что мобильное приложение для похудения активнее скачивают весной, а зимой количество загрузок падает. Значит, миграцию с одной базы данных на другую лучше запланировать на зиму — меньше пользователей пострадает от возможных сбоев.

Предписывающий анализ. Собирает выводы, полученные из первых трех типов анализа, и использует их для формирования рекомендаций, как должна действовать компания. Отвечает на вопрос «что нам с этим делать?». Компания может строить стратегию на 5–10 лет, опираясь на результаты этого анализа.

Методы анализа данных

Кластерный анализ — группировка данных по схожести. Часто используется для поиска скрытых закономерностей в данных. Например, маркетологи группируют клиентов в кластеры на основе демографических данных или других факторов, чтобы персонализировать предложение. Сделать это для каждого клиента отдельно — невозможно.

Когортный анализ помогает изучить поведение пользователей. Может быть полезен, чтобы показать влияние кампаний на определенные группы клиентов. Например, компания формирует разные виды email для рассылки пользователям, а потом отслеживает эффективность каждого вида.

Регрессионный анализ использует исторические данные, чтобы понять, как на результат влияют переменные. К примеру, компания проанализировала продажи за 2017 год и обнаружила, что на результат повлияли качество продукции, дизайн магазина, обслуживание клиентов. Теперь можно использовать регрессию, чтобы проанализировать, какие из этих переменных изменились или появились ли новые в течение 2021 года.

Факторный анализ — метод аналитики для оптимизации определенных сегментов данных. Пример — оценка продукта покупателем: на какие факторы он обращает внимание, выбирая товар.

Анализ текста — организация больших объемов данных таким образом, чтобы ими было легче управлять. Это также очистка данных, чтобы извлечь те, которые нужны для определенной цели.

Процесс анализа данных

Этапы анализа данных включают сбор, обработку, изучение информации для поиска закономерностей. Процесс состоит из:

  • 1. Определения требований и целей. Нужно понять, почему проводится анализ, какой тип будет подходящим и что стоит анализировать.
  • 2. Сбора данных. Источники — исследования, опросы, интервью, анкетирование, наблюдение, фокус-группы.
  • 3. Обработки и очистки. На этом этапе удаляются повторяющиеся, невалидные или нерелевантные данные.
  • 4. Анализа. Аналитики могут применять различные методы, чтобы разобраться, о чем говорят данные. Например, среднее значение облегчает понимание данных: устраняет индивидуальные различия и обобщает характеристики показателя. Медиана же отражает структуру данных, сохраняя индивидуальные различия показателя.
  • 5. Интерпретации. Полученные результаты нужно истолковать и предложить план действий на основе выводов.
  • 6. Визуализации. Нужно показать информацию так, чтобы ее было легко прочитать и понять. Можно использовать диаграммы, графики, карты, презентации, инфографики. Визуализация помогает сравнивать наборы данных и наблюдать за взаимосвязями.

Например, для анализа рынка недвижимости дата-аналитик определяет цели, одна из которых — рассчитать оптимальную стоимость жилья комфорт-класса. Он будет собирать данные о местоположении домов (престижность района, инфраструктура, расстояние до метро), данные о типе дома, площади, наличии ремонта. Далее — сбор данных из открытых источников, удаление нерелевантных (например, устаревших) и анализ.

Результат анализа формируется в выводы, которые можно представить в виде инфографики.

курс по теме: Продуктовая аналитика: как понять продукт через метрики
Лилия Луценко анализирует 4 мобильных приложения в BetterMe
 

Требования к дата-аналитику

Бюро статистики труда США прогнозирует рост числа специалистов по работе с данными: к 2026 году область науки о данных вырастет примерно на 28%.

Лилия: «Дата-аналитики помогают принимать правильные решения о том, в какую сторону развивать продукт. Современному дата-аналитику нужно знать статистику, математику, уметь работать с базами данных, анализировать и визуализировать данные. Из технологий — SQL, Tableau, Power BI, Data Studio, Python».

Какие инструменты используют аналитики данных:

  • Инструменты базы данных. SQL обрабатывает большие наборы данных, а Microsoft Excel отображает данные.
  • Языки программирования. Язык для статистической обработки данных позволяет обрабатывать большие датасеты. Python и R — самые распространенные, но используются и другие языки. Все зависит от проекта.
  • Визуализация данных. Презентация результатов в оптимальной для восприятия форме помогает показать работу аналитика. Tableau, Jupyter Notebook и Power BI часто используют для этих целей.

Дмитрий: «Насамперед потрібна математична основа: лінійна алгебра, теорія ймовірності, статистика. Менше — матан, дискретка (матаналіз та дискретна математика — Ред.).

Для візуалізації зазвичай використовують BI: Tableau та PowerBI - лідери ринку, але іноді можна зустріти і Redash, Superset, Qlik і навіть Python-бібліотеки - Matplotlib, Seaborn, Plotly.

SQL дуже важливий. Щоб його вивчити, є хороші тренажери, але бажано практикуватись на реальних завданнях. Для вправ можна використовувати SQL Zoo.

Залежно від компанії вимагають знання Python, але переважно — базові вміння працювати з найпопулярнішими бібліотеками для аналізу (Pandas, Numpy, Sklearn, Seaborn, Matplotlib та іншими)».

Больше бесплатных ресурсов по изучению SQL — в подборке.

Среди софт-скилов важно умение решать проблемы. Аналитик должен понимать проблему продукта, которую необходимо решить: например, почему приложением не пользуются люди 30–35 лет. А также замечать закономерности и тенденции, критически мыслить и находить пробелы в своей работе. Важно уметь четко доносить свои идеи.

Ещё статьи
Платформи для волонтерів, пошук житла, корисні карти та ігри.