23 ресурса для data-аналитиков
Эксперты советуют Telegram- и YouTube-каналы, блоги и книги.
Какие книги читать и на какие каналы подписаться, если вы аналитик? Рассказывают специалисты по работе с данными из Airbus, Jooble, MacPaw, DataArt и Klarna.
Сергей Бобровский, Data Scientist в Airbus и лектор курса «Математика и статистика для анализа данных»
YouTube
Замечательный YouTube-канал, который помогает понять основы математики с помощью визуализации.
От редакции: Среди тем, которые можно найти на канале, — моделирование эпидемий, советы, как лучше решать проблемы, или же что такое парадокс производной.
Книги
- All of Statistics, Ларри Вассерман
Компактная книга по статистике для тех, у кого уже есть представление о теме.
От редакции: Книга подойдет для тех, кто хочет быстро изучить вероятность и статистику.
Книга и одноименный курс для университетского уровня. Охватывают основы машинного обучения, которые часто не затрагиваются на других курсах.
От редакции: Читатели получают 100 задач и упражнений для того, чтобы освоить материал и разобраться с более сложными темами.
- Machine Learning, Петер Флах
Это современная книга по машинному обучению, которая раскрывает важные аспекты ML. Например, как измерять успех моделей.
От редакции: Автор рассказывает о логических, геометрических и статистических моделях, а также матричной факторизации и ROC-анализе.
Основы глубоких нейросетей для начинающих.
От редакции: Книга помогает разобраться в теме, используя интуитивно понятные объяснения и практические примеры. Автор пишет о сложных концепциях и дает практику в области обработки естественного языка и генеративных моделей.
Сергей Брыль, Chief Data Science Officer в MacPaw
Блоги
Автор ресурса Олег Якубенков — один из самых известных специалистов в области продуктовой аналитики в русскоязычном сегменте. В его статьях всегда очень точно передается суть.
Блог Александра Дьяконова про ML. Здесь есть не просто полезная теория и практика, но и множество особенностей, деталей, анализ заблуждений. За это я очень ценю автора.
Также стоит подписаться на его телеграм-канал. Там он пишет о машинном и глубоком обучении, анализе данных и науке о данных.
Здесь Uber рассказывает о своих решениях в области данных. Можно прочитать о «Микеланджело» — платформе машинного обучения Uber — или о том, как компания сформировала лучшую data culture.
Книги
- «Moneyball. Как математика изменила самую популярную спортивную лигу в мире», Майкл Льюис
Это вдохновляющая история трансформации спортивной индустрии с помощью data-driven подхода. Есть экранизация книги — «Человек, который изменил все».
От редакции: Описанные в книге методы изменили подход к работе в европейском футболе. Английские клубы переняли этот опыт, чтобы с помощью математики и алгоритмов искать себе более подходящих игроков и тренеров. Мы об этом писали здесь.
- «Аналитическая культура. От сбора данных до бизнес-результатов», Карл Андерсон
Практическое руководство по внедрению управления на основе данных.
От редакции: Карл Андерсон рассказывает о построении предиктивных бизнес-моделей. Книга основана на опыте дата-аналитиков и сайентистов из разных индустрий.
Оксана Носенко, Senior Product Analyst в Jooble
Книги
- Microsoft SQL Server 2012. Основы T-SQL
Это книга с хорошей теорией, понятными примерами и грамотной структурой. Подходит даже для начинающих.
От редакции: Книга помогает понять внутренние операции по созданию, расширению, сжатию и перемещению баз данных.
Telegram
Аналитика в Google BigQuery, примеры решений и SQL-запросов, инсайты, лайфхаки и советы по работе с данными.
От редакции: Автор канала Александр Осиюк — аналитик в MacPaw. На канале есть информация о работе с геоданными и примеры игровой аналитики с использованием Data Studio.
Шпаргалка продуктового аналитика.
От редакции: На канале можно прочитать о навыках аналитика, о том, как получить максимум от продуктовой аналитики и как мобильная аналитика улучшает экономику приложения.
Лучшие материалы по A/B-тестированию в одном канале.
От редакции: Еще один канал Александра Осиюка. Он объясняет, например, что такое коэффициент несоответствия выборки и как с ним работать или как исправлять 4 основные ошибки A/B-тестирования.
Эксперт по работе с данными Николай Валиотти ведет телеграм-канал об аналитике, визуализации, Data Science и BI. Здесь можно узнать про SQL и работу с базами данных, построение аналитических метрик и отчетов, интересные библиотеки для Python, работу с API (от Google Docs до соцсети для любителей пива), BI- и SQL-инструменты, визуализацию данных и дашборды.
Александр Кутовой, Senior Data Scientist в Klarna
Блоги
Это огромное комьюнити в Slack, где вы найдете помощь, советы и поддержку по всем вопросам любого уровня сложности, связанным с data science.
Если вы столкнулись с проблемой или хотите узнать про какую-то область знаний в DS — там найдутся люди, которые уже давно в этой нише и готовы помочь вам советом или поделиться хорошими ссылками на тему.
Вероятно, лучший источник информации в кейсовой форме. Информация сбалансирована (теория/практика) и удобна для восприятия (хорошо структурированные тексты, в суть которых можно вникнуть за 15-20 минут). Много примеров имплементации конкретных приемов, лучшие практики решений разных проблем и задач, способы имплементации.
Эти два ресурса — 95% всего, что я читаю по теме. Рано или поздно туда стекается все остальное.
Святослав Зборовский, Corporate Data Analyst в DataArt
Книги
- «Статистика и котики», Владимир Савельев
Книга объясняет основные принципы статистики простым языком. Но автор рассказывает только о базовых методах. Поэтому книги хватит только для того, чтобы понимать, о чем говорят аналитики.
- «Голая статистика», Чарльз Уилан
Уилан рассказывает о сложных статистических методах, их достаточно для свободного погружения в работу аналитиком. Особенно отмечается важность интерпретации данных и риск искажения результатов.
- DAMA-DMBOK: Data Management Body of Knowledge: 2nd Edition
Эта книга посвящена подготовке источников чистых и надежных данных. В ней подробно описаны все этапы сбора информации и дата-менеджмента.
- «Введение в машинное обучение с помощью Python. Руководство для специалистов по работе с данными», Андреас Мюллер и Сара Гвидо
Книга рассказывает об особенностях работы с machine learning в Python, а также о базовых ML-алгоритмах. Она отлично подойдет и новичкам, и опытным аналитикам, которые хотят углубиться в машинное обучение.
Telegram
Автор канала Роман Бунин рассказывает об особенностях визуализации данных. Очень интересный канал, с учетом того, что сейчас недооценивают визуализацию как метод анализа данных.
Tableau — одна из самых популярных BI-платформ и настоящий must have для аналитиков. В чате обсуждают особенности работы с Tableau и разбирают частые ошибки при построении дашбордов.