23 ресурси для data-аналітиків

23 ресурси для data-аналітиків

Експерти радять Telegram- та YouTube-канали, блоги та книги.

Які книги читати та на які канали підписатися, якщо ви аналітик? Розповідають фахівці з роботи з даними з Airbus, Jooble, MacPaw, DataArt та Klarna.

Сергій Бобровський, Data Scientist в Airbus та лектор курсу «Прикладна математика та статистика для Data Science»
 

YouTube

Чудовий YouTube-канал, який допомагає зрозуміти основи математики за допомогою візуалізації.

Від редакції: Серед тем, які можна знайти на каналі, — моделювання епідемій, поради, як краще розв’язувати проблеми, або що таке парадокс похідної.

Книги

Компактна книга зі статистики для тих, хто вже має уявлення про тему.

Від редакції: Книга підійде для тих, хто хоче швидко вивчити ймовірність та статистику.

Книга та однойменний курс для університетського рівня. Охоплюють основи машинного навчання, які часто не зачіпаються на інших курсах.

Від редакції: Читачі одержують 100 завдань та вправ для того, щоб опанувати матеріал та розібратися зі складнішими темами.

Це сучасна книга з машинного навчання, яка розкриває важливі аспекти ML. Наприклад, як виміряти успіх моделей.

Від редакції: Автор розповідає про логічні, геометричні та статистичні моделі, а також про матричну факторизацію та ROC-аналіз.

Основи глибоких нейромереж для початківців.

Від редакції: Книга допомагає розібратися в темі, використовуючи інтуїтивно зрозумілі пояснення та практичні приклади. Автор пише про складні концепції та дає практику у сфері обробки природної мови та генеративних моделей.

Сергій Бриль, Chief Data Science Officer у MacPaw
 

Блоги

Автор ресурсу Олег Якубенков — один із найвідоміших фахівців у сфері продуктової аналітики в російськомовному сегменті. У його статтях завжди дуже точно передається суть.

Блог Олександра Дʼяконова для ML. Тут є не просто корисна теорія та практика, а й безліч особливостей, деталей, аналіз помилок. За це я дуже ціную автора.

Також варто підписатися на його телеграм-канал. Там він пише про машинне і глибоке навчання, аналіз даних і науку про дані.

Тут Uber розповідає про свої рішення у сфері даних. Можна прочитати про «Мікеланджело» — платформу машинного навчання Uber — або про те, як компанія сформувала найкращу data culture.

Книги

  • «Moneyball. Як математика змінила найпопулярнішу спортивну лігу у світі», Майкл Льюїс

Це історія трансформації спортивної індустрії за допомогою data-driven підходу, яка надихає. Є екранізація книги — «Людина, яка змінила все».

Від редакції: Описані в книзі методи змінили підхід до роботи у європейському футболі. Англійські клуби перейняли цей досвід, щоби за допомогою математики та алгоритмів шукати собі відповідніших гравців та тренерів. Ми про це писали тут.  

  • «Аналітична культура. Від збору даних до бізнес-результатів», Карл Андерсон

Практичний посібник із впровадження управління на основі даних.

Від редакції: Карл Андерсон розповідає про побудову передиктивних бізнес-моделей. Книга ґрунтується на досвіді дата-аналітиків та саєнтистів із різних індустрій.

Оксана Носенко, Senior Product Analyst у Jooble
 

Книги

  • Microsoft SQL Server 2012. Основи T-SQL 

Це книга з гарною теорією, зрозумілими прикладами та грамотною структурою. Підходить навіть для початківців.

Від редакції: Книга допомагає зрозуміти внутрішні операції зі створення, розширення, стиснення та переміщення баз даних.

Telegram

Аналітика в Google BigQuery, приклади рішень та SQL-запитів, інсайти, лайфхаки та поради щодо роботи з даними.

Від редакції: Автор каналу Олександр Осіюк — аналітик у MacPaw. На каналі є інформація про роботу з геоданими та приклади ігрової аналітики з використанням Data Studio.

Шпаргалка продуктового аналітика

Від редакції: На каналі можна прочитати про навички аналітика, про те, як отримати максимум від продуктової аналітики та як мобільна аналітика покращує економіку програми.

Найкращі матеріали з A/B-тестування в одному каналі.

Від редакції: Ще один канал Олександра Осіюка. Він пояснює, наприклад, що таке коефіцієнт невідповідності вибірки і як із ним працювати або як виправляти 4 основні помилки A/B-тестування.

Експерт із роботи з даними Микола Валіотті веде телеграм-канал про аналітику, візуалізацію, Data Science та BI. Тут можна дізнатися про SQL та роботу з базами даних, побудову аналітичних метрик та звітів, цікаві бібліотеки для Python, роботу з API (від Google Docs до соцмережі для любителів пива), BI- та SQL-інструменти, візуалізацію даних та дашборди.

Олександр Кутовий, Senior Data Scientist у Klarna
 

Блоги

Це величезне ком’юніті в Slack, де ви знайдете допомогу, поради та підтримку з усіх питань будь-якого рівня складності, пов’язаних із data science.

Якщо ви зіткнулися з проблемою або хочете дізнатися про якусь сферу знань у DS — там знайдуться люди, які вже давно в цій ніші та готові допомогти вам порадою або поділитися хорошими посиланнями на тему.

Ймовірно, найкраще джерело інформації в кейсовій формі. Інформація збалансована (теорія/практика) і зручна для сприйняття (добре структуровані тексти, якими можна пройнятися за 15–20 хвилин). Багато прикладів імплементації конкретних засобів, найкращі практики розв’язання різних проблем та завдань, способи імплементації.

Ці два ресурси — 95 % усього, що я читаю на тему. Рано чи пізно туди стікається решта.

Святослав Зборовський, Corporate Data Analyst у DataArt
 

Книги

  • «Статистика та котики», Володимир Савельєв

Книга пояснює основні засади статистики простою мовою. Але автор розповідає лише про базові методи. Тому книжки вистачить лише для того, щоби розуміти, про що говорять аналітики.

  •  «Гола статистика», Чарльз Вілан 

Вілан розповідає про складні статистичні методи, їх достатньо для вільного занурення в роботу аналітиком. Особливо відзначається важливість інтерпретації даних та ризик спотворення результатів.

  • DAMA-DMBOK: Data Management Body of Knowledge: 2nd Edition

Ця книга присвячена підготовці джерел чистих та надійних даних. У ній докладно описано всі етапи збору інформації та дата-менеджменту.

  • «Вступ до машинного навчання за допомогою Python. Посібник для фахівців із роботи з даними», Андреас Мюллер та Сара Гвідо

Книга розповідає про особливості роботи з machine learning у Python, а також про базові ML-алгоритми. Вона відмінно підійде й новачкам, і досвідченим аналітикам, які хочуть заглибитись у машинне навчання.

Telegram

Автор каналу Роман Бунін розповідає про особливості візуалізації даних. Дуже цікавий канал, з огляду на те, що зараз недооцінюють візуалізацію як метод аналізу даних.

Tableau — одна з найпопулярніших BI-платформ та справжній must have для аналітиків. У чаті обговорюють особливості роботи з Tableau, а також розбирають часті помилки під час побудови дашбордів.

 

Ще статті
Віктор Шитюк, Lead Data Engineer з 12 річним досвідом у IT сфері, про робочу рутину інженера даних, must-have інструменти та перспективи професії.