r_d

Python for data science

Практический онлайн-курс о том, как работать с данными в Python. Рекомендован для глубокой аналитики данных, а также как база для дальнейшей работы с задачами класса ‘machine learning’.
О курсе

По вашему запросу уточнены виды навыков, которые человек получит в течение 15 занятий: ‘обработка массивов данных с помощью библиотек NumPy и Pandas’, ‘построение регрессий’, ‘визуализация данных’.

По предварительным оценкам, после обучения человек сможет обрабатывать задачи класса ‘проверка и генерация гипотез’, ‘классификация’, ‘прогнозирование’.

21 декабря  19 февраля
21 декабря — 19 февраля
записаться
лектор
Дима Палийчук

занимается data science в Snap Inc (мессенджер Snapchat, смарт-очки Spectacles, сервисы Bitmoji и Zenly). Ранее:

  • Head of Analysis в Genesis
  • системный аналитик в Luxoft
  • oracle-разработчик в Miratech
программа
1
занятие 21.12
Начало работы с Python
Установите Python, ознакомьтесь с Jupyter. Начните изучать библиотеки, основные типы данных, арифметические операции и базовые конструкции. Зачем: чтобы перейти к следующему занятию.
2
занятие 24.12
Продолжение начала работы с Python
Изучите вспомогательные конструкции, циклы, функции и классы. Зачем: начать работу с основными функциями и модулями.
3
занятие 28.12
Знакомство с библиотекой NumPy
Изучите массивы данных, математические и статистические методы. Зачем: проводить научные расчеты с помощью Python.
4
занятие 11.01
Знакомство с библиотекой Pandas, часть 1
Изучите основные структуры данных (Series, DataFrame), функции (Indexing, Selection, Filtering), импорт из CSV, Excel, SQL. Зачем: подготовить данные к анализу.
5
занятие 15.01
Знакомство с библиотекой Pandas, часть 2
Попробуйте самостоятельно создать сводные таблицы и агрегировать данные. Изучите функции объединения и конкатенации. Зачем: сортировать и агрегировать данные.
6
занятие 18.01
Визуализация данных с помощю Matplotlib, Seaborn
Изучите основные элементы графика. Постройте несколько разных видов графиков. Поработайте с функцией subplot() для создания нескольких независимых графиков. Зачем: выражать данные в визуально понятном виде.
7
занятие 22.01
Описательная статистика в Pandas
Проведите предварительный анализ данных. Научитесь считать квантили и квартили, создавать гистограммы и ящики с усами. Зачем: описывать и интерпретировать данные, а также отличать правду от лжи.
8
занятие 25.01
Проверка статистических гипотез
Изучите определение уровня значимости гипотезы, типы ошибок (I и II рода, p-value). Научитесь проводить A/B-тестирование. Зачем: оценивать истинность гипотез.
9
занятие 29.01
Кластеризация данных, часть 1
Изучите сферы применения, основные задачи. Проведите иерархический кластерный анализ. Зачем: научиться разбивать данные на относительно однородные группы.
10
занятие 01.02
Кластеризация данных, часть 2
Изучите метод к-средних (K-mean). Научитесь интерпретировать результаты кластеризации. Зачем: получать результат даже когда данных мало и не выполняются требования классических методов статистического анализа.
11
занятие 05.02
Прогнозирование на основе линейной и полиномиальной регрессий
Изучите основные принципы построения регрессии и сферы применения. Научитесь оценивать качество линейной и полиномиальной регрессий. Зачем: применять регрессии для прогнозирования.
12
занятие 08.02
Логистическая регрессия
Научитесь строить и оценивать логистические регрессии. Зачем: применять регрессию для задач с ограничениями в показателях либо с бинарным откликом.
13
занятие 12.02
Факторный анализ
Изучите основные принципы и сферы применения. Проведите анализ с помощью метода главных компонентов (PCA). Зачем: формировать структуру взаимосвязей между переменными.
14
занятие 15.02
Деревья решений (Decision Tree)
Научитесь строить деревья решений и оценивать качества классификатора. Зачем: решать задачи классификации и регрессии.
15
занятие 19.02
Случайные леса (Random Forest)
Изучите общие принципы, сферы применения, приемы улучшения классификаторов (Stacking, Boosting, Bagging). Зачем: строить алгоритм машинного обучения для решения задач классификации и регрессии.
вы
ваши свойства
  • дата-аналитики
  • дата-сайентисты
  • разработчики
  • бизнес-аналитики
ваши свойства
  • знание математики и статистики, опыт работы с данными
  • минимальный опыт работы с любым языком программирования
После курса
1
Обработка данных в Python.
Работаете с библиотеками NumPy и Pandas —> можете собирать, агрегировать и готовить данные к анализу
2
Статистика.
Умеете кластеризовать данные и определять различия между ними
—> можете тестировать статистические гипотезы и находить ошибки и решения различных задач.
3
Основы data science.
Умеете работать с тремя основными алгоритмами регрессии (линейная, полиномиальная и логистическая)
—> можете строите предиктивные модели.
регистрация

это обязательное поле

введите правильный адрес

это тоже обязательное поле

введите корректный номер телефона

и это тоже обязательное поле

 
 
 
 
Регистрируясь, вы соглашаетесь с условиями
договора-оферты и политикой конфиденциальности.
what if … :
1. … курс не понравился – можно вернуть деньги.
2. … не подходит график занятий — уточните, когда будет следующий поток.
3. … вы пропустили занятие – сохраняется запись.