r_d

Python for data science

Практический онлайн-курс о том, как работать с данными в Python. Прокрутите страницу вниз, чтобы прочесть, что вы изучите на этом курсе и кто будет читать вам лекции и проверять домашние задания.
О курсе

3 плюса Python для работы с data science и machine learning: простой синтаксис, много готовых библиотек, скорость выполнения команд.

15 занятий вы будете учиться обрабатывать массивы данных с помощью библиотек NumPy и Pandas, строить статистические гипотезы, визуализировать информацию и использовать алгоритмы ML в аналитике больших данных.

21 декабря  19 февраля
21 декабря — 19 февраля
лектор
Дима Палийчук

занимается data science в Snap Inc (мессенджер Snapchat, смарт-очки Spectacles, сервисы Bitmoji и Zenly). Ранее:

  • Head of Analysis в Genesis
  • системный аналитик в Luxoft
  • oracle-разработчик в Miratech
программа
1
занятие 21.12
Начало работы с Python
Установите Python, ознакомьтесь с Jupyter. Начните изучать библиотеки, основные типы данных, арифметические операции и базовые конструкции. Зачем: чтобы перейти к следующему занятию.
2
занятие 24.12
Продолжение начала работы с Python
Изучите вспомогательные конструкции, циклы, функции и классы. Зачем: начать работу с основными функциями и модулями.
3
занятие 28.12
Знакомство с библиотекой NumPy
Изучите массивы данных, математические и статистические методы. Зачем: проводить научные расчеты с помощью Python.
4
занятие 11.01
Знакомство с библиотекой Pandas, часть 1
Изучите основные структуры данных (Series, DataFrame), функции (Indexing, Selection, Filtering), импорт из CSV, Excel, SQL. Зачем: подготовить данные к анализу.
5
занятие 15.01
Знакомство с библиотекой Pandas, часть 2
Попробуйте самостоятельно создать сводные таблицы и агрегировать данные. Изучите функции объединения и конкатенации. Зачем: сортировать и агрегировать данные.
6
занятие 18.01
Визуализация данных с помощю Matplotlib, Seaborn
Изучите основные элементы графика. Постройте несколько разных видов графиков. Поработайте с функцией subplot() для создания нескольких независимых графиков. Зачем: выражать данные в визуально понятном виде.
7
занятие 22.01
Описательная статистика в Pandas
Проведите предварительный анализ данных. Научитесь считать квантили и квартили, создавать гистограммы и ящики с усами. Зачем: описывать и интерпретировать данные, а также отличать правду от лжи.
8
занятие 25.01
Проверка статистических гипотез
Изучите определение уровня значимости гипотезы, типы ошибок (I и II рода, p-value). Научитесь проводить A/B-тестирование. Зачем: оценивать истинность гипотез.
9
занятие 29.01
Кластеризация данных, часть 1
Изучите сферы применения, основные задачи. Проведите иерархический кластерный анализ. Зачем: научиться разбивать данные на относительно однородные группы.
10
занятие 01.02
Кластеризация данных, часть 2
Изучите метод к-средних (K-mean). Научитесь интерпретировать результаты кластеризации. Зачем: получать результат даже когда данных мало и не выполняются требования классических методов статистического анализа.
11
занятие 05.02
Прогнозирование на основе линейной и полиномиальной регрессий
Изучите основные принципы построения регрессии и сферы применения. Научитесь оценивать качество линейной и полиномиальной регрессий. Зачем: применять регрессии для прогнозирования.
12
занятие 08.02
Логистическая регрессия
Научитесь строить и оценивать логистические регрессии. Зачем: применять регрессию для задач с ограничениями в показателях либо с бинарным откликом.
13
занятие 12.02
Факторный анализ
Изучите основные принципы и сферы применения. Проведите анализ с помощью метода главных компонентов (PCA). Зачем: формировать структуру взаимосвязей между переменными.
14
занятие 15.02
Деревья решений (Decision Tree)
Научитесь строить деревья решений и оценивать качества классификатора. Зачем: решать задачи классификации и регрессии.
15
занятие 19.02
Случайные леса (Random Forest)
Изучите общие принципы, сферы применения, приемы улучшения классификаторов (Stacking, Boosting, Bagging). Зачем: строить алгоритм машинного обучения для решения задач классификации и регрессии.
 
 
 
для кого курс
  • дата-аналитики
  • дата-сайентисты
  • разработчики
  • бизнес-аналитики
После курса
1
Обработка данных в Python.
Работаете с библиотеками NumPy и Pandas —> можете собирать, агрегировать и готовить данные к анализу
2
Статистика.
Умеете кластеризовать данные и определять различия между ними
—> можете тестировать статистические гипотезы и находить ошибки и решения различных задач.
3
Основы data science.
Умеете работать с тремя основными алгоритмами регрессии (линейная, полиномиальная и логистическая)
—> можете строите предиктивные модели.
регистрация

это обязательное поле

введите правильный адрес

это тоже обязательное поле

введите корректный номер телефона

и это тоже обязательное поле

 
 
 
 
Регистрируясь, вы соглашаетесь с условиями
договора-оферты и политикой конфиденциальности.
what if … :
1. … курс не понравился – можно вернуть деньги.
2. … не подходит график занятий — уточните, когда будет следующий поток.
3. … вы пропустили занятие – сохраняется запись.