future thinking school by Laba

За 8 недель курса вы пройдете полный цикл задач Data Scientist ― от загрузки данных до кластерного анализа и обучения простых ML-моделей. В результате ― откроете новый подход к анализу больших данных с помощью Python.

Python для
Data Science

Перейдите на новый уровень в работе с big data Для кого этот курс

11 библиотек для анализа и визуализации данных 16 онлайн-лекций + 8 домашних заданий живое общение с лектором

Python ― язык программирования № 1 в сфере Data Science и Machine Learning.

Программа курса

01 занятие

22.09

19:00

Введение в Data Science. Знакомство с задачами и инструментами

Разберитесь, какие задачи входят в область Data Science. Освойте инструменты для интерактивной работы с Python [IPython, Jupyter Notebook и Google Collaboratory]. Ознакомьтесь с библиотекой NumPy и разберитесь в ее преимуществах перед обычными списками. Научитесь создавать массивы и выполнять базовые операции над ними в NumPy.

02 занятие

24.09

19:00

NumPy. Линейная алгебра и статистика

Возобновите знания по линейной алгебре и статистике. Научитесь вызывать векторное умножение, поэлементное сложение OR вычитание и другие функции в NumPy. Научитесь вводить и выводить матрицы и массивы разной величины, находить std и mean, выводить гистограмму одномерного массива.

15 занятие

10.11

19:00

Кластерный анализ данных

Узнайте, как обучить модель без учителя с помощью кластеризации. Изучите теорию и разберите на примерах, как работают методы кластеризации в моделях K-Means, DBSCAN и Agglomerative Clustering. Найдите группы похожих экземпляров в массиве данных с помощью кластеризации.

16 занятие

12.11

19:00

Отбор признаков и уменьшение соразмерности данных

Изучите простые способы выбора признаков. Выберите признаки так, чтобы оставить только самые значимые для модели. Научитесь применять методы уменьшения соразмерности данных для ML-модели [Singular Value Decomposition, Principal Component Analysis, Linear Discriminant Analysis].

После курса вы сможете:

работать с разными типами и структурами данных
использовать библиотеки NumPy, Pandas, Matplotlib, Seaborn, Plotly, Sweetviz, Pandas Profiling, SciPy, Scikit-learn, CatBoost и XGBoost
строить продвинутые и интерактивные визуализации
проводить Exploratory Data Analysis и находить взаимосвязи в данных
заполнять пробелы в данных
валидировать гипотезы и анализировать результаты А/В-тестирования
решать задачи прогнозирования и классификации
строить простые ML-модели
начать путь в Data Science

Кому будет полезен курс

Analysts
Если вы:
- работаете в компании, которая быстро масштабируется
- можете и запрос к базе данных составить, и посчитать САС,
  и применить правильную формулу
  в Excel, и составить отчет
- иногда вынуждены закрывать задачи дата-сайентиста, но вам сложно структурировать массивы данных и решать задачи прогнозирования
Data Analysts/
Product Analysts
Если вы:
- работаете в аналитике уже
  более 3 лет
- знаете статистику
- пользуетесь одной из BI-систем
- хотите расширить горизонты
  и перейти на новый уровень работы
  с данными в сфере Data Science
Developers
Если вы:
- кодите на Python, но для некоторых задач вам нужны знания
  из Data Science
- рассматриваете переход из разработки в BI-аналитику,
  Data Science или Machine Learning
- хотите освоить фреймворки Python, созданные специально под задачи Data Science, и строить
  простые ML-модели

Подать заявку

Необходимые знания:

Python

знать синтаксис языка, работать с разными типами и структурами данных, уметь обрабатывать ошибки и исключения, устанавливать библиотеки

Линейная алгебра

помнить скалярное умножение векторов и знать, как умножить матрицы

Статистика

понимать, что такое случайная величина, функция плотности, функция распределения, мода и медиана выборки

Пока не обладаете нужными знаниями? Обратите внимание на курс:

Python для разработки и анализа данных

Для обучения нужно установить:

Python 3.7 или более поздние версии
Pip + Virtualenv или Conda [для пользователей Windows]
Jupyter Notebook
Библиотеки NumPy, Pandas, Matplotlib и Seaborn [остальные можно установить в процессе обучения]
Текстовый редактор Sublime 3
Браузер Chrome

Лектор

Анна Пылева Senior Data Scientist в Parimatch Tech

развивает проекты Data Science и работает над улучшением бизнес-показателей в Parimatch Tech
последние 6 лет работает с данными: сначала как аналитик, затем — как Machine Learning Engineer и Data Scientist
работала в команде по разработке алгоритмов компьютерного зрения для мобильных устройств в Eyesight Technologies
разработала ряд функций на основе CV и NLP, например, обнаружение дубликатов товаров по названию, изображению и соответствию цены, на позиции Machine Learning Engineer в EVO.company
разработала с нуля и запустила более 10 проектов в направлениях Tabular Data Processing, Business Intelligence, Computer Vision, Natural Language Processing
провела более 15 лекций на разные темы Data Science и Machine Learning

16 онлайн-занятий 24 часа теории
+ 30 часов самостоятельной практики 22 сентября ― 12 ноября

Записаться на курс

Регистрация

Регистрируясь, вы соглашаетесь с условиями
договора-оферты и политикой конфиденциальности.

Python для Data Science

После курса вы сможете:

Для обучения нужно установить:

Python для
Data Science