future thinking school by Laba

Python для
Data Science

Курс нацелен для тех, кто уже владеет Python, и хочет дальше развиваться в сфере data science.

11 библиотек для анализа и визуализации данных построение простых ML-моделей кластеризация, отбор признаков и уменьшение соразмерности данных

Python ― язык программирования № 1 в сфере Data Science и Machine Learning.

Наиболее эффективный способ заставить данные «говорить» ― освоить Python и его библиотеки. С этим вам поможет курс от robot_dreams. Вы научитесь парсить сайты, работать с сырыми данными, автоматизировать процесс анализа и визуализации, валидировать гипотезы и строить простые ML-модели.

Программа курса

01 занятие

Введение в Data Science. Знакомство с задачами и инструментами

Разберитесь, какие задачи входят в область Data Science. Освойте инструменты для интерактивной работы с Python [IPython, Jupyter Notebook и Google Collaboratory]. Ознакомьтесь с библиотекой NumPy и разберитесь в ее преимуществах перед обычными списками. Научитесь создавать массивы и выполнять базовые операции над ними в NumPy.

02 занятие

NumPy. Линейная алгебра и статистика

Возобновите знания по линейной алгебре и статистике. Научитесь вызывать векторное умножение, поэлементное сложение OR вычитание и другие функции в NumPy. Научитесь вводить и выводить матрицы и массивы разной величины, находить std и mean, выводить гистограмму одномерного массива.

15 занятие

Кластерный анализ данных

Узнайте, как обучить модель без учителя с помощью кластеризации. Изучите теорию и разберите на примерах, как работают методы кластеризации в моделях K-Means, DBSCAN и Agglomerative Clustering. Найдите группы похожих экземпляров в массиве данных с помощью кластеризации.

16 занятие

Отбор признаков и уменьшение соразмерности данных

Изучите простые способы выбора признаков. Выберите признаки так, чтобы оставить только самые значимые для модели. Научитесь применять методы уменьшения соразмерности данных для ML-модели [Singular Value Decomposition, Principal Component Analysis, Linear Discriminant Analysis].

После курса вы сможете:

работать с разными типами и структурами данных
использовать библиотеки NumPy, Pandas, Matplotlib, Seaborn, Plotly, Sweetviz, Pandas Profiling, SciPy, Scikit-learn, CatBoost и XGBoost
строить продвинутые и интерактивные визуализации
проводить Exploratory Data Analysis и находить взаимосвязи в данных
заполнять пробелы в данных
валидировать гипотезы и анализировать результаты А/В-тестирования
решать задачи прогнозирования и классификации
строить простые ML-модели
начать путь в Data Science

Программа курса

Кому будет полезен курс

Analysts
Если вы:
- работаете в компании, которая быстро масштабируется
- можете и запрос к базе данных составить, и посчитать САС,
  и применить правильную формулу
  в Excel, и составить отчет
- иногда вынуждены закрывать задачи дата-сайентиста, но вам сложно структурировать массивы данных и решать задачи прогнозирования
Data Analysts/
Product Analysts
Если вы:
- работаете в аналитике уже
  более 3 лет
- знаете статистику
- пользуетесь одной из BI-систем
- хотите расширить горизонты
  и перейти на новый уровень работы
  с данными в сфере Data Science
Developers
Если вы:
- кодите на Python, но для некоторых задач вам нужны знания
  из Data Science
- рассматриваете переход из разработки в BI-аналитику,
  Data Science или Machine Learning
- хотите освоить фреймворки Python, созданные специально под задачи Data Science, и строить
  простые ML-модели

Подать заявку

Необходимые знания:

Python

знать синтаксис языка, работать с разными типами и структурами данных, уметь обрабатывать ошибки и исключения, устанавливать библиотеки

Линейная алгебра

помнить скалярное умножение векторов и знать, как умножить матрицы

Статистика

понимать, что такое случайная величина, функция плотности, функция распределения, мода и медиана выборки

Пока не обладаете нужными знаниями? Обратите внимание на курс:

Python для разработки и анализа данных

Лектор

Анна Пылева Senior Data Scientist в Parimatch Tech

развивает проекты Data Science и работает над улучшением бизнес-показателей в Parimatch Tech
последние 6 лет работает с данными: сначала как аналитик, затем — как Machine Learning Engineer и Data Scientist
работала в команде по разработке алгоритмов компьютерного зрения для мобильных устройств в Eyesight Technologies
разработала ряд функций на основе CV и NLP, например, обнаружение дубликатов товаров по названию, изображению и соответствию цены, на позиции Machine Learning Engineer в EVO.company
разработала с нуля и запустила более 10 проектов в направлениях Tabular Data Processing, Business Intelligence, Computer Vision, Natural Language Processing
провела более 15 лекций на разные темы Data Science и Machine Learning

16 онлайн-занятий 24 часа теории
+ 30 часов самостоятельной практики

Записаться

Регистрация

Регистрируясь, вы соглашаетесь с условиями
договора-оферты и политикой конфиденциальности.

Python для Data Science

После курса вы сможете:

Python для
Data Science