Онлайн-курс "Python для Data Science" — освойте ключевой инструмент в сфере аналитики и машинного обучения | robot_dreams
future thinking school by Laba
онлайн-курс 8 недель старт 22.094 поток
За 8 недель курса вы пройдете полный цикл задач Data Scientist ― от загрузки данных до кластерного анализа и обучения простых ML-моделей. В результате ― откроете новый подход к анализу больших данных с помощью Python.

Python для
Data Science

Перейдите на новый уровень в работе с big data Для кого этот курс
11 библиотек для анализа и визуализации данных 16 онлайн-лекций + 8 домашних заданий живое общение с лектором
Python ― язык программирования № 1 в сфере Data Science и Machine Learning.
 
Программа курса
 
01 занятие
22.09
19:00
Введение в Data Science. Знакомство с задачами и инструментами
Разберитесь, какие задачи входят в область Data Science. Освойте инструменты для интерактивной работы с Python [IPython, Jupyter Notebook и Google Collaboratory]. Ознакомьтесь с библиотекой NumPy и разберитесь в ее преимуществах перед обычными списками. Научитесь создавать массивы и выполнять базовые операции над ними в NumPy.
02 занятие
24.09
19:00
NumPy. Линейная алгебра и статистика
Возобновите знания по линейной алгебре и статистике. Научитесь вызывать векторное умножение, поэлементное сложение OR вычитание и другие функции в NumPy. Научитесь вводить и выводить матрицы и массивы разной величины, находить std и mean, выводить гистограмму одномерного массива.
15 занятие
10.11
19:00
Кластерный анализ данных
Узнайте, как обучить модель без учителя с помощью кластеризации. Изучите теорию и разберите на примерах, как работают методы кластеризации в моделях K-Means, DBSCAN и Agglomerative Clustering. Найдите группы похожих экземпляров в массиве данных с помощью кластеризации.
16 занятие
12.11
19:00
Отбор признаков и уменьшение соразмерности данных
Изучите простые способы выбора признаков. Выберите признаки так, чтобы оставить только самые значимые для модели. Научитесь применять методы уменьшения соразмерности данных для ML-модели [Singular Value Decomposition, Principal Component Analysis, Linear Discriminant Analysis].

После курса вы сможете:

  • работать с разными типами и структурами данных
  • использовать библиотеки NumPy, Pandas, Matplotlib, Seaborn, Plotly, Sweetviz, Pandas Profiling, SciPy, Scikit-learn, CatBoost и XGBoost
  • строить продвинутые и интерактивные визуализации
  • проводить Exploratory Data Analysis и находить взаимосвязи в данных
  • заполнять пробелы в данных
  • валидировать гипотезы и анализировать результаты А/В-тестирования
  • решать задачи прогнозирования и классификации
  • строить простые ML-модели
  • начать путь в Data Science
Кому будет полезен курс
  1. Analysts

    Если вы:

    • работаете в компании, которая быстро масштабируется
    • можете и запрос к базе данных составить, и посчитать САС,
      и применить правильную формулу
      в Excel, и составить отчет
    • иногда вынуждены закрывать задачи дата-сайентиста, но вам сложно структурировать массивы данных и решать задачи прогнозирования
  2. Data Analysts/
    Product Analysts

    Если вы:

    • работаете в аналитике уже
      более 3 лет
    • знаете статистику
    • пользуетесь одной из BI-систем
    • хотите расширить горизонты
      и перейти на новый уровень работы
      с данными в сфере Data Science
  3. Developers

    Если вы:

    • кодите на Python, но для некоторых задач вам нужны знания
      из Data Science
    • рассматриваете переход из разработки в BI-аналитику,
      Data Science или Machine Learning
    • хотите освоить фреймворки Python, созданные специально под задачи Data Science, и строить
      простые ML-модели
Подать заявку
Необходимые знания:
Python
знать синтаксис языка, работать с разными типами и структурами данных, уметь обрабатывать ошибки и исключения, устанавливать библиотеки
Линейная алгебра
помнить скалярное умножение векторов и знать, как умножить матрицы
Статистика
понимать, что такое случайная величина, функция плотности, функция распределения, мода и медиана выборки
Пока не обладаете нужными знаниями? Обратите внимание на курс:

Для обучения нужно установить:

  • Python 3.7 или более поздние версии
  • Pip + Virtualenv или Conda [для пользователей Windows]
  • Jupyter Notebook
  • Библиотеки NumPy, Pandas, Matplotlib и Seaborn [остальные можно установить в процессе обучения]
  • Текстовый редактор Sublime 3
  • Браузер Chrome
Лектор
Анна Пылева Senior Data Scientist в Parimatch Tech
  • развивает проекты Data Science и работает над улучшением бизнес-показателей в Parimatch Tech
  • последние 6 лет работает с данными: сначала как аналитик, затем — как Machine Learning Engineer и Data Scientist
  • работала в команде по разработке алгоритмов компьютерного зрения для мобильных устройств в Eyesight Technologies
  • разработала ряд функций на основе CV и NLP, например, обнаружение дубликатов товаров по названию, изображению и соответствию цены, на позиции Machine Learning Engineer в EVO.company
  • разработала с нуля и запустила более 10 проектов в направлениях Tabular Data Processing, Business Intelligence, Computer Vision, Natural Language Processing
  • провела более 15 лекций на разные темы Data Science и Machine Learning
16 онлайн-занятий 24 часа теории
+ 30 часов самостоятельной практики
22 сентября ― 12 ноября
Записаться на курс

Регистрация

 

 

 

Регистрируясь, вы соглашаетесь с условиями
договора-оферты и политикой конфиденциальности.