future thinking school by Laba
онлайн-курс advanced level5 поток

Python для
Data Science

Курс нацелен для тех, кто уже владеет Python, и хочет дальше развиваться в сфере data science.
11 библиотек для анализа и визуализации данных построение простых ML-моделей кластеризация, отбор признаков и уменьшение соразмерности данных
Python ― язык программирования № 1 в сфере Data Science и Machine Learning.
 


Наиболее эффективный способ заставить данные «говорить» ― освоить Python и его библиотеки. С этим вам поможет курс от robot_dreams. Вы научитесь парсить сайты, работать с сырыми данными, автоматизировать процесс анализа и визуализации, валидировать гипотезы и строить простые ML-модели.

Программа курса
 
01 занятие
Введение в Data Science. Знакомство с задачами и инструментами
Разберитесь, какие задачи входят в область Data Science. Освойте инструменты для интерактивной работы с Python [IPython, Jupyter Notebook и Google Collaboratory]. Ознакомьтесь с библиотекой NumPy и разберитесь в ее преимуществах перед обычными списками. Научитесь создавать массивы и выполнять базовые операции над ними в NumPy.
02 занятие
NumPy. Линейная алгебра и статистика
Возобновите знания по линейной алгебре и статистике. Научитесь вызывать векторное умножение, поэлементное сложение OR вычитание и другие функции в NumPy. Научитесь вводить и выводить матрицы и массивы разной величины, находить std и mean, выводить гистограмму одномерного массива.
15 занятие
Кластерный анализ данных
Узнайте, как обучить модель без учителя с помощью кластеризации. Изучите теорию и разберите на примерах, как работают методы кластеризации в моделях K-Means, DBSCAN и Agglomerative Clustering. Найдите группы похожих экземпляров в массиве данных с помощью кластеризации.
16 занятие
Отбор признаков и уменьшение соразмерности данных
Изучите простые способы выбора признаков. Выберите признаки так, чтобы оставить только самые значимые для модели. Научитесь применять методы уменьшения соразмерности данных для ML-модели [Singular Value Decomposition, Principal Component Analysis, Linear Discriminant Analysis].

После курса вы сможете:

  • работать с разными типами и структурами данных
  • использовать библиотеки NumPy, Pandas, Matplotlib, Seaborn, Plotly, Sweetviz, Pandas Profiling, SciPy, Scikit-learn, CatBoost и XGBoost
  • строить продвинутые и интерактивные визуализации
  • проводить Exploratory Data Analysis и находить взаимосвязи в данных
  • заполнять пробелы в данных
  • валидировать гипотезы и анализировать результаты А/В-тестирования
  • решать задачи прогнозирования и классификации
  • строить простые ML-модели
  • начать путь в Data Science
Программа курса
Кому будет полезен курс
  1. Analysts

    Если вы:

    • работаете в компании, которая быстро масштабируется
    • можете и запрос к базе данных составить, и посчитать САС,
      и применить правильную формулу
      в Excel, и составить отчет
    • иногда вынуждены закрывать задачи дата-сайентиста, но вам сложно структурировать массивы данных и решать задачи прогнозирования
  2. Data Analysts/
    Product Analysts

    Если вы:

    • работаете в аналитике уже
      более 3 лет
    • знаете статистику
    • пользуетесь одной из BI-систем
    • хотите расширить горизонты
      и перейти на новый уровень работы
      с данными в сфере Data Science
  3. Developers

    Если вы:

    • кодите на Python, но для некоторых задач вам нужны знания
      из Data Science
    • рассматриваете переход из разработки в BI-аналитику,
      Data Science или Machine Learning
    • хотите освоить фреймворки Python, созданные специально под задачи Data Science, и строить
      простые ML-модели
Подать заявку
Необходимые знания:
Python
знать синтаксис языка, работать с разными типами и структурами данных, уметь обрабатывать ошибки и исключения, устанавливать библиотеки
Линейная алгебра
помнить скалярное умножение векторов и знать, как умножить матрицы
Статистика
понимать, что такое случайная величина, функция плотности, функция распределения, мода и медиана выборки
Пока не обладаете нужными знаниями? Обратите внимание на курс:
Лектор
Анна Пылева Senior Data Scientist в Parimatch Tech
  • развивает проекты Data Science и работает над улучшением бизнес-показателей в Parimatch Tech
  • последние 6 лет работает с данными: сначала как аналитик, затем — как Machine Learning Engineer и Data Scientist
  • работала в команде по разработке алгоритмов компьютерного зрения для мобильных устройств в Eyesight Technologies
  • разработала ряд функций на основе CV и NLP, например, обнаружение дубликатов товаров по названию, изображению и соответствию цены, на позиции Machine Learning Engineer в EVO.company
  • разработала с нуля и запустила более 10 проектов в направлениях Tabular Data Processing, Business Intelligence, Computer Vision, Natural Language Processing
  • провела более 15 лекций на разные темы Data Science и Machine Learning
16 онлайн-занятий 24 часа теории
+ 30 часов самостоятельной практики
Записаться

Регистрация

 

 

 

Регистрируясь, вы соглашаетесь с условиями
договора-оферты и политикой конфиденциальности.