Научите компьютер предсказывать следующее слово, распознавать эмоции в твитах, искать упоминания профессий в CV. Создадите собственного чат-бота и запустите его в Telegram. Получите практические навыки работы с основными NLP-библиотеками и ресурсами на онлайн-курсе.
Natural Language Processing
Изучите способы решения NLP-задач: стандартные правила, статистика и нейронные сети.научитесь решать фундаментальные задачи NLP: сплиттинг, токенизация, морфологический, синтаксический и семантический анализ освоите генерацию текста, задачи информационного поиска, машинного перевода, распознавания и синтеза речи узнаете, как оценивать качество NLP-моделей, находить потенциальные способы их улучшения
К 2025 году рынок NLP возрастет в 14 раз (до $43 млрд)
Программа курса
(18 занятий)
01 занятие
24.11
19:00
Введение в NLP
Узнайте, что представляет собой область NLP. Получите информацию о наиболее интересных задачах на примере известных компаний: Yandex Translate, Google Search, Siri, Grammarly. Научитесь находить нужную информацию, используя NLP-ресурсы.
02 занятие
29.11
19:00
Подходы к решению NLP-задач (теория)
Поймите, как NLP-задачи взаимодействуют друг с другом: от простых к сложным. Узнайте типы первоуровневых задач и познакомьтесь со способами решения NLP задач: правила, статистика, машинное обучение.
03 занятие
01.12
19:00
Подходы к решению NLP-задач (практика)
Научитесь решать фундаментальные задачи NLP: сплиттинг, токенизация, морфологический, синтаксический и семантический анализ. Примените NLP-библиотеки: spacy, nltk, stanza.
04 занятие
06.12
19:00
Способы векторизации для NLP
Научитесь векторизовать данные разными способами: Bag of Words, TF-IDF и другими. Узнайте, какие способы векторизации использовать в зависимости от задачи.
05 занятие
08.12
19:00
Word embeddings
Узнайте, что такое word embeddings, в каких случаях использовать и как получать ее для текста. А также получите информацию о дистрибутивной семантике, контекстной репрезентации, алгоритмах контекстной векторизации.
06 занятие
13.12
19:00
Задачи на семантику и полярность
Научитесь пользоваться библиотеками WordNet, FrameNet, spacy, nltk, stanza и Scikit-learn. Узнайте, как решить задачи на семантику и полярность: WSD, WSI, etc. Получите информацию об автокоррекции: как основном продукте и как подзадаче, которая решается в информационном поиске, NLU, переводе.
07 занятие
15.12
19:00
Языковые модели
Узнайте статистическую сторону языковой модели: вычисление вероятности следующего слова и формулу Байеса.
08 занятие
20.12
19:00
Введение в нейронные сети для NLP
Путь от NLP до Feed Forward. Узнайте, как тренировать и применять нейронные сети в NLP.
09 занятие
22.12
19:00
Нейронные архитектуры в NLP
Узнайте библиотеки для обучения, а также про использование популярных нейронных сетей в NLP, таких как рекуррентные, sequence to sequence и Transformer. Поймите концепции работы нейронных сетей — от первых моделей и до современных решений.
10 занятие
27.12
19:00
Нейронные сети на практике
Узнайте, как и где искать информацию или решения для нейронного NLP. Научитесь пользоваться открытыми библиотеками для нейронных архитектур.
11 занятие
10.01
19:00
NLP Задачи: кластеризация и классификация текста
Узнайте, о кластеризации и классификации текста. Научитесь моделировать темы и полярности: машинное обучение и BERT.
12 занятие
12.01
19:00
NLP задачи: NER и Q&A системы
Узнайте, как использовать NER (распознавание именованных сущностей) и решать задачи типа парсинг CV, вычленять имена, адресы, организации. Узнайте как работать со статистикой, нейронными сетями и библиотеками. А также получите информацию о Q&A (вопросно-ответной системе).
13 занятие
17.01
19:00
Создание чат-ботов (лекция)
Разберитесь в типах чат-ботов и научитесь выбирать тип исходя из задачи. Научитесь выбирать инструменты для создания разных чат-ботов. Получите базовые знания для создания простого чат-бота в DialogFlow.
14 занятие
19.01
19:00
Создание чат-ботов (практика)
Узнайте обо всех фичах DialogFlow: их предназначение и использование. Создайте простого FAQ-чат-бота в DialogFlow и научитесь деплоить его в Telegram.
15 занятие
24.01
19:00
NLP задачи: генерация и резюмирование текста
Научитесь решать задачи на генерацию текста. Узнайте, методы и библиотеки генерации текста. Освойте резюмирование текста, узнайте, какие нейронные сети и библиотеки для этого используются.
16 занятие
26.01
19:00
NLP-задачи: информационный поиск и машинный перевод
Узнайте, как устроен машинный перевод, распознавание, синтез речи и стандартные подходы к этим задачам. Научитесь работать со статистическим и нейронным подходами, а также с библиотеками: Transformers, Deepspeech, Kaldi, Opennmt, Marian.
17 занятие
31.01
19:00
Качество NLP-моделей
Научитесь улучшать качество NLP-моделей: аугментация текста, избавление от байеза в моделях. Оцените качество построенных моделей, изучите разные метрики, бенчмарки и таски.
18 занятие
02.02
19:00
Резюмирование курса
Изучите полный цикл NLP-проекта. Научитесь находить нужную информацию для задач, не покрытых в этом курсе. Реализуйте проект NLP-системы, презентуйте его и проанализируйте полученные результаты.
Кому будет полезен курс:
- Software Developers ⋃ Programmers
Которые хотят начать развиваться в области NLP и освоить разные методы решения NLP-задач: от простых статистических подходов — до нейронных сетей.
- Data Scientists ⋃ Machine Learning Engineers
Специалисты, которые хотят получить практический опыт работы в NLP-сфере, разобраться в фреймворках и библиотеках
- выйти на новый уровень и повысить свою квалификацию.
Необходимые знания:
Python
⟶ умеете программировать на этом языке
Machine Learning
⟶ владеете базовыми знаниями о машинном обучении и анализе данных
Библиотеки
⟶ умеете устанавливать сторонние библиотеки и знакомы с такими библиотеками как Bumpy, Pandas, Scikit-learn
Статистика
⟶ владеете базовыми знаниями статистики и теории вероятности
Лектор
Maria Obedkova NLP Engineer в TrustYou
- работает над прикладными проектами в NLP: от задач на понимание текста — до построения систем машинного перевода и распознавания речи
- разрабатывает решения для анализа продуктовых отзывов в мюнхенском офисе международной компании TrustYou
- активно следит за трендами в NLP и пишет статьи на NLP-темы
- получила стипендию Erasmus Mundus, проходила стажировку в Sony Europe и работала в ABBYY LS
- изучала специальность «Компьютерная лингвистика / NLP» в университетах NRU HSE, UPV/EHU и Univerzita Karlova v Praze
18 онлайн-занятий 2 занятия по чат-боту с приглашенным лектором 27 часов теории ⋃ практики24 ноября ― 31 января
Записаться Гостевой лектор:
После курса вы сможете:
- Решать фундаментальные задачи NLP: сплиттинг, токенизация, морфологический, синтаксический и семантический анализ
- Создавать и деплоить чат-боты в Telegram
- Использовать библиотеки Spacy, Nltk, Transformers и фреймворки
- Оценивать качество NLP-моделей и улучшать их
- Автоматически переводить тексты, распознавать устную речь, генерировать тексты
Заявка на курс
Оставьте заявку, мы свяжемся и уточним, подходит ли вам курс и сколько он стоит
-
18 занятий
-
Практика на каждом занятии
-
Разработка чат-бота