Всем привет! Мы делаем новый запуск курса Natural Language Processing. В этом семестре решили существенно переделать курс. Теперь он состоит из основных 8 занятий, посвященных разным ключевым темам NLP. Если кратко:
Закон Ципфа;
TF-IDF;
RNN;
CNN;
Transformer;
LLM.
Это набор инструментов, но конечно мы рассмотрим и задачи - классификации текста, тэггирования, генерации, которая сейчас является наверное основной задачей всего NLP. Каждое занятие будет состоять из лекции и семинара. Полный список тем можно посмотреть на странице курса.
В этом запуске мы посвятим больше времени большим языковым моделям (LLM). Про ChatGPT в наше время не слышал только ленивый, но про него можно рассказать только слухи, поэтому я расскажу об открытых моделях, таких как Llama и Mistral, а на семинаре можно будет поработать с этими моделями.
Также в курсе традиционно будет два задания, одно на вышеупомянутый Word2Vec, одно в виде соревнования наподобие тех, что проводят на платформе Kaggle. Оба задания были недавно обновлены и, надеюсь, стали более интересными.
Помимо 8 основных занятий, будет 5 дополнительных лекций по разным темам NLP, в частности про диалоговые системы и NLP для кода. Скорее всего получится сделать гостевую лекцию про обработку речи.
Лекции и семинары будут онлайн. После каждой лекции будет квиз. Сдача заданий и квизов будет происходить на платформе ODS. Самое важное, на мой взгляд, что большую часть курса составляет создание собственного проекта. Проект - это произведение одного или нескольких людей, которые делают одну программу, модель машинного обучения либо корпус текстов. Проекты прошлых запусков можно найти на сайте ODS.
Пару слов о ведущих курса. Я буду читать лекции, в области NLP я работаю последние 10 лет, успел поработать в Яндексе и ВКонтакте, защитить кандидатскую диссертацию. Больше информации про меня здесь. В этом семестре семинары опять будет вести Салават, за что ему большое спасибо. В этом запуске мы сотрудничаем с двумя вузами: ИТМО и Бауманкой. Если вы студент одного из этих вузов, то можно попробовать зачесть курс, как учебный.
В этом запуске все общение по курсу будет концентрировать в группе в Telegram.
Лекции будут проходить по четвергам в 19:00. Ссылка будет в группе и на странице курса. Первое занятие - 12 сентября, присоединяйтесь!
Надеюсь, я вас заинтересовал, еще раз ссылка на курс.
Обсудить