Анализ естественного языка (NLP) в лингвистике и IT
Онлайн-магистратура по Data Science
Количество мест ограничено
Даты обучения: сентябрь 2023 года – июнь 2025 года
Формат: очная магистратура в онлайн формате
Освойте востребованное направление внутри Data Science
Станьте экспертом в развитии искусственного интеллекта с дипломом магистра ТГУ
Развивайте сервисы вроде ChatGPT, Алисы, Маруси, Siri
Прием документов завершен
Days
Hours
Minutes
Seconds
Программа ТГУ и Skillfactory — первая в России онлайн-магистратура по Data Science в сфере NLP (обработки естественного языка)
Направление 45.04.03 Фундаментальная и прикладная лингвистика
Получите диплом магистра ТГУ
Тренажеры, хакатоны, мастер-классы, доступ к суперкомпьютеру вуза
Закрепите знания и навыки на практике
Кейсы предоставляют Яндекс Диалоги и «Эксмо»
Решите бизнес-задачи для портфолио
Необязательно при поступлении знать одну из дисциплин, на программе вы изучите обе — от простого к сложному
Программа составлена в 2023 году по международным стандартам. Ее академдиректор руководит NLP-разработками в «Сбере»
Разовьете лингвистические и математические навыки
Станете NLP-инженером высокого класса
Если для комфортного обучения вам не хватает знаний в базовой математике
Пройдете бесплатный адаптационный курс
02
05
01
04
03
06
Оставьте заявку
Готовы попробовать? Оставьте контакты и мы свяжемся с вами.
NLP (Natural Language Processing) — раздел Data Science, который изучает алгоритмы машинного обучения в сфере обработки и воспроизведения человеческой речи, чтобы решать задачи бизнеса
Инженерная специальность
Растущий рынок
Комфортный вход в профессию
На стыке программирования и лингвистики
Цифровые помощники, нейронные сети, машинный перевод и магия ChatGPT
Знания и навыки в привязке к актуальным задачам бизнеса
Эта программа подойдет:
Чтобы поступить на магистерскую программу, нужен диплом бакалавра или специалиста по любому направлению
Бакалаврам технических направлений
Получите специализацию в обучении и развитии искусственного интеллекта через распознавание и генерацию речи
Бакалаврам гуманитарных направлений
Дата-сайентистам, продуктовым аналитикам и аналитикам данных
Получите дополнительную квалификацию в работе с данными, чтобы соединить образование с карьерой в IT-сфере
Освоите методы обработки естественного языка, чтобы эффективно решать задачи анализа текстовых массивов данных
Специалистам в NLP
Углубите и систематизируете знания в сфере NLP-исследований, чтобы увидеть новые пути развития ваших проектов
Специалистам по исследованиям аудитории
Лингвистам и филологам
Узнаете, как автоматизировать анализ больших текстов, чтобы определить предпочтения аудитории, изучить рынок и продукт
Научитесь применять профессиональные знания для разработки новых цифровых продуктов и умных систем
Узнайте подробнее о поступлении
Оставьте заявку
ТГУ — первый университет Сибири. Его научные сотрудники решают инженерные задачи в сфере здравоохранения, экологии, развития человека и общества.
Преподаватели вуза будут вести учебные дисциплины и руководить исследовательскими проектами.
Топ 2%
8 место
20 место
лучших вузов мира в Глобальном агрегированном рейтинге (ГАР) 2023
в Национальном рейтинге университетов по версии «Интерфакс» 2022
в рейтинге Forbes «Лучшие российские университеты 2022»
Партнер магистратуры — Яндекс Диалоги. Это платформа для разработчиков, которая позволяет создавать голосовые приложения для Алисы и Умного дома Яндекса
Что дают хакатоны:
актуальные учебные материалы Яндекса по работе с сервисами компании
→
→
→
возможность монетизировать разработанный продукт
сильный кейс в портфолио
Хакатон 1
Создание навыка для голосового помощника Алисы
Студенты пройдут полный цикл разработки продукта на основе NLP-технологий под руководством опытных менторов
Хакатон 2
Доработка навыка с использованием машинного обучения
Командная работа над задачей более сложного уровня. Эксперты дадут обратную связь и оценят результат
Практика — реальные задачи от ведущих российских IT-компаний
Гибкий график
Лекции, семинары и практикумы — онлайн, с возможностью просмотра записей 24/7
Практический опыт
Фундаментальное образование
Вы будете учиться на реальных задачах партнеров ТГУ и Skillfactory. К концу программы соберете кейсы в портфолио
В конце каждого семестра — экзамены, а в конце программы — групповой выпускной проект или защита магистерской диссертации
Комфортная нагрузка
На обучение потребуется 15-20 часов в неделю, включая выполнение домашних заданий
Как это — учиться в онлайн-магистратуре
Суперкомпьютер для учебных проектов
С помощью суперкомпьютерного центра CYBERIA от ТГУ вы сможете обучать нейронные сети и решать самые сложные задачи NLP
Подтвердите знания дипломом магистра
Он поможет выгодно выделиться среди других соискателей при устройстве на работу. На выходе вы получите диплом магистра от ТГУ, а во время обучения у вас будет студенческий билет, который дает дополнительные льготы.
Вы получите диплом очной магистратуры ТГУ
Что говорят выпускники о наших магистратурах
Лебедев Александр
Год выпуска: 2023
Для меня, как для психолога по образованию, магистратура по инженерии машинного обучения стала вызовом...
Проверим ваше понимание уравнений и неравенств, основ статистики и комбинаторики, теории функций и вероятностей. Дадим инструкции и материалы для подготовки
Заключите договор и внесите оплату
Отправим документы на вашу почту и будем ждать сканы с подписью
Шаг 5
Дождитесь результатов экзамена
Информация о появится в личном кабинете ТГУ, а также мы продублируем ее на вашу электронную почту
Кем вы сможете работать после магистратуры
Data Engineer (NLP)
Data Scientist (NLP)
NLP Researcher
Отвечают за сбор и хранение данных в компании
Выполняют операции с огромными массивами данных — выгрузку, подготовку, предобработку и нормализацию
Готовят выгрузки и представления данных для обучения моделей
Строят Dev/MLOps- пайплайны обработки данных — последовательности этапов, через которые проходят данные перед загрузкой в модель
Переводят запросы бизнеса в задачи NLP
Создают алгоритмы, чтобы извлекать информацию из текста или устной речи
Учитывают закономерности и особенности языка, чтобы создать алгоритмы, которые проверяют гипотезы бизнеса — например, об отношении аудитории к новому продукту
Готовят данные для машинного обучения
Исследуют работу искусственного интеллекта и возможности его применения
Используют инструменты для анализа и обработки данных для выявления закономерностей в данных
Анализируют ЦА продукта, продуктовые метрики, рынок
Извлекают из данных инсайты, ценность для бизнес-задач
Аналитик- исследователь данных
Ведут научную работу, пишут статьи и участвуют в конференциях
Развивают методологии машинного обучения для решения NLP-задач
Выполняют исследования на стыке Data Science и прикладных областей знаний — например, маркетинга, социологии, экономики
Предлагают новые архитектуры алгоритмов и создают прототипы решений с использованием научных разработок
до 1,5 лет опыта
1,5–3 года опыта
от 3 лет опыта
150 000 ₽
Middle-специалист
Средняя зарплата специалистов в сфере NLP
Дата-сайентистов, исследователей и инженеров NLP ищут на hh.ru и Хабре маленькие стартапы и гигантские экосистемы, финтех-сервисы и онлайн-ритейлеры, консалтинговые агентства и исследовательские центры. Вот что предлагают в среднем по рынку:
80 000 ₽
Junior-специалист
300 000 ₽
Senior-специалист
А пока вы выбираете магистратуру, NLP-технологии уже проникают в нашу жизнь:
Квинтэссенция NLP-технологий. Алгоритмы нейросети выполняют машинный перевод, структурируют и анализируют текстовую информацию и синтезируют текстовый ответ
Виртуальный ассистент, который использует NLP-технологии для обработки запросов в службы поддержки своих приложений, а также для исследования аудитории и развития продуктов и сервисов
Голосовой помощник, запущенный компанией «ВКонтакте» в 2019 году. Под капотом у сервиса NLP-технологии, которые структурируют человеческую речь и генерируют ответы
Data Mining
Визуализация данных
Тестирование моделей
Feature Engineering
Обучение моделей
Промышленная эксплуатация моделей
Работа с базами данных
Бизнес-коммуникация
Работа с научными статьями
Проведение исследований
Препроцессинг данных
Работа с генеративными нейросетями
Получение, выгрузка, обработка и анализ данных при помощи актуальных фреймворков
Использование языка Python для графического отображения закономерностей в данных
Проведение экспериментов и оценка результатов обучения машин
Извлечение из данных «фичей», которые помогают в анализе текстов и обучении моделей
Создание алгоритмов, по которым машины будут учиться работать с текстом
MLOps — внедрение и повышение продуктивности текстовых моделей, чтобы сделать сервис быстрым и производительным
Оптимизация хранения и обработки больших массивов данных, в том числе
Взаимодействие с заказчиком, преобразование бизнес-задачи в задачу NLP
Мониторинг новейших технологий и внедрение их в архитектуру решения
Подготовка текстовых данных для последующей машинной обработки
Инструмент визуализации данных
Создание алгоритмов синтеза ответов на запросы пользователя
В магистратуре вы научитесь:
01
02
03
Инструменты и навыки, которые вы освоите:
Писать код на Python
Создавать алгоритмы, которые собирают, обрабатывают и анализируют текстовые данные
Обучать NLP-алгоритмы/ нейросети
Учить машины распознавать и анализировать человеческую речь и генерировать ответы
Проводить исследования инструментами NLP
Проверять бизнес-идеи и научные гипотезы с использованием методов анализа естественного языка
Программа магистратуры
Мы собрали вместе дисциплины, которые развивают лингвистическое и математическое мышление для решения практических задач в области речевых технологий.
В первом полугодии у вас будут базовые курсы по компьютерной лингвистике, математике и программированию, а со второго семестра — много практики и углубленные спецкурсы по применению NLP в разных сферах IT и лингвистики.
2 года
19 учебных курсов
70% практической работы
120 зачетных единиц
1-й семестр
сентябрь-январь
Погружение в специальность
2 зачетных единицы
Адаптивный выравнивающий курс базовой математики
4 зачетных единицы
Статистические методы в гуманитарных исследованиях
5 зачетных единиц
Программирование на Python: базовый курс
3 зачетных единицы
Лингвистика в контексте современного гуманитарного и естественнонаучного знания
4 зачетных единицы
Деловой иностранный язык
Базы данных I
2 зачетных единицы
1 зачетная единица
Операционная система Linux
4 зачетных единицы
Лидерство и командообразование
Семинар по исследовательской и проектной деятельности
Зимняя сессия
3 зачетных единицы
2-й семестр
февраль–июнь
Работа с данными и машинное обучение
4 зачетных единицы
Продвинутая математика
2 зачетных единицы
Базы данных II
5 зачетных единиц
Основы машинного обучения
2 зачетных единицы
Обработка лингвистической информации: язык и мозг
5 зачетных единиц
Задачи NLP в машинном обучении
Продвинутые запросы SQL
2 зачетных единицы
Учебная практика — дататон
3 зачетных единицы
Семинар по исследовательской и проектной деятельности
Научно-исследовательская работа
Летняя сессия
3-й семестр
сентябрь–январь
NLP в диалоговых системах и языковых исследованиях
4 зачетных единицы
Иностранный язык для IT- специалистов
3 зачетных единицы
Генеративные задачи в NLP I
5 зачетных единиц
Нейронные сети в продуктивной среде
3 зачетных единицы
Инжиниринг данных
4 зачетных единицы
Современные подходы к решению задач Information Extraction
Экспериментальные методы лингвистического исследования
3 зачетных единицы
Учебная практика
3 зачетных единицы
Семинар по исследовательской и проектной деятельности
Научно-исследовательская работа
Зимняя сессия
4-й семестр
февраль–июнь
Углубленное изучение технологий NLP
Сформируете целостное представления о ведущих принципах врачебной этики и рассмотрите этические вопросы анализа биомедицинских данных и ML-технологий
Сможете вести профессиональную деятельность опираясь на философское осмысление изменений происходящие в IT и биомедицинской сферах, их влияния на социальную и духовную жизнь общества
Зачет
Итоговая сессия
Последние экзамены, защита выпускных проектов и магистерских диссертаций.
Преддипломная практика
Получите опыт решения практических бизнес-задач и подготовитесь к защите выпускной работы.
Генеративные задачи в NLP II
4 зачетных единицы
Освоите обучение нейросети для контролируемой генерации ответов в диалоговом режиме. Изучите подходы к Prompt engineering/Tuning.
Подайте документы и получите уже сейчас:
Подготовительный курс
Приглашение на дни открытых дверей
Участие в круглых столах и воркшопах
01
02
03
Поможет поступить в магистратуру: в материалах есть темы, которые будут на вступительных
Узнавайте первыми о мероприятиях программы, познакомьтесь с преподавателями и экспертами
Проходите важные темы и решайте практические задачи с вступительных вместе с экспертами