Станьте дата-сайентистом: изучите науку о данных с преподавателями МФТИ и практикуйтесь на реальных кейсах
Старт
15 мая 2023
Длительность
12 месяцев
Формат
онлайн
МФТИ и Skillfactory
Документы об окончании
Our Website is Almost Ready
Launch a targeted campaign. Scale your infrastructure with our simple service.
Days
Hours
Minutes
Learn more
Программа разработана совместно с МФТИ
МФТИ — передовой научный центр и ведущий технический университет страны. Вы будете учиться у сильных преподавателей и тут же закреплять материал на практике.
Вместе с экспертами МФТИ мы:
Разработали 6 учебных модулей Организовали стажировки в IT-командах Ozon, МЭЦ и Axenix Дополнили программу кейсами от реального бизнеса: Билайн, Авито и Ozon Tech
№1
в рейтинге Superjob по уровню зарплат выпускников технических вузов
— медианная зарплата выпускника
250 000 ₽
удостоверение о повышении квалификации государственного образца — от МФТИ
диплом о профессиональной переподготовке — от Skillfactory
У нас есть государственная лицензия на обучение, поэтому после успешного окончания курса мы выдаем документы установленного образца. Они подтвердят вашу квалификацию:
Обрабатывают большие объемы неструктурированной информации и делают выводы, полезные для бизнеса и обычной жизни
Строят модели, чтобы предсказывать события
Обучают нейросети, чтобы они работали лучше и быстрее, чем обычные программы и алгоритмы
Как помогают бизнесу
Строят системы рекомендаций фильмов и сериалов для онлайн-кинотеатров
Прогнозируют спрос на определенные товары для маркетплейсов
Обрабатывают данные по заболеваниям, помогают ставить диагнозы и прогнозировать результаты лечения
Оценивают платежеспособность клиентов банков
Создают алгоритмы, которые помогают специалистам кол-центров отвечать на вопросы клиентов
Строят системы рекомендаций фильмов и сериалов для онлайн-кинотеатров
Прогнозируют спрос на определенные товары для маркетплейсов
Обрабатывают данные по заболеваниям, помогают ставить диагнозы и прогнозировать результаты лечения
Оценивают платежеспособность клиентов банков
Создают алгоритмы, которые помогают специалистам кол-центров отвечать на вопросы клиентов
Средняя зарплата специалиста по Data Science
250 000 ₽
70 000 ₽
150 000 ₽
начинающий дата-сайентист
middle-специалист со стажем 1,5 года
senior-специалист с опытом более 3 лет
Грамотный дата-сайентист нужен в IT, банках, телекоме, медицине, логистике, науке, ритейле; разработке стриминг-сервисов, умных устройств и беспилотных автомобилей.
Вернем деньги, если вы не найдете работу после окончания программы
Почему мы так говорим? Потому что уверены в навыках, которые даем на курсе, и их востребованности на рынке. А еще мы действительно заботимся о вашем трудоустройстве:
фокусируемся на практике и реальных кейсах во время обучения
помогаем подготовить резюме и научиться проходить все этапы собеседований
Кому подойдет курс
Вы никогда не работали в IT и у вас нет технического образования, но вам интересна эта профессия
Вы уже работаете программистом, но хотите расширить стек и освоить высшую математику для решения реальных задач
У вас есть опыт работы с данными, но не хватает навыков в работе с ML-моделями и data-engineering задачами
Кем именно вы будете работать
Внутри сферы есть несколько направлений. Выбрать то, что подойдет именно вам, в начале пути непросто. Поэтому мы предлагаем определиться со специализацией после первого полугодия, когда вы освоитесь в профессии и сможете сделать выбор осознанно.
Анализирует и обрабатывает огромные объемы информации, что позволяет автоматически принимать верные решения в бизнесе.
Создает нейросети и системы искусственного интеллекта для решения разных задач — боты-помощники, голосовые системы, аналитические сервисы.
Организует сбор, хранение и первоначальную обработку всех поступающих данных, на нем — ПО и алгоритмы для автоматизации задач.
AI Developer
ML Developer
Big Data Engineer
курс от МФТИ
курс от МФТИ
курс от МФТИ
Ваша карьера после обучения
NumPy
Python
Стек
Pandas
Matplotlib
Plotly
Scikit-learn
Catboost
Keras
PyTorch
Должность — специалист по Data Science
SQL
GitHub
Airflow
ClickHouse
Docker
Что я умею
/ Использовать основные конструкции и структуры данных Python
/ Применять методы математического анализа, линейной алгебры, статистики и теории вероятности для обработки данных
/ Анализировать и предобрабатывать данные с помощью библиотек Pandas, Seaborn, Matplotlib
/ Применять алгоритмы для рекомендательных систем
/ Получать данные из веб-источников или по API
/ Строить модели с использованием временных рядов
/ Создавать модели для решения DS-задач с помощью машинного обучения и оценивать их качество
/ Работать с GitHub и Kaggle
Matplotlib
Plotly
PyTorch
Scikit-learn
Pandas
NumPy
Keras
Catboost
В конце обучения мы предложим пройти стажировку в штате крупной технологической компании. Резюме наших выпускников в числе первых рассмотрят в Ozon, МЭЦ и Anexix. Вы сможете работать удаленно или в московском офисе от трех месяцев до одного года. Возможно трудоустройство с релокацией.
Программа стажировок у лидеров рынка
Ozon
МЭЦ
Anexix
Познакомиться с нашей учебной платформой
Понять, как проходит обучение дата-аналитике
Узнать, какие задачи студенты уже решают на курсе
Получить ответы на все вопросы об онлайн-программе
Покажем, как все устроено
Запишитесь на онлайн-презентацию программы, чтобы:
Программа ориентирована на тех, кто работает и хочет сам регулировать нагрузку. Занимайтесь на платформе от 8 до 12 часов в неделю
Понятная и важная теория — 30% обучения
Смотрите короткие видео и изучайте конспекты. Встречайтесь с экспертами онлайн 2 раза в неделю, чтобы разбирать неочевидные вопросы и примеры из индустрии.
Практика в разных форматах — 70% программы
У нас есть 5 видов практики: тренажеры, тесты, домашние задания, проекты и хакатоны. Решайте задачи и ошибайтесь. Получайте поддержку и обратную связь от кураторов, чтобы исправлять ошибки и расти как специалист день за днем.
Последние 8 недель на курсе посвящены кейсам индустриальных партнеров: Билайн, Ozon Tech и Авито. Вы сделаете несколько настоящих проектов под руководством куратора из компании-заказчика.
А в конце защитите свой проект перед жюри и получите сертификат. Этот опыт выделит вас среди остальных кандидатов и поможет найти работу.
Доверяем студентам серьезные задачи
Реальные проекты для вашего портфолио
Вот какие задачи вы решите во время обучения:
Сеть Галамарт — это более четырехсот магазинов товаров для дома по всей России. Вы создадите модель, которая поможет прогнозировать спрос на определенный продукт. и планировать закупки эффективнее
Департамент корпоративных клиентов 360 создает цифровые сервисы для бизнеса. Вам предстоит разработать модель динамического ценообразования для объектов недвижимости
Synergetic производит экологичные средства бытовой химии и ухода за собой. Кейс от компании — модель динамического ценообразования для интернет-магазина, которая определит лучшую цену для клиента
Преподаватели и авторы программы
Наши эксперты знают, что происходит на рынке и какие навыки точно пригодятся студентам.
Преподаватель
Иоанн Довгополый
Основы программирования на Python
Преподавал в НИУ ВШЭ и занимался аналитикой в ЭКОПСИ Консалтинг
Дисциплины
Ранее
Старший инженер разработки, Сбербанк
Автор, Преподаватель
Маргарита Бурова
Выравнивающий курс по математике
Разработала два онлайн-курса для национальной платформы OpenEdu
Дисциплины
Ранее
Старший преподаватель НИУ ВШЭ
Опыт: более 10 лет
Опыт: 5 лет
Опыт: 9 лет
Преподаватель
Андрей Глинский
Математика и алгоритмы машинного обучения
Аналитик-разработчик в Competentum Group (EPAM) и заместитель зав. отделом трансфера технологий ФТИ им. Иоффе РАН
Ранее
Дисциплины
Ведущий программист-разработчик, НИЦ МФТИ
Основатель консалтинговой компании IT Boutique
Дисциплины
Ранее
Получил степень кандидата химических наук, работал на позиции data engineer в Леруа Мерлен
Инжиниринг данных
Николай Троицкий
Преподаватель
Опыт: более 15 лет
Ведущий разработчик First Line Software
Дисциплины
Ранее
Lead Developer в компании First Line Software
Глубокое обучение в науках о данных
Яромир Шпилевский
Преподаватель
Опыт: более 3 лет
Академический директор программы
Леонид Саночкин
Научный сотрудник исследовательского института AIRI
Более 10 лет опыта в прикладных и фундаментальных исследованиях NLP и ИИ
Основная область исследований — Active learning in NLP
Автор публикаций в рецензируемых журналах ВАК
В Skillfactory прошли обучение45 000 студентов
Теперь они работают в этих компаниях
Инженерная школа с рейтингом
4,7
по отзывам студентов
4,7
4,6
4,5
4,6
79
%
Сравнятор
Центр карьеры будет сопровождать вас во время учебы и даже после
По данным Центра карьеры Skillfactory:
77%
81%
студентов достигли поставленной цели
студентов получили приглашение на собеседование
Создадите вместе с сотрудником Центра карьеры продающее резюме
/ Консультация
Наметите карьерный трек на онлайн-встрече с карьерным консультантом
/ Тренажер собеседований
Потренируетесь проходить техническое собеседование на интервью с HR-менеджером
/ Резюме
Дополнительное карьерное сопровождение
Карьерные митапы
Разборы кейсов и резюме в закрытой группе
Рекомендации от карьерных консультантов, коучей, IT-рекрутеров
3 недели сопровождения на этапе выхода на рынок труда
Программа
Раздел 1. Начало пути. Математика. Программирование на Python. Алгоритмы ML
Вы научитесь применять язык Python для задач анализа данных, поймете, каким образом математика помогает анализировать и систематизировать огромные массивы данных, освоите ключевые алгоритмы машинного обучения.
Погрузитесь в процессы обучения, познакомитесь с одногруппниками и командой курса
Особенности и лайфхаки онлайн-обучения
Как проходит обучение на специальности Data Science
Как мы оцениваем студентов
Центр карьеры SkillFactory
Возможности и культура общения в сообществе Skillfactory
Навигация учебной платформы
Вспомните основы математики и получите необходимую базу для старта в Data Science.
Числа и выражения
Уравнения и неравенства
Основные понятия теории функций
Основы геометрии: планиметрия, тригонометрия и стереометрия
Множества, логика и элементы статистики
Комбинаторика
Решение задач
Изучите основы разработки на Python. Решите типовые задачи, которые возникают перед любым разработчиком.
Типы данных: числа, строки, списки, словари, множества
Основные конструкции языка: условный оператор и циклы
Функции
Стандарт PEP-8
Решение практических задач
Освоите основные концепции машинного обучения и создадите свои первые модели
Построение и валидация моделей
ML-библиотеки для решения такого типа задачи
Обучение и валидация ML-модели
Интерпретирование и анализ результатов работы модели
Презентация результатов работы коллегам
Оптимизация гиперпараметров модели
Генерация и отбор новых признаков для повышения качества модели
Изучите объекто-ориентированное программирование и алгоритмы. Научитесь работать с системами контроля версий.
Использование командной строки Linux гитом/github: add/commit/rebase/push
Подходы к разработке проекта (Agile, Scrum, Crisp-dm)
Настройка софта для работы в Data Science (Jupyter, IDE, pip)
Анализ, визуализация и обработка данных с помощью Python
Раздел 2. Основа профессии. Инжиниринг данных. Менеджмент. Глубокое обучение
Вы научитесь собирать, обрабатывать и хранить данные. Познакомитесь с методами глубокого обучения и основными фреймворками для работы с нейронными сетями.
Познакомитесь с методами структурированного хранения данных, сможете проектировать базы данных, применять SQL
Современные хранилища данных
Экосистема Hadoop
Источники данных и работа с ними
Apache Spark и обработка данных
Hadoop как хранилище данных
Apache Airflow для оркестрации конвейеров
Обзор облачных хранилищ
Научитесь решать прикладные задачи, изучив архитектуру и алгоритмы обучения нейронных сетей
Введение в нейронные сети
Фреймворки для глубокого обучения
Сверточные нейронные сети
Задача оптимизации
Современное компьютерное зрение: Fine-tuning & Transfer Learning
Сегментация. Проектирование собственной архитектуры
Детектирование объектов
Введение в NLP и рекуррентные сети
Нейронные сети в NLP
Обучение с подкреплением (Reinforcement Learning)
Раздел 3. Индивидуальный образовательный трек. Специализации на выбор: Big Data, Natural Language Processing, Computer Vision, Production
Вы изучите современные архитектуры моделей и научитесь их использовать для решения задач обработки изображений и текстов, познакомитесь с технологиями вывода моделей в промышленную эксплуатацию (Production)
Сможете предобработать данные, построить, обучить и протестировать модель для основных задач анализа естественного языка
Основные NLP-задачи и их использование в бизнесе
Векторные представления слов
Математика для нейронных сетей
Рекуррентные нейронные сети и задача NER
Hard & Software
Языковое моделирование и задача генерации текста
Задача машинного перевода
Механизм Attention
Attention is all you need
Transformer is all you need
Диалоговые системы
Сможете предобработать данные, построить, обучить и протестировать модель для основных задач компьютерного зрения
Работа с изображениями
Hard & Software
Построение моделей в Keras
Задача классификации изображений
Сверточные нейросети
Семейство архитектур ResNet
Перенос обучения в CV
Распознавание объектов
Семейство R-CNN и YOLO
Сможете применять возможности веб-программирования для настройки бэкенд-составляющей ML-продукта и создания визуального прототипа (MVP) проекта
Временные ряды
Рекомендательные системы
Статистические модели прогнозирования
Интерполяция и семплирование
Глубокое обучение
Сохранение и загрузка моделей: pickle и joblib
Подготовка модели к продакшену и деплой
Написания сервера на Flask
Научитесь строить рекомендательные системы, использовать байесовкие и ядерные методы для задач классификации/регрессии
Задача прогнозирования временных рядов
Экспоненциальное скользящее среднее
Адаптивная авторегрессионная модель
Следящий контрольный сигнал
Адаптивная селективная модель
Локальная адаптация весов с регуляризацией
Алгоритм Priori и FP-growth
Рекуррентные нейронные сети (RNN)
Сверточные нейронные сети (CNN)
Сети долгой кратковременной памяти (Long short-term memory, LSTM)
Рекуррентная сеть Gated Recurrent Unit (GRU)
Автокодировщики. Векторные представления дискретных данных
Перенос обучения (transfer learning)
Самообучение (self-supervised learning)
Генеративные состязательные сети (generative adversarial network)
Алгоритм ComBoost
Стохастические методы: бэггинг и метод случайных подпространств
Признаки в задаче ранжирования поисковой выдачи: текстовые, ссылочные, кликовые
Критерии качества ранжирования: Precision, MP, UC, DCG, NDCG, pFound
Ранговая классификация, OC SVM
Попарный подход: RankingSVM, RankNet, LambdaRank
Групповой проект по решению индустриальной аутентичной задачи / разработке нового решения для отрасли
Этапы работы над проектом: 1. перевод бизнес задач в язык Data Science 2. анализ предметной области. Анализ работ по проблеме, которую решают студенты 3. адаптация метода или разработка нового к решению задачи 4. валидация своего решения