Получить доступ
Эксклюзивный партнер
Skillbox в Беларуси
burger
Каталог Аналитика и Data Science Machine Learning Junior

Machine Learning Junior

Вы освоите методы машинного обучения для анализа данных и решения сложных задач. Научитесь работать с разнообразными алгоритмами и моделями, оценивать их эффективность, а также подготавливать данные. Узнаете о соревнованиях Kaggle и научитесь к ним готовиться.

Кому подойдёт этот курс

  • Начинающим Data-аналитикам

    Тем, кто хочет получить навыки для анализа данных, прогнозирования и обработки текстов, чтобы применять их в исследованиях и проектах

  • Разработчикам и программистам

    Тем, кто хочет прокачать навыки линейной и логистической регрессии, деревьев решений, нейронных сетей и использовать их для создания интеллектуальных приложений и решений

  • Аналитикам данных и специалистам по ML

    Тем, кто хочет освоить расширенные методы кластеризации, работу с несбалансированными данными, анализ текстов и инфраструктуру ML для решения сложных задач и оптимизации процессов

Чему вы научитесь

  • Решать задачи Data Scientist, включая работу с признаками и матрицами

  • Работать с регрессией, классификацией и оценкой моделей

  • Работать с SQL, включая подзапросы и очистку данных

  • Применять линейную регрессию и работать с весами признаков через sklearn

  • Определять оптимальные параметры регуляризации для улучшения моделей

  • Применять метрическую классификацию, метод ближайших соседей и F-меру

  • Использовать библиотеки numpy для работы с векторами и матрицами

  • Создавать и настраивать логистическую регрессию, используя стохастический градиентный спуск

  • Работать с классификацией с помощью метода опорных векторов

Содержание курса

Вы освоите ключевые задачи и инструменты ML: от постановки задачи и основных терминов до написания нейронных сетей.

  1. Постановка задачи машинного обучения

    Освоите задачи Data Scientist, работу с признаками и матрицей объектов-признаков.

  2. Основные термины машинного обучения

    Познакомитесь с регрессией, классификацией, оценкой качества и переобучением моделей.

  3. Выгрузка данных с помощью SQL

    Овладеете навыками работы с SQL, подзапросами, очисткой данных и комбинированием функций.

  4. Линейная регрессия

    Научитесь линейной регрессии, весам признаков, решению через матрицы и использованию библиотеки sklearn.

  5. Регуляризация линейной регрессии

    Узнаете, как определить оптимальные параметры регуляризации для уменьшения ошибки модели.

  6. Метрическая классификация. Метод ближайших соседей и его развитие

    Освоите метод ближайших соседей, минимизацию времени обучения, матрицы ошибок, F-меру через sklearn.

  7. Библиотека Numpy

    Овладеете библиотекой numpy для работы с векторами и матрицами.

  8. Линейная классификация. Логистическая регрессия

    Узнаете, как построить логистическую регрессию, алгоритм стохастического градиентного спуска.

  9. Линейная классификация. Метод опорных векторов

    Освоите алгоритмы для классификации, решение проблем неразделимости и несбалансированных классов.

  10. Логическая классификация. Деревья решений

    Поймёте преимущества решающих деревьев, оценку через энтропию, ROC AUC, Information gain и Gini Impurity.

  11. Деревья решений и случайный лес

    Узнаете, как применять случайный лес и улучшить модель через кросс-валидацию и GridSearch.

  12. Очистка данных

    Научитесь подготавливать данные: обнаружение и удаление выбросов, нормализация, кодирование категориальных переменных.

  13. Кластеризация. Метод k-средних

    Научитесь решать задачу кластеризации через метод k-means с различными метриками.

  14. Интерпретация. Метод k-средних

    Поймёте выбор числа кластеров, статистическое описание и визуализацию кластеров через TSNE.

  15. Кластеризация. DBSCAN

    Научитесь использовать алгоритм DBSCAN для разных видов кластеров.

  16. Несбалансированные выборки

    Научитесь бороться с несбалансированными данными через Upsempling, Downsempling, взвешивание классов и оценку StratifiedKFold.

  17. Нейрон и нейронная сеть

    Изучите нейросети, сможете написать обучение одноуровневой нейронной сети на PyTorch.

  18. Основы анализа текстов

    Освоите методы обработки текстов, использование регулярных выражений, представление текста в виде вектора.

  19. Соревнование на Kaggle

    Освоите процесс участия в соревнованиях Kaggle и подготовку к ним.

  20. Инфраструктура для моделей машинного обучения

    Познакомитесь с Hadoop, Hive, MapReduce, Oozie для работы с большими данными и создания пайплайнов.

Записаться на курс или получить бесплатную консультацию
Имя
Телефон
Электронная почта
Отправить
Ознакомиться с условиями публичного договора
success
error
warning

Спикеры

  • Фотография Юлдуз Фаттахова Юлдуз Фаттахова

    Автор курса Senior Data Scientist, Team Lead, SberData, Сбер

  • Фотография Владимир Ершов Владимир Ершов

    Автор курса «Machine Learning». Data Solutions manager, Visa. В data science больше 7 лет

  • Фотография Николай Герасименко Николай Герасименко

    Data Scientist в Сбербанке, математик в ВЦ РАН. Блок «Основы математики для Data Science»

  • Фотография Пётр Емельянов Пётр Емельянов

    Спикер курса. R&D Director, UBIC Tech

  • Фотография Евгения Ракина Евгения Ракина

    Спикер курса. Data Engineer, Made

  • Фотография Светлана Обухова Светлана Обухова

    Спикер курса. Data Analyst, Ernst & Young

О Skillbox

Skillbox —
по качеству обучения. Вся теория записана с топовыми экспертами рынка, а практика максимально приближена к реальным рабочим задачам. Послушайте, что говорят те, кто уже достиг своих целей вместе со Skillbox.
Записаться на курс
-50%
972 BYN
1 944 BYN
percent Кешбэк 30%: 292 балла на Lerna
Machine Learning Junior
Длительность: 1 мес
Заполните контактные данные
Имя
Телефон
E-mail
Промокод
Название компании
Отправить заявку
Ознакомиться с условиями публичного договора
success
error
warning