Machine Learning Junior

Вы освоите методы машинного обучения для анализа данных и решения сложных задач. Научитесь работать с разнообразными алгоритмами и моделями, оценивать их эффективность, а также подготавливать данные. Узнаете о соревнованиях Kaggle и научитесь к ним готовиться.

Никакой “воды” только нужные и актуальные знания
Обучение в удобное время учитесь в комфортном для себя темпе
Бессрочный доступ ко всем материалам курса
Старт обучения Набор группы закрыт

Кому подойдёт этот курс

Начинающим Data-аналитикам
Тем, кто хочет получить навыки для анализа данных, прогнозирования и обработки текстов, чтобы применять их в исследованиях и проектах
Разработчикам и программистам
Тем, кто хочет прокачать навыки линейной и логистической регрессии, деревьев решений, нейронных сетей и использовать их для создания интеллектуальных приложений и решений
Аналитикам данных и специалистам по ML
Тем, кто хочет освоить расширенные методы кластеризации, работу с несбалансированными данными, анализ текстов и инфраструктуру ML для решения сложных задач и оптимизации процессов

Чему вы научитесь

Решать задачи Data Scientist, включая работу с признаками и матрицами
Работать с регрессией, классификацией и оценкой моделей
Работать с SQL, включая подзапросы и очистку данных
Применять линейную регрессию и работать с весами признаков через sklearn
Определять оптимальные параметры регуляризации для улучшения моделей
Применять метрическую классификацию, метод ближайших соседей и F-меру
Использовать библиотеки numpy для работы с векторами и матрицами
Создавать и настраивать логистическую регрессию, используя стохастический градиентный спуск
Работать с классификацией с помощью метода опорных векторов

Постановка задачи машинного обучения

Освоите задачи Data Scientist, работу с признаками и матрицей объектов-признаков.
Основные термины машинного обучения

Познакомитесь с регрессией, классификацией, оценкой качества и переобучением моделей.
Выгрузка данных с помощью SQL

Овладеете навыками работы с SQL, подзапросами, очисткой данных и комбинированием функций.
Линейная регрессия

Научитесь линейной регрессии, весам признаков, решению через матрицы и использованию библиотеки sklearn.
Регуляризация линейной регрессии

Узнаете, как определить оптимальные параметры регуляризации для уменьшения ошибки модели.
Метрическая классификация. Метод ближайших соседей и его развитие

Освоите метод ближайших соседей, минимизацию времени обучения, матрицы ошибок, F-меру через sklearn.
Библиотека Numpy

Овладеете библиотекой numpy для работы с векторами и матрицами.
Линейная классификация. Логистическая регрессия

Узнаете, как построить логистическую регрессию, алгоритм стохастического градиентного спуска.
Линейная классификация. Метод опорных векторов

Освоите алгоритмы для классификации, решение проблем неразделимости и несбалансированных классов.
Логическая классификация. Деревья решений

Поймёте преимущества решающих деревьев, оценку через энтропию, ROC AUC, Information gain и Gini Impurity.
Деревья решений и случайный лес

Узнаете, как применять случайный лес и улучшить модель через кросс-валидацию и GridSearch.
Очистка данных

Научитесь подготавливать данные: обнаружение и удаление выбросов, нормализация, кодирование категориальных переменных.
Кластеризация. Метод k-средних

Научитесь решать задачу кластеризации через метод k-means с различными метриками.
Интерпретация. Метод k-средних

Поймёте выбор числа кластеров, статистическое описание и визуализацию кластеров через TSNE.
Кластеризация. DBSCAN

Научитесь использовать алгоритм DBSCAN для разных видов кластеров.
Несбалансированные выборки

Научитесь бороться с несбалансированными данными через Upsempling, Downsempling, взвешивание классов и оценку StratifiedKFold.
Нейрон и нейронная сеть

Изучите нейросети, сможете написать обучение одноуровневой нейронной сети на PyTorch.
Основы анализа текстов

Освоите методы обработки текстов, использование регулярных выражений, представление текста в виде вектора.
Соревнование на Kaggle

Освоите процесс участия в соревнованиях Kaggle и подготовку к ним.
Инфраструктура для моделей машинного обучения

Познакомитесь с Hadoop, Hive, MapReduce, Oozie для работы с большими данными и создания пайплайнов.

Спикеры

Юлдуз Фаттахова
Автор и спикер курса Machine Learning Engineer. AI Product Manager, SberData, Сбер Банк
Владимир Ершов
Data Solutions Manager, VISA
Николай Герасименко
Data Scientist в Сбербанке, математик в ВЦ РАН. Блок «Основы математики для Data Science»
Пётр Емельянов
Спикер курса. R&D Director, UBIC Tech
Евгения Ракина
Data Engineer, Made
Светлана Обухова
Data Analyst, Ernst & Young

О Skillbox

Skillbox — по качеству обучения. Вся теория записана с топовыми экспертами рынка, а практика максимально приближена к реальным рабочим задачам. Послушайте, что говорят те, кто уже достиг своих целей вместе со Skillbox.

Записаться на курс

-50%

937 BYN

1 874 BYN

Кешбэк 30%: 282 балла на Lerna

Machine Learning Junior

Длительность: 1 мес

Заполните контактные данные

Имя

Телефон

E-mail

У меня есть промокод

Промокод

Я юридическое лицо

Название компании

Отправить заявку

Даю согласие на обработку персональных данных, в том числе с целью получения информации о новых продуктах, демо доступах, скидках, персонализированных предложениях, акциях и полезных вебинарах на следующих условиях

Ознакомиться с условиями публичного договора

Астана
Ташкент
Кишинев
Минск
Бишкек
Москва
Ереван
Баку

Брест
Витебск
Гомель
Гродно
Могилев
Бобруйск
Барановичи

Алматы
Шымкент
Наманган
Самарканд
Кишинев
Тирасполь
Бельцы

Machine Learning Junior

Кому подойдёт этот курс

Чему вы научитесь

Содержание курса

Постановка задачи машинного обучения

Основные термины машинного обучения

Выгрузка данных с помощью SQL

Линейная регрессия

Регуляризация линейной регрессии

Метрическая классификация. Метод ближайших соседей и его развитие

Библиотека Numpy

Линейная классификация. Логистическая регрессия

Линейная классификация. Метод опорных векторов

Логическая классификация. Деревья решений

Деревья решений и случайный лес

Очистка данных

Кластеризация. Метод k-средних

Интерпретация. Метод k-средних

Кластеризация. DBSCAN

Несбалансированные выборки

Нейрон и нейронная сеть

Основы анализа текстов

Соревнование на Kaggle

Инфраструктура для моделей машинного обучения

Спикеры

О Skillbox

Получите

16 000 рублей — средняя выплата за 1 покупку по рекомендации в 2023

за рекомендацию курса

Machine Learning Junior

Кому подойдёт этот курс

Чему вы научитесь

Постановка задачи машинного обучения

Основные термины машинного обучения

Выгрузка данных с помощью SQL

Линейная регрессия

Регуляризация линейной регрессии

Метрическая классификация. Метод ближайших соседей и его развитие

Библиотека Numpy

Линейная классификация. Логистическая регрессия

Линейная классификация. Метод опорных векторов

Логическая классификация. Деревья решений

Деревья решений и случайный лес

Очистка данных

Кластеризация. Метод k-средних

Интерпретация. Метод k-средних

Кластеризация. DBSCAN

Несбалансированные выборки

Нейрон и нейронная сеть

Основы анализа текстов

Соревнование на Kaggle

Инфраструктура для моделей машинного обучения

Спикеры

О Skillbox

Остались вопросы об оплате?

Получите 16 000 ₽ 16 000 рублей — средняя выплата за 1 покупку по рекомендации в 2023 Понятно за рекомендацию курса

Получите

16 000 рублей — средняя выплата за 1 покупку по рекомендации в 2023

за рекомендацию курса