Machine Learning Junior
Вы освоите методы машинного обучения для анализа данных и решения сложных задач. Научитесь работать с разнообразными алгоритмами и моделями, оценивать их эффективность, а также подготавливать данные. Узнаете о соревнованиях Kaggle и научитесь к ним готовиться.
- Никакой “воды” только нужные и актуальные знания
- Обучение в удобное время учитесь в комфортном для себя темпе
- Бессрочный доступ ко всем материалам курса
- Старт обучения Набор группы закрыт
Кому подойдёт этот курс
- Начинающим Data-аналитикам
Тем, кто хочет получить навыки для анализа данных, прогнозирования и обработки текстов, чтобы применять их в исследованиях и проектах
- Разработчикам и программистам
Тем, кто хочет прокачать навыки линейной и логистической регрессии, деревьев решений, нейронных сетей и использовать их для создания интеллектуальных приложений и решений
- Аналитикам данных и специалистам по ML
Тем, кто хочет освоить расширенные методы кластеризации, работу с несбалансированными данными, анализ текстов и инфраструктуру ML для решения сложных задач и оптимизации процессов
Чему вы научитесь
-
Решать задачи Data Scientist, включая работу с признаками и матрицами
-
Работать с регрессией, классификацией и оценкой моделей
-
Работать с SQL, включая подзапросы и очистку данных
-
Применять линейную регрессию и работать с весами признаков через sklearn
-
Определять оптимальные параметры регуляризации для улучшения моделей
-
Применять метрическую классификацию, метод ближайших соседей и F-меру
-
Использовать библиотеки numpy для работы с векторами и матрицами
-
Создавать и настраивать логистическую регрессию, используя стохастический градиентный спуск
-
Работать с классификацией с помощью метода опорных векторов
Содержание курса
Вы освоите ключевые задачи и инструменты ML: от постановки задачи и основных терминов до написания нейронных сетей.
-
Постановка задачи машинного обучения
Освоите задачи Data Scientist, работу с признаками и матрицей объектов-признаков.
-
Основные термины машинного обучения
Познакомитесь с регрессией, классификацией, оценкой качества и переобучением моделей.
-
Выгрузка данных с помощью SQL
Овладеете навыками работы с SQL, подзапросами, очисткой данных и комбинированием функций.
-
Линейная регрессия
Научитесь линейной регрессии, весам признаков, решению через матрицы и использованию библиотеки sklearn.
-
Регуляризация линейной регрессии
Узнаете, как определить оптимальные параметры регуляризации для уменьшения ошибки модели.
-
Метрическая классификация. Метод ближайших соседей и его развитие
Освоите метод ближайших соседей, минимизацию времени обучения, матрицы ошибок, F-меру через sklearn.
-
Библиотека Numpy
Овладеете библиотекой numpy для работы с векторами и матрицами.
-
Линейная классификация. Логистическая регрессия
Узнаете, как построить логистическую регрессию, алгоритм стохастического градиентного спуска.
-
Линейная классификация. Метод опорных векторов
Освоите алгоритмы для классификации, решение проблем неразделимости и несбалансированных классов.
-
Логическая классификация. Деревья решений
Поймёте преимущества решающих деревьев, оценку через энтропию, ROC AUC, Information gain и Gini Impurity.
-
Деревья решений и случайный лес
Узнаете, как применять случайный лес и улучшить модель через кросс-валидацию и GridSearch.
-
Очистка данных
Научитесь подготавливать данные: обнаружение и удаление выбросов, нормализация, кодирование категориальных переменных.
-
Кластеризация. Метод k-средних
Научитесь решать задачу кластеризации через метод k-means с различными метриками.
-
Интерпретация. Метод k-средних
Поймёте выбор числа кластеров, статистическое описание и визуализацию кластеров через TSNE.
-
Кластеризация. DBSCAN
Научитесь использовать алгоритм DBSCAN для разных видов кластеров.
-
Несбалансированные выборки
Научитесь бороться с несбалансированными данными через Upsempling, Downsempling, взвешивание классов и оценку StratifiedKFold.
-
Нейрон и нейронная сеть
Изучите нейросети, сможете написать обучение одноуровневой нейронной сети на PyTorch.
-
Основы анализа текстов
Освоите методы обработки текстов, использование регулярных выражений, представление текста в виде вектора.
-
Соревнование на Kaggle
Освоите процесс участия в соревнованиях Kaggle и подготовку к ним.
-
Инфраструктура для моделей машинного обучения
Познакомитесь с Hadoop, Hive, MapReduce, Oozie для работы с большими данными и создания пайплайнов.
Спикеры
- Юлдуз Фаттахова
Автор и спикер курса Machine Learning Engineer. AI Product Manager, SberData, Сбер Банк
- Владимир Ершов
Data Solutions Manager, VISA
- Николай Герасименко
Data Scientist в Сбербанке, математик в ВЦ РАН. Блок «Основы математики для Data Science»
- Пётр Емельянов
Спикер курса. R&D Director, UBIC Tech
- Евгения Ракина
Data Engineer, Made
- Светлана Обухова
Data Analyst, Ernst & Young
О Skillbox
- Астана
- Ташкент
- Кишинев
- Минск
- Бишкек
- Москва
- Ереван
- Баку
- Брест
- Витебск
- Гомель
- Гродно
- Могилев
- Бобруйск
- Барановичи
- Алматы
- Шымкент
- Наманган
- Самарканд
- Кишинев
- Тирасполь
- Бельцы