-
Базовая обработка текстовых данных. Решение задачи классификации тональности
Структура скрипта Анализ англоязычных текстовых данных Анализ русскоязычных текстовых данных Рассмотрение операций стемминга и лемматизации элементов текстового корпуса Рассмотрение овер- и андер-сэмплинга: приведение выборки к сбалансированному виду Токенизация на основе библиотеки Keras: обзор алгоритма “мешок слов” Токенизация на основе алгоритма TF-IDF Классификация текстовых данных: разметка тональности сообщений Доступ к тренировочному скрипту
-
Основы парсинга информации: BeautifulSoup, Selenium
Структура скрипта Рассмотрение осовных команд к библиотеке Selenium Рассмотрение осовных команд к библиотеке BeautifulSoup Осуществление процесса сбора текстовой информации с форума Bits.media при помощи BeautifulSoup Осуществление процесса сбора текстовой информации с форума Bits.media при помощи Selenium Имплементация постраничного парсинга публичной информации с онлайн-портала Доступ к тренировочному скрипту
-
Рекуррентные нейронные сети
Структура скрипта Рассмотрение архитектуры простой рекуррентной нейронной сети (RNN) Анализ различных вариантов построения RNN Рассмотрение архитектуры нейронной сети с долгой краткосрочной памяти (LSTM) Поиск оптимальных гиперпараметров моделей RNN, LSTM Рассмотрение однонаправленной и двунаправленной LSTM с отключение переобученных нейронов Доступ к тренировочному скрипту
-
Простой и многослойный персептроны
Структура скрипта Рассмотрение строения простого персептрона Анализ различных функций активации нейрона Построение простого персептрона и его обучение Настройка гиперпараметров нейронной модели Рассмотрение различных функций потерь для оценки качества обучения модели Доступ к тренировочному скрипту
-
Повторение основ Pandas, NumPy, Matplotlib и подходов в анализе временных рядов
Структура тренировочного ноутбука повторения основ Pandas, NumPy, Matplotlib Основные характеристики массива Добавление и удаление элементов из NumPy массива Получение определенных элементов, строк, столбцов Способы создания датасета Поиск пропущенных переменных с помощью Pandas Pandas – фильтрация и заполнение пропущенных переменных Преобразование данных в Pandas – Удаление дубликатов Преобразование данных в Pandas – Замена переменных Базовые статистические
-
Стартовый скрипт для осуществления соревнования по ML
Структура скрипта Требуемые библиотеки для проведения соревнования и краткий пример кода: Доступ к тренировочному скрипту
Python Notebooks
Примеры скриптов для выполнения анализа данных