• Базовая обработка текстовых данных. Решение задачи классификации тональности

    Структура скрипта Анализ англоязычных текстовых данных Анализ русскоязычных текстовых данных Рассмотрение операций стемминга и лемматизации элементов текстового корпуса Рассмотрение овер- и андер-сэмплинга: приведение выборки к сбалансированному виду Токенизация на основе библиотеки Keras: обзор алгоритма “мешок слов” Токенизация на основе алгоритма TF-IDF Классификация текстовых данных: разметка тональности сообщений Доступ к тренировочному скрипту

    Подробнее

  • Основы парсинга информации: BeautifulSoup, Selenium

    Структура скрипта Рассмотрение осовных команд к библиотеке Selenium Рассмотрение осовных команд к библиотеке BeautifulSoup Осуществление процесса сбора текстовой информации с форума Bits.media при помощи BeautifulSoup Осуществление процесса сбора текстовой информации с форума Bits.media при помощи Selenium Имплементация постраничного парсинга публичной информации с онлайн-портала Доступ к тренировочному скрипту

    Подробнее

  • Рекуррентные нейронные сети

    Структура скрипта Рассмотрение архитектуры простой рекуррентной нейронной сети (RNN) Анализ различных вариантов построения RNN Рассмотрение архитектуры нейронной сети с долгой краткосрочной памяти (LSTM) Поиск оптимальных гиперпараметров моделей RNN, LSTM Рассмотрение однонаправленной и двунаправленной LSTM с отключение переобученных нейронов Доступ к тренировочному скрипту

    Подробнее

  • Простой и многослойный персептроны

    Структура скрипта Рассмотрение строения простого персептрона Анализ различных функций активации нейрона Построение простого персептрона и его обучение Настройка гиперпараметров нейронной модели Рассмотрение различных функций потерь для оценки качества обучения модели Доступ к тренировочному скрипту

    Подробнее

  • Повторение основ Pandas, NumPy, Matplotlib и подходов в анализе временных рядов

    Структура тренировочного ноутбука повторения основ Pandas, NumPy, Matplotlib Основные характеристики массива Добавление и удаление элементов из NumPy массива Получение определенных элементов, строк, столбцов Способы создания датасета Поиск пропущенных переменных с помощью Pandas Pandas – фильтрация и заполнение пропущенных переменных Преобразование данных в Pandas – Удаление дубликатов Преобразование данных в Pandas – Замена переменных Базовые статистические

    Подробнее

  • Стартовый скрипт для осуществления соревнования по ML

    Структура скрипта Требуемые библиотеки для проведения соревнования и краткий пример кода: Доступ к тренировочному скрипту

    Подробнее