Базовая обработка текстовых данных. Решение задачи классификации тональности

  • Автор записи:
  • Рубрика записи:Notebooks

Структура скрипта Анализ англоязычных текстовых данныхАнализ русскоязычных текстовых данныхРассмотрение операций стемминга и лемматизации элементов текстового корпусаРассмотрение овер- и андер-сэмплинга: приведение выборки к сбалансированному видуТокенизация на основе библиотеки Keras: обзор алгоритма…

Продолжить чтениеБазовая обработка текстовых данных. Решение задачи классификации тональности

Основы парсинга информации: BeautifulSoup, Selenium

  • Автор записи:
  • Рубрика записи:Notebooks

Структура скрипта Рассмотрение осовных команд к библиотеке SeleniumРассмотрение осовных команд к библиотеке BeautifulSoupОсуществление процесса сбора текстовой информации с форума Bits.media при помощи BeautifulSoupОсуществление процесса сбора текстовой информации с форума Bits.media…

Продолжить чтениеОсновы парсинга информации: BeautifulSoup, Selenium

Рекуррентные нейронные сети

  • Автор записи:
  • Рубрика записи:Notebooks

Структура скрипта Рассмотрение архитектуры простой рекуррентной нейронной сети (RNN)Анализ различных вариантов построения RNNРассмотрение архитектуры нейронной сети с долгой краткосрочной памяти (LSTM)Поиск оптимальных гиперпараметров моделей RNN, LSTMРассмотрение однонаправленной и двунаправленной LSTM…

Продолжить чтениеРекуррентные нейронные сети

Простой и многослойный персептроны

  • Автор записи:
  • Рубрика записи:Notebooks

Структура скрипта Рассмотрение строения простого персептронаАнализ различных функций активации нейронаПостроение простого персептрона и его обучениеНастройка гиперпараметров нейронной моделиРассмотрение различных функций потерь для оценки качества обучения модели Требуемые библиотеки from keras.layers…

Продолжить чтениеПростой и многослойный персептроны

Повторение основ Pandas, NumPy, Matplotlib и подходов в анализе временных рядов

  • Автор записи:
  • Рубрика записи:Notebooks

Структура тренировочного ноутбука повторения основ Pandas, NumPy, Matplotlib Основные характеристики массиваДобавление и удаление элементов из NumPy массиваПолучение определенных элементов, строк, столбцовСпособы создания датасетаПоиск пропущенных переменных с помощью PandasPandas - фильтрация…

Продолжить чтениеПовторение основ Pandas, NumPy, Matplotlib и подходов в анализе временных рядов

Стартовый скрипт для осуществления соревнования по ML

  • Автор записи:
  • Рубрика записи:Notebooks

Структура скрипта Требуемые библиотеки для проведения соревнования и краткий пример кода: import numpy as np import pandas as pd from sklearn.linear_model import LogisticRegression from sklearn.model_selection import train_test_split from sklearn.metrics import…

Продолжить чтениеСтартовый скрипт для осуществления соревнования по ML

Анализ финансовых временных рядов. Базовая часть.

  • Автор записи:
  • Рубрика записи:Notebooks

Структура тренировочного ноутбука Stock market data sourcesYahoo FinanceDaily dataDaily returnsDividends and Stock splitsIntraday dataFinam(Raw) Intraday data for long periodData preprocessingFinnhubNice APIDifferent types of data: estimates, news etc.Bond market data sourcesFinam…

Продолжить чтениеАнализ финансовых временных рядов. Базовая часть.