<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Notebooks &#8211; Sentinet: Financial Data Analytics</title>
	<atom:link href="https://senti-way.ru/category/notebooks/feed/" rel="self" type="application/rss+xml" />
	<link>https://senti-way.ru</link>
	<description>Sentinet  – источник баз данных и IT-ресурсов для анализа финансовых рынков.</description>
	<lastBuildDate>Sun, 26 Nov 2023 14:10:42 +0000</lastBuildDate>
	<language>ru-RU</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=5.8.10</generator>

<image>
	<url>https://senti-way.ru/wp-content/uploads/2023/07/cropped-png-clipart-computer-icons-finance-money-investment-business-investor-saving-blue-32x32.png</url>
	<title>Notebooks &#8211; Sentinet: Financial Data Analytics</title>
	<link>https://senti-way.ru</link>
	<width>32</width>
	<height>32</height>
</image> 
	<item>
		<title>Базовая обработка текстовых данных. Решение задачи классификации тональности</title>
		<link>https://senti-way.ru/basenlp/</link>
		
		<dc:creator><![CDATA[admin]]></dc:creator>
		<pubDate>Sun, 26 Nov 2023 14:10:39 +0000</pubDate>
				<category><![CDATA[Notebooks]]></category>
		<guid isPermaLink="false">https://senti-way.ru/?p=161</guid>

					<description><![CDATA[Структура скрипта Анализ англоязычных текстовых данных Анализ русскоязычных текстовых данных Рассмотрение операций стемминга и лемматизации элементов текстового корпуса Рассмотрение овер- и андер-сэмплинга: приведение выборки к сбалансированному виду Токенизация на основе библиотеки Keras: обзор алгоритма &#8220;мешок слов&#8221; Токенизация на основе алгоритма TF-IDF Классификация текстовых данных: разметка тональности сообщений Доступ к тренировочному скрипту]]></description>
										<content:encoded><![CDATA[
<p><strong> <span style="font-size: revert;">Структура скрипта</span></strong></p>



<ul><li>Анализ англоязычных текстовых данных</li><li>Анализ русскоязычных текстовых данных</li><li>Рассмотрение операций стемминга и лемматизации элементов текстового корпуса</li><li>Рассмотрение овер- и андер-сэмплинга: приведение выборки к сбалансированному виду</li><li>Токенизация на основе библиотеки Keras: обзор алгоритма &#8220;мешок слов&#8221;</li><li>Токенизация на основе алгоритма TF-IDF</li><li>Классификация текстовых данных: разметка тональности сообщений</li></ul>



<div class="wp-block-group"><div class="wp-block-group__inner-container">
<pre class="wp-block-code"><code>Требуемые библиотеки

import pandas as pd
import numpy as np
import re
import tensorflow as tf
import keras
from keras import layers
from sklearn.metrics import mean_squared_error, mean_absolute_error
from tensorflow.keras.optimizers import Adam, SGD, RMSprop, Adagrad
from tensorflow.keras.callbacks import ModelCheckpoint
from tensorflow.keras.layers import Bidirectional, LSTM, Dropout, Embedding, Dense
from sklearn.model_selection import train_test_split
from imblearn.over_sampling import SMOTE
from imblearn.under_sampling import NearMiss
from nltk.stem import SnowballStemmer
from nltk.stem import WordNetLemmatizer
from sklearn.feature_extraction.text import TfidfVectorizer, TfidfTransformer
import pymorphy2
from tensorflow.keras.preprocessing.text import Tokenizer
from tensorflow.keras.preprocessing.sequence import pad_sequences</code></pre>



<pre class="wp-block-code"><code>1. Первичная обработка текстовых данных

train2 = table&#91;'Tweet'].str.lower()
text1_test = train2.astype(str)

text1_without = text1_test.str.replace('&#91;\(&#91;{})\]]', '')
text1_without = text1_without.str.replace('https:\/\/\S+', '')
text1_without = text1_without.str.replace('&#91;\n/!@#$%^&amp;*()"№;—:?=|«»,.]', ' ')
text1_without = text1_without.str.replace('&#91;0-9+]', ' ')

ready_text1 = pd.DataFrame(text1_without)
ready_text1.columns = &#91;'cleaned_posts']
ready_text1</code></pre>



<pre class="wp-block-code"><code>2. Удаление стоп-слов из всего массива

ready_text = &#91;]

#for i in ready_text1&#91;'cleaned_posts']&#91;:10]:
for i in ready_text1&#91;'cleaned_posts']:
  vec = &#91;word for word in i.split() if word not in stopwords.words('english')]
  vec = ' '.join(vec)
  ready_text.append(vec)

ready_text</code></pre>



<pre class="wp-block-code"><code>3. Стемминг всех элемнтов в массиве

snowball = SnowballStemmer(language="english")
tab = &#91;]

for i in ready_text:
  sent = &#91;]
  for z in i.split():
    new_word = snowball.stem(z)
    sent.append(new_word)
  new_sent = ' '.join(sent)
  tab.append(new_sent)

  print(tab)</code></pre>



<pre class="wp-block-code"><code>4. Лемматизация всех элементов в массиве

nltk.download('wordnet')
lemmatizer = WordNetLemmatizer()

for i in ready_text:
  row_lemm = &#91;]
  for z in i.split():
    lemm = lemmatizer.lemmatize(z)
    row_lemm.append(lemm)
  new_lemm = ' '.join(row_lemm)

  print(new_lemm)</code></pre>



<pre class="wp-block-code"><code>5. Токенизация элементов массива на основе "мешка слов"

tokenizer = Tokenizer(num_words=num_words)
posts = new_tab1&#91;0]
tokenizer.fit_on_texts(posts)
sequences = tokenizer.texts_to_sequences(posts)
x = pad_sequences(sequences, maxlen=max_review_len)</code></pre>



<pre class="wp-block-code"><code>6. Токенизация элементов массива на основе алгоритма TF-IDF

#Токенизация элементов массива и их векторизация
count_vect = TfidfVectorizer(
    #analyzer='char',
    analyzer='word',
    ngram_range=(1, 2),
    max_df=0.9,
    min_df=2,
    norm = None
)
x_count = count_vect.fit_transform(new_tab1&#91;0])

# Если требуется перевести в векторное пространство тестовый новый массив данных
x_test_count = count_vect1.transform(posts_test1)
x_test_tf = tfidf_transform.transform(x_test_count)



# Построение датафрейма для отображения всей матрицы токенов
x_tf1 = pd.DataFrame.sparse.from_spmatrix(x_count)
x_tf2 = x_tf1.to_numpy()



# Перевод матрицы в numpy array и удаление всех нулевых элементов построчно
matrix1 = &#91;]
z=1
for i in list(x_tf2):
  row = i&#91;i!=0]
  matrix1.append(row)
  print(z)
  z=z+1
matrix1



# Приведение каждой строчки данных к единой длине (смотрим распределение длины векторов)
x_test2 = pad_sequences(matrix1, maxlen=max_review_len, dtype='float32')</code></pre>



<pre class="wp-block-code"><code>7. Приведение выборки к сбалнсированному виду: Oversampling Case

over_sampler = SMOTE(k_neighbors=3)
x_res, y_res = over_sampler.fit_resample(x_train, y_train)
x_res, y_res = shuffle(x_res, y_res, random_state=0)
y_res.value_counts()

8. Приведение выборки к сбалнсированному виду: Undersampling Case
under_sampler = NearMiss()
x_res1, y_res1 = under_sampler.fit_resample(x_train, y_train)
y_res1.value_counts()</code></pre>
</div></div>



<h2 class="has-text-align-center">  Доступ к тренировочному скрипту  </h2>



<div class="wp-block-buttons is-content-justification-center">
<div class="wp-block-button is-style-outline"><a class="wp-block-button__link" href="https://colab.research.google.com/drive/17Pbg5Qzw9cORTEo_xxMVYfb2wYOry0Lh?usp=sharing" target="_blank" rel="noreferrer noopener">Перейти на Google Colab</a></div>
</div>



<p></p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>Основы парсинга информации: BeautifulSoup, Selenium</title>
		<link>https://senti-way.ru/selenium_bs/</link>
		
		<dc:creator><![CDATA[admin]]></dc:creator>
		<pubDate>Mon, 20 Nov 2023 09:12:16 +0000</pubDate>
				<category><![CDATA[Notebooks]]></category>
		<guid isPermaLink="false">https://senti-way.ru/?p=158</guid>

					<description><![CDATA[Структура скрипта Рассмотрение осовных команд к библиотеке Selenium Рассмотрение осовных команд к библиотеке BeautifulSoup Осуществление процесса сбора текстовой информации с форума Bits.media при помощи BeautifulSoup Осуществление процесса сбора текстовой информации с форума Bits.media при помощи Selenium Имплементация постраничного парсинга публичной информации с онлайн-портала Доступ к тренировочному скрипту]]></description>
										<content:encoded><![CDATA[
<p><strong> <span style="font-size: revert;">Структура скрипта</span></strong></p>



<ul><li>Рассмотрение осовных команд к библиотеке Selenium</li><li>Рассмотрение осовных команд к библиотеке BeautifulSoup</li><li>Осуществление процесса сбора текстовой информации с форума <a rel="noreferrer noopener" href="https://forum.bits.media/" target="_blank">Bits.media</a> при помощи BeautifulSoup</li><li>Осуществление процесса сбора текстовой информации с форума <a rel="noreferrer noopener" href="https://forum.bits.media/" target="_blank">Bits.media</a> при помощи Selenium</li><li>Имплементация постраничного парсинга публичной информации с онлайн-портала</li></ul>



<div class="wp-block-group"><div class="wp-block-group__inner-container">
<pre class="wp-block-code"><code>Требуемые библиотеки

from selenium import webdriver
import time
from webdriver_manager.chrome import ChromeDriverManager
from clickhouse_driver import Client
import pandas as pd
import requests as rs
from selenium.webdriver.common.by import By
from bs4 import BeautifulSoup as bs
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.chrome.service import Service</code></pre>



<pre class="wp-block-code"><code>1. Пример кода для построения простой рекурретной нейронной сети

Можно также использовать универсальную команду find_element(By.) или find_elements(By.), где в скобках после By. можно указать разные команды:

ID = “id”

XPATH = “xpath”

NAME = “name”

TAG_NAME = “tag name”

CLASS_NAME = “class name”

LINK_TEXT = “link text”

PARTIAL_LINK_TEXT = “partial link text”

Для открытия страницы по ссылке используется команда:
.get("url")

Для обновления страницы:
.refresh()

Чтобы ввести текст в определенное поле / часть страницы:
.send_keys("emailid@lambdatest.com")

В случае, если требуется удалить часть "скелета" сайта или информацию из поля:
.clear()

Для нажатия для элемена по кнопке или другой части сайта:
.click()

Получение кода страницы 
.page_source</code></pre>



<pre class="wp-block-code"><code>2. Основные команды работы в BeautifulSoup

Вместо подгружения вебдрайвера и открытия нового окна браузера можно сразу высызвать по ссылке нужную нам страницу:

requests.get('url')

Далее уже выгружаем сам код страницы:
html = response.text

На основе кода формируем объект для парсинга нужных элементов страницы:
soup = BeautifulSoup(html, 'html.parser')

или (более универсальный и быстрый метод)
soup = BeautifulSoup(html, 'lxml')

Если требуется определенный элемент по ID извлечь из кода страницы:
soup.find(id='example')

Если требуется выбрать все элемени по отдельному ID:
soup.find_all(id='example')

Однако можно находить элементы по различным атрибутам:
soup.find_all(attrs={'data-name': 'my-data'}) или soup.find(attrs={'data-name': 'my-data'})

Частым являются запросы по парсингу повторяющихся элементов страницы:
soup.find_all('div', {'class': 'class_name'})

или
soup.find_all('div', class_='class_name')

Однако, если в элементе с классом есть дополнительный тег, то можно применить:
soup.find_all('div', {'class': 'class_name'}, 'tag_name')

Можно также отбирать элементы:
soup.select('element')

И также эти элементы удалять из кода страницы:
soup.extract('element')</code></pre>
</div></div>



<h2 class="has-text-align-center">  Доступ к тренировочному скрипту  </h2>



<div class="wp-block-buttons is-content-justification-center">
<div class="wp-block-button is-style-outline"><a class="wp-block-button__link" href="https://colab.research.google.com/drive/1VH3qznoldRO7-CWgMNtns36DBbslQGZo?usp=sharing" target="_blank" rel="noreferrer noopener">Перейти на Google Colab</a></div>
</div>



<p></p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>Рекуррентные нейронные сети</title>
		<link>https://senti-way.ru/rnn_lstm/</link>
		
		<dc:creator><![CDATA[admin]]></dc:creator>
		<pubDate>Mon, 20 Nov 2023 09:01:28 +0000</pubDate>
				<category><![CDATA[Notebooks]]></category>
		<guid isPermaLink="false">https://senti-way.ru/?p=155</guid>

					<description><![CDATA[Структура скрипта Рассмотрение архитектуры простой рекуррентной нейронной сети (RNN) Анализ различных вариантов построения RNN Рассмотрение архитектуры нейронной сети с долгой краткосрочной памяти (LSTM) Поиск оптимальных гиперпараметров моделей RNN, LSTM Рассмотрение однонаправленной и двунаправленной LSTM с отключение переобученных нейронов Доступ к тренировочному скрипту]]></description>
										<content:encoded><![CDATA[
<p><strong> <span style="font-size: revert;">Структура скрипта</span></strong></p>



<ul><li>Рассмотрение архитектуры простой рекуррентной нейронной сети (RNN)</li><li>Анализ различных вариантов построения RNN</li><li>Рассмотрение архитектуры нейронной сети с долгой краткосрочной памяти (LSTM)</li><li>Поиск оптимальных гиперпараметров моделей RNN, LSTM</li><li>Рассмотрение однонаправленной и двунаправленной LSTM с отключение переобученных нейронов</li></ul>



<div class="wp-block-group"><div class="wp-block-group__inner-container">
<pre class="wp-block-code"><code>Требуемые библиотеки

import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
import tensorflow as tf
import keras
from keras import layers
from sklearn.metrics import mean_squared_error, mean_absolute_error
from tensorflow.keras.optimizers import Adam
from tensorflow.keras.callbacks import ModelCheckpoint
from sklearn.metrics import classification_report
from sklearn.preprocessing import MinMaxScaler
from tensorflow.keras.utils import plot_model
from tensorflow.keras.layers import Bidirectional, LSTM
from tensorflow.keras.layers import Dropout
</code></pre>



<pre class="wp-block-code"><code>1. Пример кода для построения простой рекурретной нейронной сети

model = keras.Sequential()

model.add(layers.SimpleRNN(128, input_shape=(train_x.shape&#91;1], 1), return_sequences=False))

model.add(layers.Dense(1, activation='sigmoid'))

optimizer = Adam(learning_rate=0.001)

model.compile(optimizer=optimizer, loss='binary_crossentropy', metrics=&#91;'accuracy'])

model_save_path = 'best_model.h7'

checkpoint_callback = ModelCheckpoint(model_save_path,
                                     monitor='val_accuracy',
                                     save_best_only=True,
                                      verbose=1)

model.fit(train_x, train_y, epochs=10, batch_size=32, validation_split=0.2, verbose = 1,
          callbacks=&#91;checkpoint_callback]
          )</code></pre>



<pre class="wp-block-code"><code>2. Пример кода для построения LSTM

model_LSTM = keras.Sequential()

model_LSTM.add(layers.LSTM(128, input_shape=(train_x.shape&#91;1], 1), return_sequences=False))

model_LSTM.add(layers.Dense(1, activation='sigmoid'))


optimizer = Adam(learning_rate=0.1)

model_LSTM.compile(optimizer=optimizer, loss='binary_crossentropy', metrics=&#91;'accuracy'])

model_save_path = 'best_model.h7'

checkpoint_callback = ModelCheckpoint(model_save_path,
                                     monitor='val_accuracy',
                                     save_best_only=True,
                                      verbose=1)

model_LSTM.fit(train_x, train_y, epochs=10, batch_size=32, validation_split=0.2, verbose = 1,
          callbacks=&#91;checkpoint_callback]
          )

</code></pre>



<pre class="wp-block-code"><code>2. Пример кода для построения двунаправленной сети LSTM с отключением переобученных нейронов

model_BiLSTM_drop = keras.Sequential()

model_BiLSTM_drop.add(LSTM(128, input_shape=(train_x.shape&#91;1], 1), return_sequences=True))

model_BiLSTM_drop.add(Dropout(0.2))

model_BiLSTM_drop.add(Bidirectional(LSTM(128, return_sequences=False)))


model_BiLSTM_drop.add(layers.Dense(1, activation='sigmoid'))


optimizer = Adam(learning_rate=0.1)

model_BiLSTM_drop.compile(optimizer=optimizer, loss='binary_crossentropy', metrics=&#91;'accuracy'])

model_save_path = 'best_model.h7'

checkpoint_callback = ModelCheckpoint(model_save_path,
                                     monitor='val_accuracy',
                                     save_best_only=True,
                                      verbose=1)

model_BiLSTM_drop.fit(train_x, train_y, epochs=10, batch_size=32, verbose = 1, validation_split=0.2,
          callbacks=&#91;checkpoint_callback]
          )</code></pre>
</div></div>



<h2 class="has-text-align-center">  Доступ к тренировочному скрипту  </h2>



<div class="wp-block-buttons is-content-justification-center">
<div class="wp-block-button is-style-outline"><a class="wp-block-button__link" href="https://colab.research.google.com/drive/1wTWzonQiVDlM9nv186U9KDIM0706DwSn?usp=sharing" target="_blank" rel="noreferrer noopener">Перейти на Google Colab</a></div>
</div>



<p></p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>Простой и многослойный персептроны</title>
		<link>https://senti-way.ru/perceptrons/</link>
		
		<dc:creator><![CDATA[admin]]></dc:creator>
		<pubDate>Fri, 03 Nov 2023 21:33:05 +0000</pubDate>
				<category><![CDATA[Notebooks]]></category>
		<guid isPermaLink="false">https://senti-way.ru/?p=103</guid>

					<description><![CDATA[Структура скрипта Рассмотрение строения простого персептрона Анализ различных функций активации нейрона Построение простого персептрона и его обучение Настройка гиперпараметров нейронной модели Рассмотрение различных функций потерь для оценки качества обучения модели Доступ к тренировочному скрипту]]></description>
										<content:encoded><![CDATA[
<p><strong> <span style="font-size: revert;">Структура скрипта</span></strong></p>



<ul><li>Рассмотрение строения простого персептрона</li><li>Анализ различных функций активации нейрона</li><li>Построение простого персептрона и его обучение</li><li>Настройка гиперпараметров нейронной модели</li><li>Рассмотрение различных функций потерь для оценки качества обучения модели</li></ul>



<div class="wp-block-group"><div class="wp-block-group__inner-container">
<pre class="wp-block-code"><code>Требуемые библиотеки

from keras.layers import Dense
from keras.models import Sequential
import numpy as np
import pandas as pd</code></pre>



<figure class="wp-block-image size-large"><img src="https://lh4.googleusercontent.com/LSiZW4sGX46ujudaZtBrTRCGwIjZ4n4DQ9Mm00hJNSUmYmnK4KDD_TpN_6GzgEp9KTwqwQ82m5suT_VfQn850_EoENSsIPxUHpTYVTxOzoC1WWj3mefViLay2Q68C8Tolen8rqJ7" alt=""/><figcaption><strong>Функции активации</strong></figcaption></figure>



<div class="wp-block-image"><figure class="aligncenter size-large is-resized"><img loading="lazy" src="https://victorzhou.com/a74a19dc0599aae11df7493c718abaf9/perceptron.svg" alt="" width="490" height="286"/><figcaption><strong>Схема простого персептрона</strong></figcaption></figure></div>



<pre class="wp-block-code"><code>1. Пример кода для построения базовой нейронной модели

model1 = Sequential(&#91;
    Dense(1, input_shape=(2,))
])

model1.summary()

2. Пример построения многослойного персептрона с несколькими функциями активации и коимпилирования всей модели

model2 = Sequential(&#91;
    Dense(3, input_shape=(2,)),
    Dense(2, input_shape=(2,), activation='relu'),
    Dense(1, input_shape=(2,), activation='linear'),
   # Dense(1, activation='relu')
])

#model2.load_weights('my_model_weights.h5')

optimizer = Adam(lr=0.001)

model2.compile(optimizer=optimizer, loss='mse', metrics='mae')

model2.fit(x_train, y_train, epochs=50)</code></pre>
</div></div>



<h2 class="has-text-align-center">  Доступ к тренировочному скрипту  </h2>



<div class="wp-block-buttons is-content-justification-center">
<div class="wp-block-button is-style-outline"><a class="wp-block-button__link" href="https://colab.research.google.com/drive/1xM8m2JvgOScfaBGLSD3adxoQZS3r58EE?usp=sharing" target="_blank" rel="noreferrer noopener">Перейти на Google Colab</a></div>
</div>



<p></p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>Повторение основ Pandas, NumPy, Matplotlib и подходов в анализе временных рядов</title>
		<link>https://senti-way.ru/libsandtimeseries/</link>
		
		<dc:creator><![CDATA[admin]]></dc:creator>
		<pubDate>Fri, 03 Nov 2023 20:52:13 +0000</pubDate>
				<category><![CDATA[Notebooks]]></category>
		<guid isPermaLink="false">https://senti-way.ru/?p=93</guid>

					<description><![CDATA[Структура тренировочного ноутбука повторения основ Pandas, NumPy, Matplotlib Основные характеристики массива Добавление и удаление элементов из NumPy массива Получение определенных элементов, строк, столбцов Способы создания датасета Поиск пропущенных переменных с помощью Pandas Pandas &#8211; фильтрация и заполнение пропущенных переменных Преобразование данных в Pandas &#8211; Удаление дубликатов Преобразование данных в Pandas &#8211; Замена переменных Базовые статистические [&#8230;]]]></description>
										<content:encoded><![CDATA[
<p><strong> <span style="font-size: revert;">Структура тренировочного ноутбука</span> повторения основ Pandas, NumPy, Matplotlib</strong></p>



<ul><li>Основные характеристики массива</li><li>Добавление и удаление элементов из NumPy массива</li><li>Получение определенных элементов, строк, столбцов</li><li>Способы создания датасета</li><li>Поиск пропущенных переменных с помощью Pandas</li><li>Pandas &#8211; фильтрация и заполнение пропущенных переменных</li><li>Преобразование данных в Pandas &#8211; Удаление дубликатов</li><li>Преобразование данных в Pandas &#8211; Замена переменных</li><li>Базовые статистические операции</li><li>Создание графиков &#8211; scatter, plot и т.п.</li><li>Задания для самостоятельного выполнения</li></ul>



<h2 class="has-text-align-center">  Доступ к тренировочному скрипту  </h2>



<div class="wp-block-buttons is-content-justification-center">
<div class="wp-block-button is-style-outline"><a class="wp-block-button__link" href="https://colab.research.google.com/drive/199z1QksoAveEXDPSVGjB68Luir9CAegI?usp=sharing" target="_blank" rel="noreferrer noopener">Перейти на Google Colab</a></div>
</div>



<hr class="wp-block-separator is-style-wide"/>



<p><strong> <span style="font-size: revert;">Структура тренировочного ноутбука</span> для анализа временных рядов</strong></p>



<ul><li>Рассмотрение одного из способов получения биржевых данных</li><li>Построением графиков для визуального анализа характеристик данных</li><li>Построение корреляционной матрицы</li><li>Тестирование стратегии Buy and Hold</li><li>Расчет количества активов, которые мы можем купить определенную сумму</li><li>Построение линейной регрессионной модели</li><li>Получение данных с YFinance, прогнозирование на n дней вперед</li><li>Временные ряды, автокорреляция, ADF-тест</li><li>Графики временных рядов, анализ тренда. Решение проблемы нестационарности временных данных</li><li>Декомпозиция временных рядов</li></ul>



<h2 class="has-text-align-center">  Доступ к тренировочному скрипту  </h2>



<div class="wp-block-buttons is-content-justification-center">
<div class="wp-block-button is-style-outline"><a class="wp-block-button__link" href="https://colab.research.google.com/drive/1sn-eJGEXJFiSr-M5-THOJwA8FxoPyKqW?usp=sharing" target="_blank" rel="noreferrer noopener">Перейти на Google Colab</a></div>
</div>



<p></p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>Стартовый скрипт для осуществления соревнования по ML</title>
		<link>https://senti-way.ru/competition/</link>
		
		<dc:creator><![CDATA[admin]]></dc:creator>
		<pubDate>Fri, 03 Nov 2023 19:35:44 +0000</pubDate>
				<category><![CDATA[Notebooks]]></category>
		<guid isPermaLink="false">https://senti-way.ru/?p=90</guid>

					<description><![CDATA[Структура скрипта Требуемые библиотеки для проведения соревнования и краткий пример кода: Доступ к тренировочному скрипту]]></description>
										<content:encoded><![CDATA[
<p><strong> <span style="font-size: revert;">Структура скрипта</span></strong></p>



<ul><li>Требуемые библиотеки для проведения соревнования и краткий пример кода:</li></ul>



<div class="wp-block-group"><div class="wp-block-group__inner-container">
<pre class="wp-block-code"><code>import numpy as np
import pandas as pd
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import roc_auc_score

1. Загружаем данные

train = pd.read_csv('train_data.csv')
train.head()

test = pd.read_csv('test_data.csv')
test.head()

2. Готовим фичи и тренируем модель

features = &#91;train.lat,
            train.lon]

df = np.array(features).T
train_X, test_X, train_y, test_y = train_test_split(df, train.burned.values)

lr = LogisticRegression()
lr.fit(train_X, train_y)

roc_auc_score(test_y.astype(int), lr.predict_proba(test_X)&#91;:, 1])

3. Делаем предсказание на тесте и загружаем ответы в файл

test_features = &#91;test.lat,
                 test.lon]
df_test = np.array(test_features).T

probas = lr.predict_proba(df_test)&#91;:, 1]

df = pd.DataFrame(probas, columns=&#91;'Prob'])
df.to_csv('submit.csv', index_label='Id')</code></pre>
</div></div>



<h2 class="has-text-align-center">  Доступ к тренировочному скрипту  </h2>



<div class="wp-block-buttons is-content-justification-center">
<div class="wp-block-button is-style-outline"><a class="wp-block-button__link" href="https://colab.research.google.com/drive/1ssSmHAnEiJeOMt3_zLCPR_ZnmrT4hRIB?usp=sharing" target="_blank" rel="noreferrer noopener">Перейти на Google Colab</a></div>
</div>



<p></p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>Анализ финансовых временных рядов. Базовая часть.</title>
		<link>https://senti-way.ru/fintimebasa/</link>
		
		<dc:creator><![CDATA[admin]]></dc:creator>
		<pubDate>Thu, 27 Jul 2023 13:16:17 +0000</pubDate>
				<category><![CDATA[Notebooks]]></category>
		<guid isPermaLink="false">https://senti-way.ru/?p=24</guid>

					<description><![CDATA[Структура тренировочного ноутбука Stock market data sources Yahoo Finance Daily data Daily returns Dividends and Stock splits Intraday data Finam (Raw) Intraday data for long period Data preprocessing Finnhub Nice API Different types of data: estimates, news etc. Bond market data sources Finam and Cbonds Calendar of payments Clean and dirty price Bloomberg A lot [&#8230;]]]></description>
										<content:encoded><![CDATA[
<p><strong> <span style="font-size: revert;">Структура тренировочного ноутбука</span></strong></p>



<ul><li>Stock market data sources<ul><li>Yahoo Finance<ul><li>Daily data</li><li>Daily returns</li><li>Dividends and Stock splits</li><li>Intraday data</li></ul></li><li>Finam<ul><li>(Raw) Intraday data for long period</li><li>Data preprocessing</li></ul></li><li>Finnhub<ul><li>Nice API</li><li>Different types of data: estimates, news etc.</li></ul></li></ul></li><li>Bond market data sources<ul><li>Finam and Cbonds<ul><li>Calendar of payments</li><li>Clean and dirty price</li></ul></li><li>Bloomberg<ul><li>A lot of historical quotes</li><li>Price and yield-to-maturity</li></ul></li></ul></li></ul>



<h2 class="has-text-align-center">  Доступ к тренировочному скрипту  </h2>



<div class="wp-block-buttons is-content-justification-center">
<div class="wp-block-button is-style-outline"><a class="wp-block-button__link" href="https://colab.research.google.com/drive/1H02aaKXmTMpDRGhzhjRT9RKXqg4wgHLb?usp=sharing" target="_blank" rel="noreferrer noopener">Перейти на Google Colab</a></div>
</div>



<p></p>
]]></content:encoded>
					
		
		
			</item>
	</channel>
</rss>
