import tensorflow as tf
import numpy as np
from tensorflow.keras.layers import *
import yfinance as yf
import matplotlib.pyplot as plt
from tensorflow.keras.losses import *

WARNING:tensorflow:From C:\Users\tkvkh\AppData\Local\Programs\Python\Python311\Lib\site-packages\keras\src\losses.py:2976: The name tf.losses.sparse_softmax_cross_entropy is deprecated. Please use tf.compat.v1.losses.sparse_softmax_cross_entropy instead.

msft = yf.Ticker("MSFT")
data = msft.history(interval="1d", period="max")
data = data.reset_index()
data = data.drop(["Dividends", "Stock Splits", "Volume", "Date"], axis=1)
data.head()

data = data.to_numpy()

n = data.shape[0]
shape = data.shape
t_data = np.zeros((shape[0] - 1, shape[1]))

for i in range(n-1):
    t_data[i] = (data[i+1] - data[i]) / data[i]

n_window = 30

x = np.zeros((9573-30, 30, 4))
y = np.zeros((9573-30, 4))

for i in range(t_data[:,0].shape[0] - 31):
    x[i] = t_data[i:i+30,:]
    y[i] = t_data[i+30,:]

x = x.astype("float32")
y = y.astype("float32")

x_train = x[0:9000]
y_train = y[0:9000]

x_test = x[9000:]
y_test = y[9000:]

print("X train:", x_train.shape)
print("Y train:", y_train.shape)
print("X test:", x_test.shape)
print("Y test:", y_test.shape)

X train: (9000, 30, 4)
Y train: (9000, 4)
X test: (543, 30, 4)
Y test: (543, 4)

model = tf.keras.models.Sequential()
model.add(LSTM(128, return_sequences=True, input_shape= (x_train.shape[1], 4)))
model.add(LSTM(64, return_sequences=False))
model.add(Dense(25))
model.add(Dense(4))

WARNING:tensorflow:From C:\Users\tkvkh\AppData\Local\Programs\Python\Python311\Lib\site-packages\keras\src\backend.py:873: The name tf.get_default_graph is deprecated. Please use tf.compat.v1.get_default_graph instead.

model.compile(optimizer="adam", loss=MeanSquaredError())
model.fit(x_train, y_train, epochs=10, batch_size=64)

WARNING:tensorflow:From C:\Users\tkvkh\AppData\Local\Programs\Python\Python311\Lib\site-packages\keras\src\optimizers\__init__.py:309: The name tf.train.Optimizer is deprecated. Please use tf.compat.v1.train.Optimizer instead.

Epoch 1/10
WARNING:tensorflow:From C:\Users\tkvkh\AppData\Local\Programs\Python\Python311\Lib\site-packages\keras\src\utils\tf_utils.py:492: The name tf.ragged.RaggedTensorValue is deprecated. Please use tf.compat.v1.ragged.RaggedTensorValue instead.

141/141 [==============================] - 11s 35ms/step - loss: 4.0913e-04
Epoch 2/10
141/141 [==============================] - 5s 35ms/step - loss: 3.2700e-04
Epoch 3/10
141/141 [==============================] - 5s 35ms/step - loss: 2.8799e-04
Epoch 4/10
141/141 [==============================] - 5s 35ms/step - loss: 2.8676e-04
Epoch 5/10
141/141 [==============================] - 5s 35ms/step - loss: 2.8581e-04
Epoch 6/10
141/141 [==============================] - 5s 35ms/step - loss: 2.7962e-04
Epoch 7/10
141/141 [==============================] - 5s 35ms/step - loss: 2.7754e-04
Epoch 8/10
141/141 [==============================] - 5s 35ms/step - loss: 2.7628e-04
Epoch 9/10
141/141 [==============================] - 5s 35ms/step - loss: 2.7525e-04
Epoch 10/10
141/141 [==============================] - 5s 35ms/step - loss: 2.7458e-04

<keras.src.callbacks.History at 0x21246257fd0>

y_pred = model.predict(x_test)

17/17 [==============================] - 1s 12ms/step

plt.plot(y_pred[0:100,0])
plt.plot(y_test[0:100,0])
plt.legend(['actual return interest', 'prediction return interest'])
plt.show()

mse = tf.keras.losses.MeanSquaredError()
mse(y_test, y_pred).numpy()

0.00023271775

p_shape = y_pred.shape
price_pred = data[-p_shape[0]:,0] + y_pred[:,0] * data[-p_shape[0]:,0]

plt.plot(data[-200:-100,0])
plt.plot(price_pred[-200:-100])
plt.legend(['actual price', 'prediction price'])
plt.title("Actual and Prediction price of MSFT stock")
plt.show()

	Open	High	Low	Close
0	0.054792	0.062849	0.054792	0.060163
1	0.060163	0.063386	0.060163	0.062311
2	0.062311	0.063923	0.062311	0.063386
3	0.063386	0.063923	0.061237	0.061774
4	0.061774	0.062311	0.060163	0.060700

Using LSTM to predict stock market¶

Idea:¶

Import libraries¶

Data downloading¶

Convert data to numpy and calculate the return of interest¶

Preprocessing¶

Train and Test sets¶

Model¶

Prediction:¶

A graph of prediction of return interest of Open price compare to actual one¶

Mean Squared Error¶

Showcase reverse prediction of stock price¶