欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 文旅 > 游戏 > 使用 LSTM(长短期记忆网络) 模型对时间序列数据(航空旅客人数数据集)进行预测

使用 LSTM(长短期记忆网络) 模型对时间序列数据(航空旅客人数数据集)进行预测

2025/9/16 2:43:16 来源:https://blog.csdn.net/C7211BA/article/details/143907220  浏览:    关键词:使用 LSTM(长短期记忆网络) 模型对时间序列数据(航空旅客人数数据集)进行预测

代码功能

  1. 数据准备
    加载数据:从公开的航空旅客人数数据集(Airline Passengers Dataset)中读取时间序列数据。
    对数变换和平稳化:对数据应用 log1p 函数减少趋势和波动,使模型更容易学习规律。
    归一化处理:将数据缩放到 [0, 1] 区间,以适应神经网络训练。
  2. 数据集创建
    滑动窗口机制:使用过去 seq_length(12个月)作为输入,预测下一个月的值。
    划分数据集:将时间序列数据划分为训练集(80%)和测试集(20%)。
  3. 模型定义
    LSTM 模型:
    输入特征维度:每个月的数据点作为输入特征(维度为 1)。
    隐藏层维度:每层隐藏层包含 128 个神经元。
    层数:10 层 LSTM 堆叠,增加模型的表达能力。
    全连接层(FC Layer):LSTM 的输出通过全连接层,生成最终预测值。
  4. 模型训练
    损失函数:使用均方误差(MSE),衡量预测值与真实值之间的误差。
    优化器:使用 Adam 优化器,动态调整学习率提高收敛速度。
    GPU 加速:如果设备支持,则将模型和数据移至 GPU,显著加速训练。
    训练过程中,模型使用批量数据更新权重,逐步最小化损失函数。
  5. 模型评估
    预测值生成:在测试集上进行预测。
    反归一化和还原对数变换:将预测值和真实值转换回原始规模,便于直观对比。
    性能评估:计算均方误差(MSE),衡量模型的预测准确性。
  6. 可视化结果
    实际值 vs. 预测值:绘制原始数据的真实值与预测值对比图,直观展现模型效果。
    在这里插入图片描述

代码

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import torch
from torch import nn
from sklearn.preprocessing import MinMaxScaler
from sklearn.metrics import mean_squared_error
from torch.utils.data import DataLoader, TensorDataset# 1. 加载数据
url = "https://raw.githubusercontent.com/jbrownlee/Datasets/master/airline-passengers.csv"
data = pd.read_csv(url, parse_dates=['Month'], index_col='Month')
data_values = data['Passengers'].values.astype(float).reshape(-1, 1)# 对数变换使数据平稳化
data_log = np.log1p(data_values)# 归一化数据
scaler = MinMaxScaler(feature_range=(0, 1))
normalized_data = scaler.fit_transform(data_log)# 2. 创建数据集函数
def create_dataset(data, seq_length):X, y = [], []for i in range(len(data) - seq_length):X.append(data[i:i + seq_length])y.append(data[i + seq_length])return np.array(X), np.array(y)seq_length = 12  # 使用过去12个月预测下一个月
X, y = create_dataset(normalized_data, seq_length)# 划分训练集和测试集
train_size = int(len(X) * 0.8)
X_train, X_test = X[:train_size], X[train_size:]
y_train, y_test = y[:train_size], y[train_size:]# 转换为 PyTorch 张量
X_train = torch.tensor(X_train, dtype=torch.float32)
y_train = torch.tensor(y_train, dtype=torch.float32)
X_test = torch.tensor(X_test, dtype=torch.float32)
y_test = torch.tensor(y_test, dtype=torch.float32)# 创建 DataLoader
train_dataset = TensorDataset(X_train, y_train)
train_loader = DataLoader(train_dataset, batch_size=32, shuffle=True)# 3. 定义 LSTM 模型
class LSTMModel(nn.Module):def __init__(self, input_dim, hidden_dim, output_dim, num_layers):super(LSTMModel, self).__init__()self.hidden_dim = hidden_dimself.lstm = nn.LSTM(input_dim, hidden_dim, num_layers, batch_first=True, dropout=0.2)self.fc = nn.Linear(hidden_dim, output_dim)def forward(self, x):h0 = torch.zeros(num_layers, x.size(0), self.hidden_dim).to(x.device)c0 = torch.zeros(num_layers, x.size(0), self.hidden_dim).to(x.device)out, _ = self.lstm(x, (h0, c0))out = self.fc(out[:, -1, :])return out# 超参数设置
input_dim = 1
hidden_dim = 128
output_dim = 1
num_layers = 10  # 增加到10层 LSTM
learning_rate = 0.0001
num_epochs = 300# 初始化模型、损失函数和优化器
model = LSTMModel(input_dim, hidden_dim, output_dim, num_layers)
criterion = nn.MSELoss()
optimizer = torch.optim.Adam(model.parameters(), lr=learning_rate)# 检查 GPU
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
model.to(device)# 4. 模型训练
for epoch in range(num_epochs):model.train()for X_batch, y_batch in train_loader:X_batch, y_batch = X_batch.to(device), y_batch.to(device)outputs = model(X_batch)optimizer.zero_grad()loss = criterion(outputs, y_batch)loss.backward()optimizer.step()if (epoch + 1) % 10 == 0:print(f"Epoch [{epoch+1}/{num_epochs}], Loss: {loss.item():.4f}")# 5. 模型评估
model.eval()
with torch.no_grad():y_pred = model(X_test.to(device)).cpu().numpy()# 反归一化预测结果
y_test_inv = scaler.inverse_transform(y_test.numpy())
y_pred_inv = scaler.inverse_transform(y_pred)# 计算均方误差 (MSE)
mse = mean_squared_error(np.expm1(y_test_inv), np.expm1(y_pred_inv))  # 还原对数变换
print(f"Mean Squared Error: {mse:.4f}")# 6. 可视化预测结果
plt.figure(figsize=(12, 6))
plt.plot(data.index[-len(y_test):], np.expm1(y_test_inv), label='Actual')
plt.plot(data.index[-len(y_test):], np.expm1(y_pred_inv), label='Predicted', color='orange')
plt.title('Airline Passenger Data Prediction')
plt.xlabel('Date')
plt.ylabel('Passengers')
plt.legend()
plt.show()

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com

热搜词