研报&论文

Predicting NVIDIA's Next-Day Stock Price:A Comparative Analysis of LSTM, MLP, ARIMA, and ARIMA-GARC

由qxiao创建,最终由qxiao 被浏览 27 用户

作者:

  • Yiluan Xing (Indiana University Bloomington)、Chao Yan (Northeastern University)、Cathy Chang Xie (Baylor University)

摘要:

  • 研究目标:评估四种不同模型(ARIMA、MLP、LSTM、ARIMA-GARCH)在预测NVIDIA下一天股价的有效性。
  • 数据来源:使用Yahoo Finance的API,数据时间范围为2019年4月12日至2024年4月11日。
  • 主要发现:ARIMA-GARCH模型在预测NVIDIA股价方面表现最佳,尤其是在均方根误差(RMSE)方面。

关键词

  • 股票预测, NVIDIA, ARIMA, MLP, LSTM, ARIMA-GARCH

I. 引言

  • 背景:预测股票价格在金融市场中具有重要意义,影响投资者、交易员和金融机构的决策。AI技术的进步使得深度学习在股票预测中得到广泛应用。
  • 方法:本研究使用统计方法(ARIMA)和深度学习方法(MLP、LSTM)以及它们的组合(ARIMA-GARCH)来预测NVIDIA的股价。
  • 文献回顾:讨论了LSTM、ANN、SVM等模型在股票价格预测中的应用和效果。提到LSTM在处理复杂时间依赖关系方面的优势,以及ARIMA在捕捉线性趋势方面的能力。

II. 方法

A. ARIMA模型

  • 描述:ARIMA模型通过自回归和移动平均方法处理时间序列数据,适用于处理非平稳数据。模型包括AR(自回归)部分、MA(移动平均)部分和I(差分)部分。
  • 公式
    • 自回归(AR)部分:

    • 移动平均(MA)部分:

    • ARIMA模型:

B. 多层感知器(MLP)

  • 描述:MLP是一种前馈神经网络,具有输入层、隐藏层和输出层,通过权重和偏差连接各层。有效建模复杂的非线性关系。
  • 结构
    • 输入层接收时间序列数据。
    • 隐藏层使用非线性激活函数(如ReLU)。
    • 输出层生成预测值。

C. 长短期记忆网络(LSTM)

  • 描述:LSTM是一种改进的循环神经网络(RNN),设计用于处理长序列数据中的梯度消失和爆炸问题。通过遗忘门、输入门和输出门调节信息流动,擅长处理时间依赖和长时依赖关系。
  • 公式
    • 遗忘门:

    • 输入门:

    • 候选记忆细胞:

    • 记忆细胞更新:

    • 输出门:

    • 隐藏状态:

D. ARIMA-GARCH模型

  • 描述:GARCH模型通过包含滞后条件方差来建模和预测时间序列中的波动性。ARIMA-GARCH模型结合了ARIMA的均值动态和GARCH的波动性动态,适用于捕捉金融市场的波动性聚集特性。
  • 公式
    • GARCH模型:
    • ARIMA-GARCH模型:


III. 实验与分析

1. 数据

  • 数据集
  • 数据划分

2. 模型评估指标

  • RMSE(均方根误差)

  • MAE(平均绝对误差)

  • R平方(R2,决定系数)

3. 模型实现

  • ARIMA
    • 扩展窗口法:使用训练集中的所有历史数据构建ARIMA模型,并通过Akaike信息准则(AIC)确定最优参数。
    • 滚动窗口法:评估30天和60天的窗口大小,并使用最近的观察值进行模型优化和训练。
  • LSTM
    • 数据归一化:使用MinMaxScaler将数据缩放到0到1之间。
    • 超参数调整:单层隐藏层297个神经元,ELU激活函数,回溯窗口8天,学习率约为0.0044589,训练500轮次,批量大小64。
  • MLP
    • 数据归一化:使用MinMaxScaler。
    • 超参数调整:三层隐藏层每层83个神经元,ReLU激活函数,回溯窗口3天,Adam优化器,训练82轮次,批量大小9。
  • ARIMA-GARCH
    • 采用GARCH(1,1)模型,结合ARIMA模型的残差进行波动性建模。

4. 结果

  • ARIMA模型(扩展窗口法)在MAE、RMSE和R2值方面表现略优于其他模型。
  • ARIMA-GARCH模型在RMSE方面表现最佳,但在MAE方面略高,原因是其在测试集末端的预测值有过高倾向。

\

标签

股价预测
{link}