XGBoost

XGBoost，全称Extreme Gradient Boosting，是一种高效的梯度提升决策树算法，被广泛应用于金融领域的数据分析和模型构建。它通过组合多个弱学习器来形成一个强学习器，有效地提高了预测精度和稳定性。在金融风控、信用评分、投资策略和市场预测等方面，XGBoost凭借出色的处理高维数据、处理非线性关系和防止过拟合的能力，已成为金融分析师和数据科学家的重要工具之一。它的灵活性和高效性使得金融机构能够更准确地评估风险、制定决策并优化资源配置。

【历史文档】策略示例-使用BigQuant平台复现XGBoost算法

更新

本文内容对应旧版平台与旧版资源，其内容不再适合最新版平台，请查看新版平台的使用说明

新版量化开发IDE（AIStudio）：

https://bigquant.com/wiki/doc/aistudio-aiide-NzAjgKapzW

新版模版策略：

https://bigquant.com/wiki/doc/demos-ecdRvuM1TU

新版数据平

更新时间：2024-05-16 01:59

什么是增量训练

增量更新的应用场景

更新时间：2024-05-15 02:10

机器学习：19-滚动训练-XGBoost

运行环境：AIStudio 3.0
策略说明：==本代码以教学目的为主，请自行调参==

回测图：

策略源码：

[https://bigquant.com/codeshare/358882de-f418-4ebe-b3c4-effc16ea1c9d](https://bigquant.com/codeshare/358882de-f418-4ebe-b3c4-

更新时间：2024-04-25 07:41

机器学习：14-XGBoost

运行环境：AIStudio 3.0
策略说明：==本代码以教学目的为主，请自行调参==

回测图：

策略源码：

[https://bigquant.com/codeshare/f753d0b8-a3b2-4781-a1a9-dbf6ffe3fe38](https://bigquant.com/codeshare/f753d0b8-a3b2-4781-a1a

更新时间：2024-04-25 07:40

中高频交易策略再出发：机器学习T0-安信证券-20191230

摘要

中高频机器学习再出发

区别于传统的主观规则交易，机器学习模型可以挖掘出更多的非线性模式。我们设计的集合分类回归策略采用XGBoost机器学习模型，并使用集合学习对机器学习模型进行融合来预测日内涨幅。

日内涨幅影响因子

我们共挖掘出15个因子：隔夜涨幅，集合竞价阶段第一阶段涨幅，集合竞价阶段成交金额占比，第一阶段委比变化，第二阶段委比变化，第二阶段涨停和第二阶段持续上行与日内涨幅有正向影响；集合竞价阶段第二阶段涨幅，集合竞价阶段成交金额占当天总成交金额的比例，第一阶段涨停，第二阶段的委买一价，委卖一价均值的平均值，第二阶段的委买一价，委卖一价均值的最大值，第二

更新时间：2023-06-01 14:28

问题

运行资源充足，但总是自动重启，100%复现

https://bigquant.com/experimentshare/721a8a757c1941e3b06b628c35279ce3

解答

可能是训练集数据存在异常值导致的，对数据进行预处理，可以参考以下策略

策略

[https://bigquant.com/experimentshare/596e737dfe9b423095685612871eed

更新时间：2023-06-01 02:13

问题

问题描述

xgboost的模型如何保存和读取？

问题代码

m5 = M.xgboost.v1(
training_ds=mSR3data,
features=mSR5.data,
predict_ds=mSR4data,
num_boost_round=NUMROUND,
objective='排序(pairwise)',#其他如map,ndcg
booster='gbtree',
max_depth=MAXDEPTH,
key_cols='date,instrument',
group_col='date',
other_train_paramet

更新时间：2023-06-01 02:13

XGBOOST策略，买入股票问题

所有条件不变的情况下，回测买入股票有问题，回测到1月20日，输出日志内1月21日买入的股票跟回测到21日，回测中实际买入的股票不符，什么原因？

更新时间：2023-06-01 02:13

问题

也没有模型训练过程，直接就1分钟不到就直接输出预测结果了

解答

①数据量太少

②xgboost建议使用这个模块： {w:100}

随机森林建议使用这个模块：

{w:100}

更新时间：2022-12-20 14:20

xgboost报错：ValueError: Feature importance is not defined for Booster type gblinear

问题

麻烦大佬看看下面报错该如何解决：

解答

需要看一下传到m12的数据是怎样的才能判断具体的错误，方便的话把代码分享给小Q。

更新时间：2022-12-20 14:20

问题

KeyError Traceback (most recent call last)
in
209 )
210
–> 211 m19 = M.trade.v4(
212 instruments=m9.data,
213 options_data=m21.predictions,
in m19_handle_data_bigquant_run(context, data)
25 context.ranker_prediction.date == data.current_dt.strftime(’%Y-%m-%d’)]
26 print (ranker_pre

更新时间：2022-11-09 01:23

人工智能月报（2020年6月）：xgboost中证500指数增强模型月超额收益4.4%，今年累计超额收益14%-中信建投-20200707

xgboost模型模仿人类思考进行“补充式”学习模式

xgboost模型是一种强学习模型，其是由众多弱学习模型集成，其采用弱学习模型为CART，即分类与回归树。该模型重在拟合特征和标签间的非线性关系。组成该模型的众多弱学习器之间的关系是补充弥补的关系，弱学习器的训练有先后，每个新的弱学习器的学习目标都是之前已训练好的弱学习器的残差。人类从假设检验、错误中分析学习的过程与此模型反应总结的方式相似。

xgboost模型构建单因子能够提供增量非线性信息

单因子的构建方式如下：将截面股票按照下月收益率排序分为2类，用xgboost分类模型进行拟合，模型预测的类别及预测概率经过映射

更新时间：2022-09-21 07:50

人工智能选股周报：最近一个月XGBoost稳定战胜指数华泰证券_20180805_

摘要

本周全A选股（沪深300行业市值中性）朴素贝叶斯表现最好本周沪深300涨跌幅为-5.85%。本周3个模型跑赢基准，超额收益最高的模型是朴素贝叶斯，该模型本周获得绝对收益-5.40%，超额收益0.45%。最近一月超额收益最高的模型是随机森林，该模型最近一月获得绝对收益，超额收益1.13%。2018年以来超额收益最高的模型是随机森林，该模型2018年以来获得绝对收益-14.16%，超额收益4.73%。2018年以来RankIC均值最高的模型是Stacking，该模型RankIC均值为0.119。本周全A选股（中证500行业市值中性）XGBoost表现最好本周中证500涨跌幅为-6

更新时间：2022-07-29 07:12

人工智能选股周报：Stacking全A选股具有长期优势华泰证券_20180520_

摘要

本周全A选股（非行业中性）XGBoost表现最好本周中证500涨跌幅为0.06%。本周7个人工智能组合跑赢基准，超额收益最高的策略是XGBoost，该策略本周获得绝对收益1.40%，超额收益。最近三月超额收益最高的策略是SVM，该策略最近三月获得绝对收益12.15%，超额收益10.12%。最近一年超额收益最高的策略是随机森林，该策略最近一年获得绝对收益22.28%，超额收益21.97%。本周全A选股（沪深300行业中性）Stacking表现最好本周沪深300涨跌幅为0.78%。本周超额收益最高的策略是Stacking，该策略本周获得绝对收益0.71%，超额收益-0.07%。最近

更新时间：2022-07-29 05:52

xgboost自定义目标和评估函数

https://bigquant.com/experimentshare/648ff204e53d44059c2d726e9219cfa3

更新时间：2022-04-21 06:21

xgboost自定义目标和评估函数

https://bigquant.com/experimentshare/85eb463354e54a9695eddc0c570040e6

更新时间：2022-03-31 18:20

XGBOOST策略，买入股票问题

所有条件不变的情况下，回测买入股票有问题，回测到1月20日，输出日志内1月21日买入的股票跟回测到21日，回测中实际买入的股票不符，什么原因？

更新时间：2022-01-22 04:31

中高频交易策略再出发：机器学习T0-安信证券-20191230

摘要

中高频机器学习再出发

日内涨幅影响因子

更新时间：2021-11-26 07:37

华泰人工智能系列之六：人工智能选股之Boosting模型-华泰证券-20170911

摘要

报告对各种Boosting集成学习模型进行系统测试

Boosting集成学习模型将多个弱学习器串行结合，能够很好地兼顾模型的偏差和方差，该类模型在最近几年获得了长足的发展，主要包括AdaBoost、GBDT、XGBoost。本篇报告我们将对这三种Boosting集成学习模型进行系统性的测试，并分析它们应用于多因子选股的异同，希望对本领域的投资者产生有实用意义的参考价值。

Boosting集成学习模型构建：7阶段样本内训练与交叉验证、样本外测试

Boosting集成学习模型的构建包括特征和标签提取、特征预处理、样本内训练、交叉验证和样本外测试等步骤。最终在每个

更新时间：2021-11-26 07:28

人工智能研究之八：Xgboost算法在选股中的应用-中信建投-20200317

摘要

主要结论

决策树及Boosting思想是理解Xgboost算法不可或缺的部分Xgboost算法是Boosting（集成）算法的高效体现。集成学习方法是将多个学习模型组合，使得组成的模型具有更强的泛化能力。

另外，Xgboost的基模型一般选择均为CART分类回归树，其逻辑清晰且理论优美，适合用于金融领域。报告将首先介绍CART分类回归树与boosting思想，再衍生至高效实现其思想的Xgboost。

将全市场收益率按大小顺序等分为三类，本文利用Xgboost算法对股票收益率所属类别作出预测与传统多因子模型类似，算法试图拟合多个因子与股票收益率之间的规律关系，不同的是

更新时间：2021-11-20 09:38

XGBoost入门

导语

本文旨在普及机器学习的使用，对于文章涉及到的模型策略不具有实盘参考意义。

Boosted Trees

XGBoost 是 “Extreme Gradient Boosting”的简称，其中“Gradient Boosting”来源于附录1.Friedman的这篇论文。本文基于 gradient boosted tree ，中文可以叫梯度提升决策树，下面简称GBDT，同时也有简称GBRT，GBM。针对gradient boosted tree的细节也可以参考附录2.这篇网页。

监督学习

XGBoost 主要是用来解决有监督学习问题，此类问题利用包含多个特征的训练

更新时间：2021-10-21 08:34

基于XGBoost的价值选股策略代码

本代码完整版一共包括三部分：数据、算法、回测交易。由于该策略与机构有一些合作，我们只放出了数据和算法。希望大家能够理解！

策略案例

https://bigquant.com/experimentshare/5a93201876eb401e998867e0b5106175

更新时间：2021-07-30 08:09

分页第1页第2页