XGBoost

XGBoost,全称Extreme Gradient Boosting,是一种高效的梯度提升决策树算法,被广泛应用于金融领域的数据分析和模型构建。它通过组合多个弱学习器来形成一个强学习器,有效地提高了预测精度和稳定性。在金融风控、信用评分、投资策略和市场预测等方面,XGBoost凭借出色的处理高维数据、处理非线性关系和防止过拟合的能力,已成为金融分析师和数据科学家的重要工具之一。它的灵活性和高效性使得金融机构能够更准确地评估风险、制定决策并优化资源配置。

xgboost策略,内核一直莫名的自动重启

问题

运行资源充足,但总是自动重启,100%复现


https://bigquant.com/experimentshare/721a8a757c1941e3b06b628c35279ce3

解答

可能是训练集数据存在异常值导致的,对数据进行预处理,可以参考以下策略

\

策略

[https://bigquant.com/experimentshare/596e737dfe9b423095685612871eed

更新时间:2023-06-01 02:13

xgboost的模型如何保存和读取?

问题

问题描述

xgboost的模型如何保存和读取?

问题代码

m5 = M.xgboost.v1(
training_ds=mSR3data,
features=mSR5.data,
predict_ds=mSR4data,
num_boost_round=NUMROUND,
objective='排序(pairwise)',#其他如map,ndcg
booster='gbtree',
max_depth=MAXDEPTH,
key_cols='date,instrument',
group_col='date',
other_train_paramet

更新时间:2023-06-01 02:13

XGBOOST策略,买入股票问题

所有条件不变的情况下,回测买入股票有问题,回测到1月20日,输出日志内1月21日买入的股票跟回测到21日,回测中实际买入的股票不符,什么原因?

更新时间:2023-06-01 02:13

xgboost和随机森林为什么没有loss和mse

问题

也没有模型训练过程,直接就1分钟不到就直接输出 预测结果了


\

解答

①数据量太少

②xgboost建议使用这个模块: {w:100}

随机森林建议使用这个模块:

{w:100}

更新时间:2022-12-20 14:20

xgboost报错:ValueError: Feature importance is not defined for Booster type gblinear

问题

麻烦大佬看看下面报错该如何解决:

{w:100}解答

需要看一下传到m12的数据是怎样的才能判断具体的错误,方便的话把代码分享给小Q。

更新时间:2022-12-20 14:20

xgboost回测出错

问题

KeyError Traceback (most recent call last)
in
209 )
210
–> 211 m19 = M.trade.v4(
212 instruments=m9.data,
213 options_data=m21.predictions,
in m19_handle_data_bigquant_run(context, data)
25 context.ranker_prediction.date == data.current_dt.strftime(’%Y-%m-%d’)]
26 print (ranker_pre

更新时间:2022-11-09 01:23

人工智能月报(2020年6月):xgboost中证500指数增强模型月超额收益4.4%,今年累计超额收益14%-中信建投-20200707

xgboost模型模仿人类思考进行“补充式”学习模式

xgboost模型是一种强学习模型,其是由众多弱学习模型集成,其采用弱学习模型为CART,即分类与回归树。该模型重在拟合特征和标签间的非线性关系。组成该模型的众多弱学习器之间的关系是补充弥补的关系,弱学习器的训练有先后,每个新的弱学习器的学习目标都是之前已训练好的弱学习器的残差。人类从假设检验、错误中分析学习的过程与此模型反应总结的方式相似。

xgboost模型构建单因子能够提供增量非线性信息

单因子的构建方式如下:将截面股票按照下月收益率排序分为2类,用xgboost分类模型进行拟合,模型预测的类别及预测概率经过映射

更新时间:2022-09-21 07:50

Xgboost 打败深度学习 ?

引 言

为什么基于树的机器学习方法,如 XGBoost 和随机森林在表格数据上优于深度学习?本文给出了这种现象背后的原因,他们选取了 45 个开放数据集,并定义了一个新基准,对基于树的模型和深度模型进行比较,总结出三点原因来解释这种现象。

引自:机器之心

正 文

深度学习在图像、语言甚至音频等领域取得了巨大的进步。然而,在处理表格数据上,深度学习却表现一般。由于表格数据具有特征不均匀、样本量小、极值较大等特点,因此很难找到相应的不变量。

基于树的模型不可微,不能与深度学习模块联合训练,因此创建特定于表格的深度学习架构是一个非常活跃的研究领域。许多研究都声

更新时间:2022-08-02 03:24

人工智能选股周报:最近一个月XGBoost稳定战胜指数 华泰证券_20180805_

摘要

本周全A选股(沪深300行业市值中性)朴素贝叶斯表现最好本周沪深300涨跌幅为-5.85%。本周3个模型跑赢基准,超额收益最高的模型是朴素贝叶斯,该模型本周获得绝对收益-5.40%,超额收益0.45%。 最近一月超额收益最高的模型是随机森林,该模型最近一月获得绝对收益,超额收益1.13%。2018年以来超额收益最高的模型是随机森林,该模型2018年以来获得绝对收益-14.16%,超额收益4.73%。2018年以来RankIC均值最高的模型是Stacking,该模型RankIC均值为0.119。 本周全A选股(中证500行业市值中性)XGBoost表现最好本周中证500涨跌幅为-6

更新时间:2022-07-29 07:12

人工智能选股周报:Stacking全A选股具有长期优势 华泰证券_20180520_

摘要

本周全A选股(非行业中性)XGBoost表现最好本周中证500涨跌幅为0.06%。本周7个人工智能组合跑赢基准,超额收益最高的策略是XGBoost,该策略本周获得绝对收益1.40%,超额收益。最近三月超额收益最高的策略是SVM,该策略最近三月获得绝对收益12.15%,超额收益10.12%。最近一年超额收益最高的策略是随机森林,该策略最近一年获得绝对收益22.28%,超额收益21.97%。 本周全A选股(沪深300行业中性)Stacking表现最好本周沪深300涨跌幅为0.78%。本周超额收益最高的策略是Stacking,该策略本周获得绝对收益0.71%,超额收益-0.07%。最近

更新时间:2022-07-29 05:52

xgboost自定义目标和评估函数

https://bigquant.com/experimentshare/648ff204e53d44059c2d726e9219cfa3

\

更新时间:2022-04-21 06:21

xgboost自定义目标和评估函数

https://bigquant.com/experimentshare/85eb463354e54a9695eddc0c570040e6

\

更新时间:2022-03-31 18:20

XGBOOST策略,买入股票问题

所有条件不变的情况下,回测买入股票有问题,回测到1月20日,输出日志内1月21日买入的股票跟回测到21日,回测中实际买入的股票不符,什么原因?

更新时间:2022-01-22 04:31

中高频交易策略再出发:机器学习T0-安信证券-20191230

摘要

中高频机器学习再出发

区别于传统的主观规则交易,机器学习模型可以挖掘出更多的非线性模式。我们设计的集合分类回归策略采用XGBoost机器学习模型,并使用集合学习对机器学习模型进行融合来预测日内涨幅。

日内涨幅影响因子

我们共挖掘出15个因子:隔夜涨幅,集合竞价阶段第一阶段涨幅,集合竞价阶段成交金额占比,第一阶段委比变化,第二阶段委比变化,第二阶段涨停和第二阶段持续上行与日内涨幅有正向影响;集合竞价阶段第二阶段涨幅,集合竞价阶段成交金额占当天总成交金额的比例,第一阶段涨停,第二阶段的委买一价,委卖一价均值的平均值,第二阶段的委买一价,委卖一价均值的最大值,第二

更新时间:2021-11-26 07:37

华泰人工智能系列之六:人工智能选股之Boosting模型-华泰证券-20170911

摘要

报告对各种Boosting集成学习模型进行系统测试

Boosting集成学习模型将多个弱学习器串行结合,能够很好地兼顾模型的偏差和方差,该类模型在最近几年获得了长足的发展,主要包括AdaBoost、GBDT、XGBoost。本篇报告我们将对这三种Boosting集成学习模型进行系统性的测试,并分析它们应用于多因子选股的异同,希望对本领域的投资者产生有实用意义的参考价值。

Boosting集成学习模型构建:7阶段样本内训练与交叉验证、样本外测试

Boosting集成学习模型的构建包括特征和标签提取、特征预处理、样本内训练、交叉验证和样本外测试等步骤。最终在每个

更新时间:2021-11-26 07:28

人工智能研究之八:Xgboost算法在选股中的应用-中信建投-20200317

摘要

主要结论

决策树及Boosting思想是理解Xgboost算法不可或缺的部分Xgboost算法是Boosting(集成)算法的高效体现。集成学习方法是将多个学习模型组合,使得组成的模型具有更强的泛化能力。

另外,Xgboost的基模型一般选择均为CART分类回归树,其逻辑清晰且理论优美,适合用于金融领域。报告将首先介绍CART分类回归树与boosting思想,再衍生至高效实现其思想的Xgboost。

将全市场收益率按大小顺序等分为三类,本文利用Xgboost算法对股票收益率所属类别作出预测与传统多因子模型类似,算法试图拟合多个因子与股票收益率之间的规律关系,不同的是

更新时间:2021-11-20 09:38

XGBoost入门

导语

本文旨在普及机器学习的使用,对于文章涉及到的模型策略不具有实盘参考意义。

Boosted Trees

XGBoost 是 “Extreme Gradient Boosting”的简称,其中“Gradient Boosting”来源于附录1.Friedman的这篇论文。本文基于 gradient boosted tree ,中文可以叫梯度提升决策树,下面简称GBDT,同时也有简称GBRT,GBM。针对gradient boosted tree的细节也可以参考附录2.这篇网页。

监督学习

XGBoost 主要是用来解决有监督学习问题,此类问题利用包含多个特征的训练

更新时间:2021-10-21 08:34

基于XGBoost的价值选股策略代码

本代码完整版一共包括三部分:数据、算法、回测交易。 由于该策略与机构有一些合作,我们只放出了数据和算法。希望大家能够理解!

策略案例

https://bigquant.com/experimentshare/5a93201876eb401e998867e0b5106175

\

更新时间:2021-07-30 08:09

分页第1页第2页
{link}