过拟合

在金融领域,"过拟合"是一个重要概念,尤其在使用复杂模型和算法进行数据分析和预测时。过拟合主要指的是模型在训练数据上表现过于优越,以至于把训练数据中的噪声或特殊情况也考虑进去,从而使得模型在新的、未见过的数据上表现不佳。 更具体地说,当一个模型过度拟合训练数据时,它会将自身调整得过于复杂,以适应训练数据中的每一个细节。这导致模型对训练数据的预测非常准确,但对新数据的预测能力大大降低。在金融市场的应用中,这可能意味着模型在历史数据上表现良好,但在实际交易中却无法实现预期的回报。 过拟合的原因有很多,例如训练数据量不足、模型复杂度过高、训练时间过长等。为了防止过拟合,金融从业人员通常会采用一系列策略,如交叉验证、使用正则化方法、提前停止训练、增加训练数据量、降低模型复杂度等。这些方法的目标都是使模型能够在不见过的数据上保持稳健的预测性能,从而在实际金融决策中提供可靠的依据。

Tabnet如何实现分类任务

https://bigquant.com/experimentshare/75aff243f241447da1d1994ed9d29c44

如何实现分类任务啊,怎么在原有策略上修改

更新时间:2023-10-09 07:05

stockranker训练时出错的问题

{w:100} {w:100}

更新时间:2023-10-09 06:35

如何优化策略?

请问:

比如,我开发一个策略,回测两年时间,前一年的表现很好,后一年的表现很差,那么该如何优化让策略长期表现一致呢?

谢谢

更新时间:2023-10-09 06:03

回测正常,模拟交易始终不出信号是什么原因

https://bigquant.com/wiki/doc/shizhi-celve-v-10-Jhc4IN7nXK

直接克隆的知识库-平台使用文档中的样例策略(https://bigquant.com/wiki/doc/shizhi-celve-v-10-Jhc4IN7nXK),回测完全正常。但是模拟交易时,始终不出交易信号。不知道模拟交易时运行各个模块的原理和回测的原理有什么不同?

注:并不是因为22天才调仓的原因,第一天运行都不出信号。感觉在模拟交易时回测模块之前连接的模块运行结果不对,输入给回测模块的数据有误。只是个人猜测。不知道真实原因,请高手指点,谢谢!


模拟交易

更新时间:2023-10-09 03:40

二分类模型的评估组件报错

https://bigquant.com/experimentshare/20119409c088405dbb7e14dca685958a

\

更新时间:2023-10-09 03:40

数据挖掘视角下的因子轮动初探-长江证券-20180609

摘要

数据挖掘因子轮动关系有自身的局限性和优越性

数据挖掘探究因子轮动,可以利用模型的优势找到更为精细的关系。由于因子轮动的数据量较小,容易过拟合,且逻辑层面较难给出解释。通过扩充数据量及分类模型的应用,降低信噪比和过拟合程度;通过抽取简单模型窥视变量和因子轮动的逻辑关系。

外生变量和因子有效区间有较大关系

根据市场环境变量和随机森林模型建立的因子择时策略相比于默认因子方向建立的策略,除动量因子外,均有提高。以因子择时为基础建立的多因子等权配置策略年化收益为4.76%,最大回撤1.17%,信息比5.11,Calmar比4.06。从树的结构来看,和因子是否有效最相关

更新时间:2023-06-01 14:28

双均线基金策略-股票日频

https://bigquant.com/experimentshare/5277de40609d4fffa7bbe6df2e5b1231

\

更新时间:2023-06-01 06:18

XGBOOST策略,买入股票问题

所有条件不变的情况下,回测买入股票有问题,回测到1月20日,输出日志内1月21日买入的股票跟回测到21日,回测中实际买入的股票不符,什么原因?

更新时间:2023-06-01 02:13

仅仅修改训练数据开始时间为什么收益差距那么大?

问题

如题,我将策略的训练数据开始时间从15.1.1-19.1.1改为14.1.1-19.1.1,结果回测收益差距十分巨大,从正的200%多的收益降到负收益,这是什么原因?

如果训练数据开始时间都影响这么大,如何确认策略是有效的?

谢谢

更新时间:2023-06-01 02:13

模拟交易训练集可以选近XX天的滚动数据吗?

问题

模拟交易训练集可以选近XX天的滚动数据吗?

解答

可参考下这个帖子https://bigquant.com/community/t/topic/128990 5

更新时间:2023-06-01 02:13

[实盘经验贴] 高收益策略 vs 中等收益策略 怎么选?

作者:woshisilvio

{w:100}{w:100}

AI量化的玄学- 第一章

如何更有效率的对抗过拟合? 对抗随机性?---

答案:给你个表情自己体会。

https://bigquant.com/wiki/doc/gaishuai-VEmyCgB5uz

![{w:100}{w:100}](/wiki/api/attachments.redirect?id=4a263263-4102-40a0-bddf-71d043

更新时间:2022-12-06 08:23

用传统框架测试机器学习-GBDT算法

策略案例

https://bigquant.com/experimentshare/44cc116a1dad4c37983b9be35da208ee

\

更新时间:2022-11-20 03:34

分享一个可视化深度学习建模的例子

策略案例

https://bigquant.com/experimentshare/9426627188af4f488644532c01328c14

\

更新时间:2022-11-20 03:34

回测

\

更新时间:2022-11-09 01:23

关于回测收益率的问题

问题

通过策略进行回测时,比如跑一个5年的回测后,通过曲线可以看到后两年的收益比较好,那么在单独对这两年跑回测时,却得不到同样趋势的结果,这是为什么呢?

\

解答

1.有些策略是全仓买入少量股票, 因为时间开仓日不同造成有偶然性,起始的第一天亏钱,或者赚钱 对后续的收益率影响很大。

2.过拟合。

3.有些日期的股票数据有空值,造成选股的收益有差异。

4.基础特征抽取 为了方便计算 因子值,有额外抽取天数占用时间天数,会导致起始回测日期往后偏移几天,开始收益率不同,自然收益率就不同了。

更新时间:2022-11-09 01:23

为防止过拟合,stockranker 评估数据集如何使用?

{w:100}

比如默认运行20次迭代训练,如何选择评估效果最好的一次迭代保存下来?

更新时间:2022-11-09 01:23

lighGBM训练出错

https://bigquant.com/experimentshare/ada6ffe2d3f94a6f9e0ccac744524604

\

更新时间:2022-11-09 01:23

【7月回血就靠他】AI量化实盘-寻找alpha

作者:woshisilvio (全文共913字,阅读约需2分钟)

市场究竟有没有真正的alpha?

笔者一直疑惑的一点就是 我们的模型每天这样选股,赚钱的效应究竟是随机的,还是可控?

模型有没有真正的学到市场中的规律,挖掘到了alpha? 靠AI模型 来赚钱 究竟靠不靠谱?

对于这些问题,一千位quant就有1000个答案,这里就留给评论区的高人们解惑了。


{w:100}{w:100%}

针对以上问题,之前笔者有分享

更新时间:2022-09-21 07:35

【如何检验过拟合?】学会这招减少你实盘踩坑的概率

如何检测过拟合or 欠拟合?

首先祝大家五一快乐。

趁着假期没事,虫哥给大家唠嗑唠嗑实盘中踩的那些坑。

4月不易,且行且珍惜,跑的最好的一个小账户只有一点安慰奖(别笑,差不多一个月工资了…………)。平均下来 每个账户只有5-7%的平均收益,可以看到最近的行情真的不是很好赚钱。

{w:100}{w:100}{w:100}

做数据分析和建模的过程中很多时候,我们最害怕和担心的就是为了优化模型,会不自觉引入一些过于复杂的条件拟合

更新时间:2022-09-18 14:10

量化研究:投资决策的起点 海通证券_20180716_

正文

/wiki/static/upload/25/259b1aaa-df16-4ed2-abd6-8ad67bba7fb7.pdf

\

更新时间:2022-08-31 08:06

监督学习的方法介绍及金融领域应用实例-长江证券-20170727

摘要

机器学习系列报告

本系列报告试图系统全面性的介绍各种不同的机器学习方法,并且结合具体的在投资研究领域应用实例、交易策略及code示例,说明其应用情景和实现方法。机器学习的方法可以分为以下几类:监督学习、无监督学习、深度学习及其他机器学习方法(例如强化学习),对应到具体的模型上数量则更是繁多,目前大部分机器学习模型并未广泛的应用在投研领域,因此本系列主要偏重于在投研领域有应用潜力的模型及方法。此篇将以介绍监督学习方法为主

监督学习模型之回归类模型及其应用

与普通线性回归不同,监督学习中的惩罚回归模型和非参数回归,可以分别用于处理输入变量中存在大量线性相关性关系

更新时间:2022-08-31 01:52

东方机器选股模型Ver1.0-东方证券-20161107

研究结论

机器学习容易给人“黑箱模型”和“过拟合”的印象,但事实上一些机器学习算法的逻辑和结果都非常直白,而且算法自身带有一套避免过拟合的参数估计机制。众多的实践研究说明,机器学习方法的预测能力大部分情况下都强于线性模型,很值得在量化投资中测试使用。本报告主要讲述机器学习的基本原理和用其来做量化选股的实证结果。

机器学习模型众多,不存在所谓的最强模型,不同的数据,不同的问题适用不同的模型。我们测试了LASSO、SVM、增强型决策树、随机森林等几种常见机器学习方法,最终选择用随机森林,主要是因为它结构简单、参数少、过拟合概率低,同时还具有非常强的样本外预测能力。机器选股模型省

更新时间:2022-08-30 02:27

基本面量化


\

更新时间:2022-08-25 02:16

DeepAlpha实践报告(一)

作者:woshisilvio

DeepAlpha 的优势

deepAlpha的延展性和可塑性。

相比同样的决策树模型还有线性分类模型,deepAlpha无疑具有更大的可扩展空间。 一般的机器学习模型 一旦出现训练数据量过大,又或者面对一些极值数据样本和极端数据差异过大的情况,模型容易陷入过拟合的状态。 模型比较依赖训练的因子特征,如果因子选择不好,会导致模型学习效果不佳,而且在后期难以通过参数去调整学习的效果。

StockRanker绩效:98个因子

![{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}

更新时间:2022-08-17 00:16

回测交易

涉及国内主要品种的不同的频率的回测与交易


\

更新时间:2022-07-31 01:58

分页第1页第2页第3页第4页
{link}