bqbppxmo_作业
由bqbppxmo创建,最终由bqbppxmo 被浏览 10 用户
使用总市值,换手率,pe_ttim和净利润(单季度, 同比增长)的截面排序 4个因子作为因子,使用LinearRegression,xgboost和随机森林分别进行回归,LinearRegression效果最好,如下图所示。
思考:
•因子更重要还是模型更重要?
因子和模型都重要
- 因子是基础:决定模型能达到的 “上限”,没有优质因子,模型再强也无用。
- 模型是工具:决定能否接近这个 “上限”,合适的模型能更好地利用因子中的信息。
这次选的四个因子作用最大的市值和换手,去掉这两个因子可以看到收益明显下降,不同的模型收益也不一样,这个需要多次尝试。
相同因子下不同模型的区别?
- 训练耗时不同,LinearRegression训练耗时短,xgboost和随机森林耗时长。
- 需要调的参数不同,就算同一个模型使用不同的参数可能,这次没有进行参数调优,只试了将xgboost和随机森林的n_estimators改为20节约训练时间
- 可解释性不同。
代码:
https://bigquant.com/codesharev3/540e5605-7da4-4c3c-91f4-f8061c297938
\