华泰人工智能系列之三:人工智能选股之支持向量机模型-华泰证券-20170804
由qxiao创建,最终由qxiao 被浏览 198 用户
摘要
本报告对各种核支持向量机模型以及支持向量回归进行系统测试
支持向量机(SVM)是应用法之一。线性支持向量机能够解决线性分类问题,核支持向量机则主要针对非线性分类问题,支持向量回归能够处理回归问题。本篇报告我们将对包括线性核、多项式核、高斯核和Sigmoid核在内的各种核函数支持向量机以及支持向量回归进行系统性的测试,并分析它们应用于多因子选股的异同,希望对本领域的投资者产生有实用意义的参考价值。
支持向量机模型的构建:样本内训练与交叉验证、样本外测试
支持向量机模型的构建包括特征和标签提取、特征预处理、样本内训练、交叉验证和样本外测试等步骤。最终在每个月底可以产生对全部个股下期上涨概率的预测值,然后根据正确率、AUC等指标以及策略回测结果对模型进行评价。我们还根据模型的预测结果构建了沪深300成份内选股、中证500成份内选股和全A选股策略,通过年化收益率、信息比率、最大回撤等指标综合评价策略效果。
高斯核支持向量机选股模型收益和信息比率的表现优于线性回归
对于沪深300成份股内选股的行业中性策略(每个行业选6只个股),高斯核SVM模型的超额收益为4.9%,信息比率为1.22。对于中证500成份股内选股的行业中性策略,高斯核SVM模型的超额收益为9.0%,信息比率为2.37。对于全A选股的行业中性策略,高斯核SVM模型相对于中证500的超额收益为21.1%,信息比率为3.66。总体而言,高斯核SVM在收益和信息比率方面表现不错,各种策略构建方式下都能稳定地优于线性回归模型;最大回撤方面SVM模型相比于线性回归不具备明显优势。
高斯核支持向量机模型预测能力整体强于其它核支持向量机
我们比较了不同核支持向量机的预测能力,发现高斯核SVM的测试集正确率、AUC和回测表现普遍优于其它核函数。高斯核作为使用最为广泛的核函数,其优势在于不对原始数据做太多的先验假设。我们的回测结果也印证了这一点,通过交叉验证集调参,最终得到高斯核SVM全A选股模型的测试集正确率为56.25%,高于线性核(55.66%)、3阶多项式核(53.75%)、7阶多项式核(50.03%)和Sigmoid核(55.66%)。我们同时发现支持向量机的回测表现优于支持向量回归。
正文
/wiki/static/upload/39/3990619d-6607-4d4b-9e32-fe802ba1e039.pdf
\