以下是直播实录
谢谢大家,今天非常荣幸能够参加量化投资与机器学习公众号的举办的这场量化活动。今天我分享的主题是《金融科技与量化交易的中国实践》。
首先,做一个简单的自我介绍。我从05年到09年在北大就读物理学,毕业之后去了美国,12-13年在Citadel从事美股高频交易,工作一年多后就从纽约回到中国,创立了锐天投资(以下简称:锐天)。锐天从2013年开始到现在已经走过了七个年头,也见证了中国资本市场在量化领域的发展。今天我就花一些时间跟大家做一个简单的分享,谈谈这个行业的现在过去以及未来。
首先简单介绍一下量化交易这个概念吧。其实量化交易是一个非常宽泛的概念,今天我们就挑几个大
更新时间:2024-06-07 10:19
A股表现整体呈现震荡趋势,熊市周期长,且经常出现虽然指数跌幅较低,但市场上的个股跌幅较大。于是提出猜想:是否能找到比较抗跌的策略,在市场表现一般的时候策略回测较小。
策略的特点:在大盘下跌时,策略相对大盘比较抗跌,策略回撤相对小。
策略的目标市场:中小板(波动率高,活跃度高,流动率高,做出alpha可能性高;且在反转时,上涨的幅度较大)
2个技术指标因子+1个换手率因子+1个资金流因子+1个量价因子
![](/wiki/api/attachments.redirect?id=5fbec9e0-
更新时间:2024-05-27 08:32
本文标题为自定义标注,其实就是想告诉大家如何灵活地对数据进行标注,从而得到预测能力更强的机器学习算法。
谈标注一词之前,我们先简单了解机器学习算法中的分类和回归。
分类问题是监督学习的一个核心问题。在监督学习中,当输出变量Y取有限个离散值时,预测问题便成为分类问题。监督学习从数据中学习一个分类模型,称为分类器(classifier)。分类器对新的输入进行输出的预测,这个过程称为分类。
当输出变量Y为有限个离散值时,成为分类问题,那如果输出变量Y是连续值时,又该怎样处理呢?可能大家马上想到这其实就是回归问题,用回归算法就可以解决。的确如此,但很多时候,
更新时间:2024-05-27 03:42
Stockranker是专为选股量化而设计的机器学习算法,其选股思路是根据训练得到的模型,计算股票池中股票的当日评分,根据评分对股票池中的股票进行排序,排序靠前的股票就是当日选出的股票。
这种选股逻辑意味着不论股票的评分是多少,只要排序靠前就能被选中。实际上排序靠前股票的评分有不小差距。而评分反应的是股票的投资价值,评分高表明该股票的投资价值高,评分低表明该股票的投资价值低。因此排序算法仅能反应当天的相对投资价值,也就是矬子里面拔将军,不能反映股票的绝对投资价值。
而评分则不一样,他反应的是股票的绝对投资价值,也就是把股票的投资价值量化了。 本策略的逻辑就是根据评分来选股。
更新时间:2024-05-24 10:57
人工智能,深度学习,机器学习……不管你在从事什么工作,都需要了解这些概念。否则的话,三年之内你就会变成一只恐龙。 —— 马克·库班
库班的这句话,乍听起来有些偏激,但是“话糙理不糙”,我们现在正处于一场由大数据和超算引发的改革洪流之中。
首先,我们设想一下,如果一个人生活在20世纪早期却不知电为何物,是怎样一种体验。在过去的岁月里,他已经习惯于用特定的方法来解决相应的问题,霎时间周围所有的事物都发生了剧变。以前需要耗费大量人力物力的工作,现在只需要一个人和电就能完成了。
而在现在的背景下,机器学习、深度学习就是新的“电力”。
所以呢,如果你还不了解深度学习有多么强大,不妨就从这篇文章开
更新时间:2024-05-22 10:41
本篇文章中,我们来为大家完整介绍一个AI量化策略的组成结构以及涉及的基本概念,希望可以帮助大家对AI量化策略建立一个全面初步的认识。
在认识一个人工智能量化投资策略之前,我们首先来了解几个基本概念:人工智能 、 量化投资和机器学习,大家可以通过快速浏览下面这两篇文章,对前两个概念进行初步了解。
机器学习被评为人工智能中最能体现人类智慧的技术,开
更新时间:2024-05-22 10:34
特征选择在许多方面都是适用的:它是对抗维度灾难的最佳武器;它可以减少整体训练时间;它也可以有效防止过拟合现象,提高模型的泛化能力。
如果要对动物进行分类,你可以很快的发现许多相关的属性或特征对模型毫无益处。例如,绝大多数动物都恰好拥有1颗心脏,从机器学习的角度来看, 心脏个数这一特征就毫无用处。另一方面,一个动物是否有翅膀则可能是一个很好的预测因子。
此外,好的预测因子和无关的特征夹杂在一起会对结果模型结果产生负面影响。更不用说这些无关的数据还会增加训练耗时,或者产生过拟合现象了·。
**特征选择是一种缩小在预测建模过程中使用的特征或属性范围的过程
更新时间:2024-05-22 10:25
更新时间:2024-05-21 08:15
新版本暂无深度学习可视化模块
在阅读了 深度学习的简要介绍后,本文将介绍深度学习DNN模型及其在量化投资领域中的应用。
机器学习作为人工智能的核心,其传统算法在解决很多问题上都表现出了高效性。随着近些年数据处理技术上的进步和计算能力的提升,深度学习得以在很多问题上也大放光彩,成为近一段时间互联网、金融等领域的大热门。
在量化投资领域,机器学习尤其是由统计学延伸的各种算法一直以来都被尝试应用在选股、择时等策略的开发上,随着深度学习在其他领域上的突破,其在自动化交易甚至投资策略的自开发自
更新时间:2024-05-21 07:27
本文内容对应旧版平台与旧版资源,其内容不再适合最新版平台,请查看新版平台的使用说明
新版量化开发IDE(AIStudio):
https://bigquant.com/wiki/doc/aistudio-aiide-NzAjgKapzW
新版模版策略:
https://bigquant.com/wiki/doc/demos-ecdRvuM1TU
新版数据平
更新时间:2024-05-20 10:26
本文内容对应旧版平台与旧版资源,其内容不再适合最新版平台,请查看新版平台的使用说明
新版量化开发IDE(AIStudio):
https://bigquant.com/wiki/doc/aistudio-aiide-NzAjgKapzW
新版模版策略:
https://bigquant.com/wiki/doc/demos-ecdRvuM1TU
新版数据平
更新时间:2024-05-20 10:24
本文内容对应旧版平台与旧版资源,其内容不再适合最新版平台,请查看新版平台的使用说明
新版量化开发IDE(AIStudio):
https://bigquant.com/wiki/doc/aistudio-aiide-NzAjgKapzW
新版模版策略:
https://bigquant.com/wiki/doc/demos-ecdRvuM1TU
新版数据平
更新时间:2024-05-20 07:17
本文内容已经过期,不再适合平台最新版本,请查看如下最新内容:
[https://bigquant.com/wiki/doc/6yep5yyw5py65zmo5a2m5lmg57o75yix5yig5lqr77yi5lia77yj5py65zmo5a2m5lmg5lul57un5lio57q5ocn5zue5b2s5qih5z6l-NIQe5FA4dS](https://bigquant.com/wiki/doc/6yep5yyw5py65zmo5a2m5lmg57o75yix5yig5lqr77yi5lia77yj5py65zmo5a2m5lmg5lul57un5li
更新时间:2024-05-20 06:55
1. 人工智能与机器学习的概念
人工智能(Artificial Intelligence,AI)是一门研究如何使计算机系统具备类似于人类智能的能力的领域
人工智能的子领域示例:
更新时间:2024-05-20 06:52
本文为旧版实现,仅供学习参考。
https://bigquant.com/wiki/doc/demos-ecdRvuM1TU
预计算因子表[数据平台] https://bigquant.com/data/datasources/cn_stock_prefactors
https://bigquant.com/wiki/doc/dai-PLSbc1SbZX
[ht
更新时间:2024-05-20 06:21
英国数学家、计算机科学家、逻辑学家和密码分析家艾伦·图灵推测机器:
“这就像一个学生从他的老师那里学到了很多东西,但在他自己的工作中增加了很多东西。发生这种情况时,我觉得人们有义务将机器视为显示智能。”
举一个机器学习影响的例子,Man group 的 AHL Dimension 计划是一个价值 51 亿美元的对冲基金,部分由 AI 管理。成立后,到 2015 年,其机器学习算法为基金贡献了一半以上的利润,尽管其管理的资产要少得多。
[ ![交易中的机器学习{w:100}{w:100}{w:100}](https://d1rwhvwstyk9gu.cloudfront.net/2
更新时间:2024-05-20 06:20
\
机器学习的研究领域包括有监督学习(Supervised Learning),无监督学习(Unsupervised Learning),半监督学习(Semi-supervised Learning)和强化学习(Reinforcement Learning)等诸多内容。针对有监督学习和半监督学习,都需要一定数量的标注数据,也就是说在训练模型的时候,全部或者部分数据需要带上相应的标签才能进行模型的训练。但是在实际的业务场景或者生产环境中,工作人员获得样本的成本其实是不低的,甚至在某些时候是相对较高的,那么如何通过较少成本来获得较大价值的标注数据,进一步地提升
更新时间:2024-05-20 06:19
贝叶斯定理是机器学习领域中的一种重要算法。它的基本思想是根据已知数据和先验概率,通过贝叶斯公式计算出后验概率,从而进行分类或预测。朴素贝叶斯(Naive Bayes)是贝叶斯算法中的一种经典方法,也是为数不多的基于概率论的分类算法。它在拼写检查、语言翻译、生物医药、疾病诊断、邮件过滤、文本分类等诸多方面都有很广泛的应用。贝叶斯定理也是统计学和概率论中非常重要的一个定理,它提供了一种在已知某些其他概率的情况下,计算某个事件概率的方法。这个定理在金融领域的风险评估、市场趋势预测等方面有广泛应用。
贝叶斯定理可以表达为:P(A∣B)= P(B∣*A
更新时间:2024-05-20 03:38
贝叶斯优化是一种基于贝叶斯定理的优化方法,广泛应用于机器学习、金融建模和其他需要高效搜索最优参数的领域。它通过构建目标函数的概率模型,并在此基础上逐步更新和优化参数选择,从而实现高效的全局优化。
目标函数:
先验分布:
更新时间:2024-05-20 03:22
1936 年 Fisher 提出线性判别分析(Linear Discriminant Analysis),是一种有监督的数据降维与分类算法。
1950 年左右,朴素贝叶斯分类器(NaiveBayes Classifier),基于最基本的贝叶斯理论,假设特征相互独立,根据贝叶斯公式利用先验信息去计算样本被分类到每一个类别的概率。
1958 年感知机(Perceptron),神经网络的前身,结合了当时对脑细胞的研究以及机器学习的成果,首次被提出并用于图像识别。
同年,逻辑回归(Logistic Regression),用广义线性模型去预测样本被分类到每个类别的概率。
1967 年 K 近
更新时间:2024-05-20 03:21
起源于 1901 年 Pearson 的主成分分析(PCA),通过对协方差矩阵的特征值分解或 SVD 分解,通过对特征值排序选取相应的特征向量,将高维特征映射到低维上,达到降维的目的。用于数据预处理。
1998 年,降维算法PCA首次与核方法结合,先将数据集通过核函数(Kernel Function)映射到高维空间,然后在高维特征空间中做 PCA。核 PCA 有更好的降维效果。
2000 年,始于局部线性嵌入(Locally Linear Embedding)的流形学习(Manifold Learning)引领了降维算法的新浪潮。
2008 年 ,t-SNE 作为非线性降维方法,可更好地
更新时间:2024-05-20 03:21
最基本的强化学习建立在马尔可夫决策过程(Markov Decision Process,MDP)上,当模型的动态特征已知时可以按照动态规划(Dynamic Programming,DP)进行迭代求解。
1988 年,时间差分算法(Temporal-Difference Method,TD)被应用于价值函数的迭代计算,它与类似的蒙特卡洛算法(Monte Carlo Method,MC)一样并不需要预先知道动态特征。本质上都被看作是 DP 的近似算法。
1989 年,经典的强化学习算法 Q-学习(Q-learning)被提出,它类似于 DP 中的价值迭代算法,但无需预先知道动态特征。
199
更新时间:2024-05-20 03:20
你是否曾经听到过人们谈论机器学习,而你却对其含义只有一个模糊的概念呢?你是否已经厌倦了在和同事对话时只能点头呢?现在,让我们一起来改变这个现状吧!
这篇指南是为那些对机器学习感兴趣,但又不知从哪里开始的人而写的。我猜有很多人曾经尝试着阅读机器学习的维基百科词条,但是读着读着倍感挫折,然后直接放弃,希望能有人给出一个更直观的解释。本文就是你们想要的东西。
本文的写作目标是让任何人都能看懂,这意味着文中有大量的概括。但是那又如何呢?只要能让读者对机器学习更感兴趣,这篇文章的任务也就完成了。
机器学习是一种概念:不需要写任何与问题有关的特定代码,泛型算法(Gene
更新时间:2024-05-20 03:18
斯普林格已经向公众发布了数百本关于广泛主题的免费图书。这份名单共有408本书,涵盖了广泛的科学和技术主题。为了节省您的时间,我创建了一个与数据和机器学习领域相关的所有书籍(共65本)的列表。
在这些书中,你会发现那些处理数学方面的领域(代数,统计,和更多) ,随着更高级的书籍深度学习和其他高级主题。您还可以在各种编程语言(如 Python、 R 和 MATLAB 等)中找到一些好书。
更新时间:2024-05-20 03:17
回归是一种挖掘因变量和自变量之间关系的技术。它经常出现在机器学习中,主要用于预测建模。在本系列的最后一部分中,我们将范围扩大到涵盖其他类型的回归分析及其在金融中的用途。
简单的线性回归允许我们研究两个连续变量之间的关系——一个自变量和一个因变量。
简单线性回归方程的一般形式如下:
其中 (β_{0}) 是截距,(β_{1}) 是斜率,(ϵ_{i}) 是误差项。在这个等
更新时间:2024-05-20 03:17