做量化交易通常需要什么样的教育背景和知识结构?
我从日常工作来讲一下需要什么知识吧,期货方面的,其实是比较简单的品种,其他还有股票、期权、债权、外汇等,其实很多人也只能精通其中一种。再说期货也有很多种,有做投机类的,这就是趋势,国内叫CTA;也有做套利的、做市商的,这个要么很高频,靠挂单来提供流动性赚钱,要么很低频,毕竟一买一卖之后价差波动很小,要持有很长时间才能获利,而价差的趋势性更强,流动性更弱;还有持仓一两个月的低频趋势,需要结合基本面,适合大资金,这些我都没做,只做了期货的中频趋势吧,还有日内非高频,两年前做过超高频的,现在不行了。
但从赚钱的角度,哪怕只做通其中一种,也足以赚很多钱了,当然赚多赚少也取决于自己投入的资金和承受的风险。我这种期货最简单的,预测涨就买,预测跌就卖。国内股票更简单,更多是选股的,只能买不能卖空。期权就比较复杂,可以不预测方向也能赚钱,比如赌价格是否在一个范围内波动等。提供流动性的需要频繁挂撤单也比较复杂。
继续刚刚的话题,其实最好背景宽一些,而不是深一些。比如最简单的选股,最好懂一些金融市场、股票市场的基础知识吧,财务报表这些也要懂一点,作为初筛股票用的。国内所谓多因子模型跟国外的不大一样,国内更多是根据一个因子排序,等到一组股票组合,然后不同因子的股票组合叠加;国外的多因子本质上就是多元线性回归,预测股票未来价格变化,因子代入线性模型中。因此,统计里面的多元线性回归肯定要会的,它的基础课概率论和数理统计也要,更基础的数学分析、线性代数也要。
如果是期货方面的预测,由于期货市场比股票市场更有效,也更难预测,而且信息更少,更多依赖行情信息,因此对模型的要求高一些,或许需要lasso/ridge等带约束的线性回归。更复杂一些的gradient boosting/random forest/svm在高频中或许也会用到。越复杂的模型需要越多的数据去估算参数,因此越高频的数据可以支撑越复杂的模型。可以学一些类似国外stats 315ab statistical learning的课程,参考elements of statistical learning一书,这需要统计硕士的水平。就量化来说,国外的水平确实要领先国内不少,这也是需要我们团结、努力去进步的事。
与之对应的计算机的课程是机器学习和概率图。我接触的STF机器学习更多介绍svm,reinforcement learning,learning theory等,没有介绍randome forest/gradient boosting这些,可能有些不同,但这年头似乎tree-based的模型比svm更好一些,reinforcement learning要使用是有难度的,它更多应用在概率分布很显然的类似于游戏、下棋的场景中,用在动态投资组合上可能需要比较牛逼的人,但这些绝对不可能是入门工作干的活,国内也未必有量化团队有足够的水平干这种事。
如果是做市商方面,其实很难搜到什么书籍文献来介绍,这些策略更多是挂单撤单,对IT要求比较高,基本的python或C++肯定要会,还有多线程、多进程、网络编程、系统优化等,也最好懂得,类似于做高频。低延时是个很大的概念,各个环节都会造成延时,所以各个环节都需要优化。这些最好是计算机类的本科专业。这类工作的一个特点是一次性的,现实工作中,策略更新和维护的时间远远多于底层系统的时间,所以IT类工作在量化领域很难获得相对很高的收入。
重要的工作不一定就能获得高收入,用完了就没用了,这不是持续性的贡献。简单的道理,我用了开源的R和里面很多package做统计计算,这些对我很重要,但不代表我就要给这些作者钱。事实上,IT方面的,我完全也可以在写完系统后,遇到什么问题找一些IT咨询的解决一下。
另外一点容易被忽略的是数值计算方面的。虽然现在很多算法都已经封装好,比如C++里面的LINPACK,Armadillod等,但其实不代表就要学会C++去调用,其实R里面很多package就是基于这些包的,只要学会用R就可以了。其它gpu相关的也类似。当然,统计模型建立之后就是求解模型,如果自己懂得写数值算法确实可以针对自己的具体应用场景写一个高效的numerical solver,普适性的numerical optimization solver是不存在的。因此,计算数学在这方面还是有好处的。
比如文艺复兴公司就是计算机专业的收集数据、物理专业的建模、数学专业的做数值优化等等,但国内的小公司不大可能。这也是其他投行之类的quant跟文艺复兴的区别:投行之类的其实不管什么专业,只要是名校的,能答出笔试面试的问题的就要,更多是“我给出这些条件只要满足这些条件的”,进去还得继续学随机分析那些,自己本职的研究是荒废的,说实话招个本科和博士没啥区别;文艺复兴不同,他更多是用材不用人,更多是要这些人发挥所长。所以哪怕都是招一群哈佛麻省的理工博士,最终效果是很不一样的。
页:
[1]