书城投资量化投资的转折:分析师的良知
4301600000009

第9章 技术分析手段(3)

本来类似的例子只应该举一个,但巨力索具过于特殊,我们需要多说两句。在部分行情软件上的分时走势来看,巨力索具的怪异走势被隐藏了。但查看日K线图形,读者就会发现当日最低价为16.42,而当日的跌停价为16.41。原因在于分时图走势往往是以该分钟的最末成交为显示,从这个层面来说其与撮合有相似之处。利用好这些手段,搞指标欺骗并不难。

数据来源:宏源证券信用交易部整理

还记得“中科创业”股价操纵案那数以千计的股东账户么?既然如此,邪恶地想一下,通过网络连接的不同地理位置的执行终端将大单打碎的可能性。交易所保留的交易数据是个想想就让人发怵的庞然大物,顺利通过第一层防火墙还记得《上海证券交易所交易规则》第六章“交易行为监督”对日内交易的诸多限制吧,设计好算法躲避一下。的数据,靠人力搜索显然也不现实。依托如此之多的账户证监会2011年“12月9日下午通报了一起迄今为止最大规模的有组织操纵证券市场案。该案累计交易金额近572亿元,涉及552只股票,非法获利4.26亿元。”违法人员“在44家证券营业部开立112个资金账户,使用148个证券账户……”看到这个新闻,或许迷信市场已经清澈见底的投资者可以清醒了。这个相互博弈、共同提高的过程从来就没有终结过。想弄出个“随机现象”似乎也不是难事……现在还有谁对监管抱有绝对的信心?不过,我们不应该走得太远,很多东西就是个成本和收益的平衡问题,监管和操纵也是如此。当可能存在着合理合法的盈利手段的时候,为什么要铤而走险呢?我们面对的只是贪婪,又不是不对抗监管就会死的绝境不是么?竭尽全力的做个好人会让我们心安很多,至少独自一人时不会因回想起那些不光彩而五味杂陈。

(第四节)股市博弈论、筹码分布与神经网络

真正的世界总是有多种声音,至少在投资分析领域还是如此。神经网络是笔者10年前见过的国内公开出版的非学术性论文中研究方法上跨越最大的一次尝试。笔者也是以此为契机,开始接触了人工神经网络技术、模式分类、最优化等其他学科分析手段。笔者也确实因为人工神经网络的使用从一个多少对华人有些成见的老师那里拿过杰出。所以,本着感恩的心态,将此单独列为一节。

时过境迁,当年整个行情软件市场都为之或多或少出现过改变的技术,今天似乎已经悄无声息了。又是一个有起有落的轮回,我们究竟应该从中知道些什么呢?

首先,神经网络到底是什么?这可能是读者也会觉得好奇的一个问题。袁曾任先生的《人工神经元网络及其应用》对其的定义是:“生理学上的真实人脑神经网络的结构和功能,以及若干基本特征的某种理论抽象、简化和模拟而成的一种信息处理系统”。如同以往一样,定义需要应用层面上的扩展才能显得有些乐趣。笔者至今还保留着当年学习时用的12本相关书籍,可仔细回想究竟什么东西对投资分析有用时却是一片茫然。线性运算、传递函数、网络结构的设计与自适应谐振模型在模式分类上的应用,别的恐怕没留下太多的印象。显然,神经网络是一门很复杂的学科神经网络可以用来发现输入数据的非线性关系而且不用事先假设数据遵从某一特定函数。只要网络结构适当,其可以任意目标精度来逼近任意函数。这一属性为其在金融市场的应用提供了动力。不幸的是,这里要掌握一个网络结构与训练时间的平衡,因为网络的训练是极端耗时的。对于某些复杂的网络,训练时间甚至以天为单位。例如,Lawrence(1997)就曾指出一IBM股票模型系统就用了BP法在30小时的训练后仍未收敛。而另一个 3—32—16—1 的BP系统在英国股票数据的训练上花费了3—4天完成30,000次迭代。今天计算机的数据处理能力已经有长足进步,但必要时仍需要研究员简化网络结构。,纳入到金融工程中并不过分实际上,国内研究所和国外的学术机构也都是这么做的。但笔者可以负责任的向读者说明,这种技术应用有一大部分是为了与弱有效市场对抗的例如:Leung et al(2000)employed the GRNN,which is a derivative of RBFNN,to analyze three currencies(Canadian Dollar,Japanese Yen,British Pound)from January 1974 through July 1995.The results suggested that GRNN could provide better forecasts than the other forecasting approaches(random walk and MLFN).They also found out that the means of MAE and RMSE for the GRNN forecasts were significantly lower except the case of British pound.Therefore,they concluded that GRNN outperformed the random walk。换句话说,这是为了技术分析的应用争取地盘的行为,而且只要你有信息技术人员的协助,训练好的神经网络可以作为一个二级市场指标出现在KDJ、MACD所相应出现的位置。究竟是金融工程还是技术分析?只有那些再无其他重要事情可做的人才会在这种无聊的分类上打转。投资领域并不看谁的血统好,基因里全是巴菲特、格雷厄姆和彼得·林奇的片段,打不过市场的结局也还是一样遭到淘汰。

数量化分析模型可以分为结构型与非结构型两类 这基本上是一个可以充分发挥想象力的领域。Andreou,Georgopoulos 和 Likothanassis(2002)使用 GA方法优化神经网络结构。Yu,Wang 和 Lai(2005)构建了使用人工神经网络的3种广义线性自回归模型。特点主要在于:(1)使用ANN去纠正GLAR的预期偏差;(2)将预测过程变为一个动态线性规划使得预测模型的权重得以适应;(3)非线性整体预期模型采用了PCA方法压缩传递入最终预估网络的备选模型。结构模型包含经济类解释变量在回归结构中,但效果往往也只是一般。而非结构型模型经常会把时间序列数据作为研究重点。神经网络模型和ARCH系模型都可以用于后者,尽管神经网络本身可以轻松的扩展到多变量领域。

数量化是个很宽广的领域,只要研究员能力可及且有应用意愿,算法设计层面的限制极少。编出来的例子喜欢用什么诸如AR—GARCH、ARMA—GJR 或ARMA—EGARCH之类的计量模型对比一下也可以,不为了应付特殊需求连这些麻烦也可以省了这里的语境是一个极度宽松的氛围。对方法应用的很多基础并没有去苛求。就个人经验来说,笔者喜欢从状态的角度入手尝试剥离波段。这里面常会有一个基准问题。这些模型的作用仅仅是提供了一个基准的产生方法。毕竟ARCH系是借用来的方法,主要目的还是研究风险特性。对其预期能实现的效果自然也要有个限度。一个值得多说两句的问题是“实际应用过程中,其实有很多领域不必过分追求严谨”。这是一个听上去有些降低要求的建议,但却是发生在生活中的实例。例如,我们考虑一下符号和值的预测问题。

符号预测最常用的两种方法:

(1)Success Ratio:直观方法,根据lvarez—Diaz & lvarez(2005)

SR=∑Mt=1θ[rt·t>0]M(For one period ahead forecast)

Where rt is the actual return,t is the predicted return.θ(·) is the Heaviside function(θ(·)=1 if rt·t>0 and θ(·)=0 if rt·t<0)

(2)Pesaran 和 Timmermann 检验: 非参数检验方法。Pesaran 和Timmermann(1992)给出的统计量:

Sn=-*vr-vr(*)1/2~N(0,1)

Where vr=n-1*(1-*) and

vr(*)=n-1(2y-1)2x(1-x)+n-1(2x-1)2y(1-y)+4n-2xy(1-x)(1-y)

Where y=∑nt=1Yt/n=

x=∑nt=1Xt/n= and*=yx+(1-y)(1-x)

=∑nt=1Zt/n=

Yt=1ifyt>0

=0otherwise,;

Xt=1ifxt>0

=0otherwise,;

Zt=1ifytxt>0

=0otherwise。

相信我,绝大部分研究员就只会停留在Success Ratio方法上。

点预测问题就更为突出,比如小样本通过不了Lilliefors检验,就会引来使用配对检验合理性的怀疑。较为稳妥的方法之一是使用 Mizrach(1993) 和(1995)所给出的统计量:

M=1/n∑nj=1ujvj1/n∑kt=-k(1-(t/k+1)SUVUV(t))1/2~N(0,1)

where SUVUV(t)=1/n∑n-tj=1ujvjuj+tvj+t,

uj=e1,j-e2,j

vj=e1,j+e2,j and k is the order of dependence.

现实中,一般是不会有人费这么大力气去查看一个如此卑微的问题。毕竟还有其他方法可以将收益率分布有偏化,所以太追求这种细节往往意义不大。不过,它还是给读者一个广阔的空间去发挥自己的才智。

笔者不会如同行业惯例一样的批评“技术分析”,因为“技术分析”并不缺少批评,而是缺少正确对待。接触任何一样事物,都要尝试着从中学习有用的东西,而不是因为其缺点而给予完全否定。重新想想我们应该记住什么:

1.“技术指标确实能增加投资过程的价值。”

2.以组合的形式依托大数定律进行操作。

3.尽量使用自定义的算法来进行操作,如果不具备此项能力,至少要调整参数。

4.通过辅助其他策略来反向操作,控制风险。

如果现在读者还是不能用数量化式的思维来考虑技术分析也没关系,数量化至少还有经济类和行业、公司相关数据可以采纳。不过,丢掉一大块乐趣还真是损失。很多其他学科的技术处理手段都可以在数量化领域得以应用。附件1是应用网络学习过程来举的一个例子。笔者的英语翻译能力不好,所以将当年的总结直接复制过来。觉得阅读有困难的读者也可以略去此附件用自己喜欢的数学方法来解决问题。其中Variable Learning Rate方案就可以被用来处理自适应均线问题。广泛的吸收营养,不要轻信一家之言是我们对待很多事物的共同选择,投资领域也同样适用。