书城投资量化投资的转折:分析师的良知
4301600000028

第28章 如果你想尝试打败市场——组合管理(3)

实际上,类似的例子可以举很多。肯尼思.L.费雪的《超级强势股》一书对市销率和市研率的阐述也可以被纳入其中笔者花费如此大的篇幅来叙述这个分支,实际上是为了让读者能有另一个认识。如果读者希望从基本面的角度入手,就要明白那些天花乱坠的故事最后要落实到的指标实际上就那么几类。你从价值的角度走,无论绕了怎样的圈,落脚点还是那些比率和指标。这个问题,西格尔教授在《投资者的未来》第5.3章节:“第一课,定价至关重要”有过论述。笔者就不再重复了。连“Quantitative Strategies For Achieving Alpha”都没有逃开这个框架,别的自然可想而知。至于上下游的数据分析逃不开两个问题:(1)纳入估值框架下的传递是否顺利;(2)数值上的高相关关系或指标先行效果的挖掘。如同本书一贯的观点,数量化领域根本就没有什么本质限制。笔者建议读者能够在履行此类策略之前予以三思。不仅仅是因为这些公开策略的效果究竟还能维持多久这样的应用问题,更有数据频率带来的操作周期问题。笔者愚以为间隔越久就越类似于赌博,无论是否采用数量化的方法,都是如此。在这一点上,笔者不站在任何投资逻辑的一边。长时间间隔必然意味着新信息的产生影响的可能性增大,就单从这一点来说,本着固定策略不变就极端危险。一种处理思路是考虑策略结合的问题,让这些基于基本面的数量化策略负责一定的选股工作,而择时问题交给基于二级市场数据的量化策略。其实,笔者在第三章(第七节)曾经指出过这个问题。投资者情绪可以用一些市场指标来刻画,并设置一定的激发条件予以遵守。其在时间层面上的灵敏程度是可调的。但另一方面,投资者什么时候开始不买账一个故事却难以监控实际上,如果认为分歧是交易存在的前提,则问题转化为不买账程度。很多微妙的平衡甚至就不存在一个可以清晰描述的框架,更不要说想要系统的监控了。而且,发现往往为时已晚。从实际应用的角度出发,这两者之间的内部不协调往往是需要忽略的问题。不过,也正如笔者在第五章(第十节)所讲述一样,我们不能轻易的否定此类方法在信息捕捉上可能提供的潜在作用。

2.二级市场数据的量化策略:笔者一直以为这是个值得探索的领域幸运的是,2010年国信证券数量化研究团队以总结报告的形式指出了这一点。这让笔者知道,或许笔者的这点固执并不是完完全全的性格缺陷。但此问题一旦扩展,细究起来就有某种程度的偏离原有定义的嫌疑。就笔者的经验来看,想要在依靠二级市场数据建立的策略基础上分离“择股”与“择时、组合管理”是极难实现的一个问题。比如,程序化识别一个形态而进行的股票选择是否更应被纳入到择时领域都可以讨论,而同一时间出现多个符合条件的个股要如何配置则是另一个不得不考虑的现实问题由于后文将仓位问题作为选点阐述,所以笔者认为此处还是有必要提及一下注意事项。估计读者第一个闪过的念头与笔者类似,我们完全可以通过单一指标排序,然后建立权重分配函数的方式进行日级别的调整。比如,一个非常直接的目标权重函数可以是这样的:

Function linear—adjust(ByVal position As Variant,ByVal n As Integer,ByVal diff As Variant,ByVal i As Integer)

linear—adjust=2* position*(n—diff)/(n*(n—diff—1+diff* n))+i* 2* position*(—1+diff)/(n*(n—diff—1+diff* n))

End Function

伴随而来的是一个不得不考虑的问题:操作次数。我们已经知道过高的交易频率绝对是蚕食收益率的罪魁祸首,所以想要基于一个每日调整的频率上做出一个收益率满意的策略难度之大可以想象。一个修改方案是基于缓冲空间和现金头寸来整理思路。当然了,这个领域的选择并不是唯一的,我们甚至可以用包括时间在内的诸多因素来考虑修改的细节。鉴于这个领域也十分的广阔,所以笔者认为,介绍到这里就可以了。时刻记住,仓位调整策略的一个主要对手是操作频率。一个良好的仓位策略也仍然有可能需要用相当比例的收益率进行“等价交换”,这也是模拟和现实拉近距离必须要考虑的一个问题。鉴于这个原因,我们只能将这个可能包含择时问题的策略也一并考虑,并假设组合管理策略的收益率影响暂时不存在。

这是一个基于过去5年,没有考虑自适应性的例子。按照笔者的写作风格,这个例子肯定不仅仅只是在讲述收益率这么一个问题。在这里将其列举出来的目的主要是另外两个方面:(1)仓位和组合管理策略的重要性;(2)非自适应环境下的模型局限。首先,组合管理策略一定是大资金要考虑的第一个问题。其对收益率的影响(往往是损耗)程度一定不可忽视。别看笔者所列举的示例收益率有较好的表现,但千万别忘了,笔者假设组合管理策略的收益率影响暂时不存在。一旦将此因素考虑进去,组合的收益率会大打折扣。但这个问题往往对于大资金的意义要更明确,对小资金,尤其是仅仅确定某一标的的操作方式影响甚微。鉴于大资金往往会组织力量进行此方面的应对,所以笔者也不会将其作为重点阐述。其次,自适应效果是我们会尝试追求的目标之一;否则,模式迁移的影响将会对算法产生较大的打击此处,需要指出的是,即便考虑自适应性也仅仅是对此问题作出一个应对。想要得到彻底的保证基本上不可能。时刻别忘了,这是个不确定性的市场,我们只是在为了提高胜率而付出努力。

本节末尾,笔者想说一句题外话。如果可以,最好能以团队合作的方式来进行此类算法的开发。笔者特意强调这一点,着实是因为这种复杂程度工作如果仅由个人来实现,将会是让人濒于崩溃的处境。笔者原想将本节这个示例的代码作为附件3列于本书末尾,但长达18页A4纸的代码还是败给了笔者对简洁的要求。不过笔者还是希望读者能大体了解一下,一个即便是如此简单的策略实现,所要花费的时间和精力。

(第三节)浅谈择时——不联系beta的一个示例

择时竟然不联系beta来进行阐述,确实还是有些挑战的意味。毕竟,市场上择股、择时问题的最常见对应方式就是alpha与beta。不过,既然仓位问题还要涉及beta,笔者愚以为暂时不谈论beta倒也无妨。

笔者在这里想用一个亲身经历的案例来说明数量化算法过程中遇到的一些现实问题,权当是与读者一起经历一次算法设计过程。笔者开始考虑自适应均线问题时,刚好有一位实习生。由于部门内有项目申报牵扯很多精力,所以开始的工作完全交给实习生来完成,直到其他工作结束,才着手开始考虑。

我们遇到的问题有以下四个主要方面:

1.如何确定短期、长期均线的参数,而并不是武断的指定。如果可能,我们希望这两个参数本身会调整。

2.自适应均线的输出采用:SAMA=w·SMA+(1—w)·LMA。w值为短期均线的权重值,其自身会调整。

3.效率实际上,效率定义问题上没有更改。实习生采用了一种基于标准差的结构,但后者无论是在灵敏度和数值分布上都并没有表现出更好的便利性。尤其是数值分布上要多增加一个归一化过程或在对应阶段解决这个问题。与权重的对应关系有待确认:w∝E。

4.综合输出过后的校验方式问题。

一个需要遵循的原则就是:“合理的前提下,减少参数的数量”。但这并没有过多的减少问题复杂度。

1.短期、长期均线的确定是一个最优化的过程。这就意味着需要选取目标函数。一定时期内的价格与均线的拟合优度可以作为一个目标这里的拟合优度实际上只是借用了计量中的相应概念而已。我们要兼顾均线被穿越的次数和价格与均线的距离两个变量。当然,这里也有一个归一化过程。收益率水平也可以作为选择。前者并不直接与收益率相关,而后者就需要在此步骤就给出一个策略校验方式,而这原本是笔者打算在第四步完成的事项。

2.输出方式其实并不固定,诸如EMA的方式也可以适用。自由度过大的部分反倒让焦点旁落。