第22章 绩效评估与预测¶
原文: Chapter 22 - Performance Evaluation and Prediction
许多人交易是因为他们想成功投机。他们希望通过买入将升值的证券和合约、卖出将贬值的证券和合约来获利。
不幸的是,对于我们这些想快速致富的人来说,预测未来价格是相当困难的。有些人可以做到,但大多数人不能。成功的投机者必须足够好地预测未来价格,以平均战胜市场。不成功的投机者最终在交易中亏损。他们充其量赚的钱比简单买入并持有指数基金少。如果他们交易仅仅是因为想赚取投机交易利润,他们应该停止交易。
本章中,我们考虑如何衡量过去绩效以及如何预测未来绩效。这两个问题密切相关。大多数人衡量过去绩效主要是因为他们想预测未来绩效。我们将看到为什么仅基于过去绩效的预测通常相当不可靠。使用其他信息可以更好地预测绩效。
如果你打算投机,你必须能够预测绩效。投机者交易只是因为他们期望获利。因此,成功的投机者必须不断考虑他们的交易是否会盈利。如果你无法预测自己是否会盈利交易,你就不应该投机。投机者做出的最重要决定是他们是否应该交易。
如果你雇佣主动投资经理代表你投机,你也必须能够预测绩效。主动投资经理用客户的钱进行投机。他们是主动的,而不是被动的,因为他们积极尝试识别和利用投机机会。因此,他们经常频繁交易。你可以雇佣他们作为投资顾问来获得他们的服务,或者你可以通过购买他们管理的共同基金和商品池间接获得他们的服务。无论哪种情况,当经理代表你投机时,你是在投机他们的成功。要选择好的主动投资经理,你必须预测哪些人会成功投机。如果你无法预测哪些经理会成功,你就不应该雇佣主动投资经理。投资委托人做出的最重要决定是是否雇佣主动经理。
相信自己无法成功投机的投资者通常将钱投资于被动投资经理。被动投资经理使用买入持有策略 (buy and hold strategies)。他们只是买入并持有证券。因此,被动经理很少交易。最常见的买入持有策略是指数复制策略 (index replication strategy)。指数复制者买入并持有他们设计用来复制广泛市场指数回报的投资组合。我们将在下一章(指数市场)讨论他们如何做到这一点。
指数化 (Indexing) 非常流行,因为许多投资者已经决定他们不想投机。他们不相信自己会成为成功的交易者,也不相信自己能挑选到成功的经理。绩效评估和预测的局限性有助于解释为什么指数市场如此受欢迎。
人们经常设计投资管理合同,使投资经理获得的报酬取决于他们产生的绩效。此类合同鼓励投资经理更好地为客户服务。你必须理解绩效评估的局限性,才能理解如何最好地补偿投资经理,以及理解典型投资管理合同中出现的问题。
我们的讨论从区分技能和运气这一主要问题开始。然后我们简要考虑绩效评估的机制。如果你已经知道分析师如何计算回报,以及他们如何以及为什么将回报与基准回报进行比较,你可以跳过这一部分。然后讨论转向预测绩效的问题。我们首先考虑统计学家如何处理这个问题,并解释为什么他们的方法不是很有力。然后我们将考虑基于经济理论的绩效预测替代方法。
到本章结束时,你将理解为什么过去绩效不一定预测未来回报。你还将理解样本选择偏差 (sample selection biases) 如何影响你可能对投资决策做出的推断。未能理解这些问题可能比交易者犯的任何其他错误导致更多的交易损失。
22.1 绩效评估问题¶
投资组合绩效部分取决于其管理质量。表现良好的经理为其投资组合增加价值。表现不佳的经理浪费价值。
投资组合绩效还取决于决定组合中工具价值的每个因素。这些因素可能包括宏观经济、微观经济和公司特定因素。宏观经济因素包括利率变化、总体经济活动、生产力和汇率。微观经济因素包括行业供需状况、技术创新和政府干预。公司特定因素包括从公司管理是否良好到工厂是否意外烧毁到研究人员是否有幸运发现等一系列问题。
主动经理试图预见影响价值的每个因素。然后他们买入预期会升值的工具,卖出预期会贬值的工具。如果他们非常熟练,他们将能够通过选择买入和卖出哪些工具为其投资组合增加大量价值。
没有人能预见影响投资组合回报的大多数因素。因此,不可预见的因素对绩效有看似随机的影响。表现良好的投资组合可能由熟练的经理管理,也可能由幸运的经理管理。同样,表现不佳的投资组合可能由不熟练的经理管理,也可能由不幸的经理管理。
Sizzler 餐厅的大肠杆菌事件¶
Sizzler International 是一家经营/特许经营烤肉家庭餐厅的公司。Sizzler 在美国经营65家公司门店,并特许经营另外200家门店。1998年,该公司进行了自愿的第11章破产重组。到2000年中期,其收益正在加速,许多仔细研究了该公司及其未来前景的分析师认为,它有一个重振连锁店的成功策略。基于他们的研究,许多投资经理买入 Sizzler,期望它会跑赢市场。
他们没有实现期望。2000年7月,大肠杆菌 (E. Coli) 感染了密尔沃基一家 Sizzler 特许经营店的42名顾客。17人住院,一名三岁女孩死于感染并发症。
食用未煮熟的肉类或被生肉污染的食物会传播大肠杆菌感染。密尔沃基卫生专员认为食用被污染的西瓜传播了感染。
有关疫情的消息在全国得到广泛宣传。宣布后,Sizzler 的股票下跌了35%,因为投资者担心随之而来的诉讼和声誉损失。
买入 Sizzler 的投机者可能对其未来前景非常了解。他们无疑知道食物中毒事件偶尔会困扰连锁餐厅,他们可能相应地对 Sizzler 的股票——以及其他连锁餐厅的股票——打了折扣。有些人甚至可能考虑过 Sizzler 是否设计和实施了适当的卫生程序来适当控制他们面临的风险。尽管有所有这些考虑,Sizzler 大肠杆菌食物中毒事件可能是不可预测的。这些投资者只是不幸。
管理许多投资组合的投资政策通常对投资组合绩效有重大影响。这些政策可能禁止熟练的经理利用积极因素或避免消极因素。它们也可能迫使不熟练的经理在不知不觉中利用积极因素或避免消极因素。因此,表现良好的投资组合可能由熟练的经理管理,也可能只是由受市场当前青睐的投资政策约束的幸运经理管理。同样,表现不佳的投资组合可能由不熟练的经理管理,也可能由受当前不受青睐的投资政策约束的熟练经理管理。
例如,考虑必须全额投资于股票的投资组合的绩效。无论管理如何运作,这些投资组合的价值都随市场波动。当市场上涨时,即使管理最差的投资组合也可能有高正回报。市场上涨可以抵消拙劣管理造成的损失。同样,当市场下跌时,管理最好的投资组合可能有负回报。市场下跌可以压倒优秀管理带来的收益。
不可预见因素和不可避免因素大大复杂化了绩效评估问题。这些因素使估计经理对投资组合绩效的贡献变得困难。良好的绩效评估必须区分技能和运气。分析师必须将总绩效分解为代表管理贡献和没有人能预见或控制的因素贡献的单独组成部分。
估计没有人能预见或控制的因素的贡献的任务非常困难,因为有如此多的因素影响投资组合回报。即使是对经理绩效的最佳估计也相当嘈杂。区分技能和运气作为投资组合绩效的解释非常困难。
22.2 绩效衡量的机制¶
在我们讨论区分技能和运气的困难之前,我们需要简要回顾一下绩效衡量的基本机制。如果你已经熟悉如何计算回报和如何使用基准,可以跳过这一部分。
22.2.1 回报计算¶
投资组合回报衡量投资组合价值在一段时间内的变化百分比。最简单的回报计算是:
其中收入包括股息、利息或其他分配。
对于评估较长时期的绩效,需要考虑现金流入和流出。有两种主要方法:
时间加权回报 (Time-weighted return): 衡量投资组合管理的绩效,消除了现金流入和流出的影响。这是评估投资经理技能的标准方法。
资金加权回报 (Money-weighted return): 衡量投资者实际获得的回报,考虑了现金流的时机。也称为内部收益率 (IRR)。
22.2.2 基准比较¶
要评估绩效,我们需要将投资组合回报与适当的基准 (benchmark) 进行比较。基准代表了投资者如果采用替代策略本可以获得的回报。
常见基准类型:
- 市场指数: S&P 500、Russell 2000 等
- 同类基金平均: 相似策略基金的平均回报
- 定制基准: 根据投资政策定制的指数组合
- 无风险利率: 国债收益率
超额回报 (Excess return) 或 阿尔法 (alpha) 是投资组合回报超过基准回报的部分:
正阿尔法表明经理增加了价值;负阿尔法表明经理破坏了价值。
22.2.3 风险调整绩效¶
原始回报不能完整地说明绩效,因为高回报可能只是承担高风险的结果。风险调整绩效衡量试图考虑风险:
夏普比率 (Sharpe Ratio):
夏普比率衡量每单位总风险的超额回报。
信息比率 (Information Ratio):
其中跟踪误差是超额回报的标准差。信息比率衡量每单位主动风险的阿尔法。
特雷诺比率 (Treynor Ratio):
特雷诺比率衡量每单位系统性风险的超额回报。
詹森阿尔法 (Jensen's Alpha):
基于资本资产定价模型 (CAPM):
詹森阿尔法衡量经过系统性风险调整后的超额回报。
22.2.4 归因分析¶
绩效归因 (performance attribution) 将总回报分解为不同来源的贡献:
资产配置效应: 在不同资产类别间配置资金的决策贡献 证券选择效应: 在每个资产类别内选择特定证券的贡献 交互效应: 资产配置和证券选择相互作用的贡献
这种分解有助于理解经理的价值来自哪里。
22.3 技能与运气的区分¶
绩效评估的核心挑战是区分技能和运气。这是一个统计推断问题。
22.3.1 统计显著性¶
要确定观察到的阿尔法是否代表真实技能而不是运气,我们需要进行统计检验。零假设 (null hypothesis) 是经理没有技能,观察到的绩效完全是运气。
t-统计量:
如果 t-统计量足够大(通常大于2),我们可以拒绝零假设,得出结论:绩效不太可能仅仅是运气。
22.3.2 检验力问题¶
问题是即使经理确实有技能,检测到它也需要大量观察:
示例: 假设一位经理每年产生2%的真实阿尔法,年回报标准差为20%: - 以95%置信度检测到这种技能需要约 (2 × 20 / 2)² = 400 年的数据! - 即使有10年数据,t-统计量也只有 2 / (20 / √10) ≈ 0.32,远低于显著性阈值
这说明了一个基本问题:从有限的绩效历史中可靠地推断技能极其困难。
22.3.3 多重检验问题¶
当我们评估许多经理时,问题变得更糟。假设我们观察100位没有技能的经理(真实阿尔法为零):
- 以5%显著性水平,我们预期平均有5位经理会显示统计显著的正绩效,纯粹是运气
- 我们还预期有5位会显示统计显著的负绩效
- 如果我们只关注表现最好的经理,我们会被误导认为他们有技能
这被称为数据挖掘偏差 (data mining bias) 或选择偏差 (selection bias)。当我们只看成功者而忽略失败者时,我们夸大了技能的证据。
22.3.4 生存偏差¶
生存偏差 (survivorship bias) 是选择偏差的一种特殊形式。表现不佳的基金往往关闭或被合并,从数据库中消失。如果我们只分析现存基金,我们会高估平均绩效:
- 研究表明生存偏差可能夸大基金回报1-2%每年
- 长期绩效研究特别容易受生存偏差影响
- 必须使用包含已关闭基金的"无生存偏差"数据库
22.3.5 回填偏差¶
回填偏差 (backfill bias) 或即时历史偏差 (instant history bias) 发生在数据库中:
- 基金开始向数据库报告时,通常回填其历史回报
- 只有成功的新基金才会选择报告;失败的保持隐蔽
- 这会向数据库添加有偏的历史回报
研究表明回填偏差可能夸大基金回报每年高达1.4%。
22.3.6 发表偏差¶
学术研究中存在发表偏差 (publication bias):
- 显示显著结果的研究更可能被发表
- 显示"无效应"的研究往往束之高阁
- 这使文献中可用证据有偏
元分析 (meta-analyses) 试图通过综合所有研究(包括未发表的)来纠正这一点。
22.4 绩效持续性¶
即使我们能够识别出过去的优秀绩效,关键问题是:过去绩效能否预测未来绩效?
22.4.1 随机游走理论¶
如果回报遵循随机游走 (random walk),过去回报不包含关于未来回报的信息。在这种情况下:
- 过去绩效不预测未来绩效
- 经理排名纯粹是随机的
- "热手"(hot hands) 只是统计幻觉
许多研究发现股票回报接近随机游走,这表明预测困难。
22.4.2 绩效持续性的证据¶
尽管如此,一些证据表明绩效存在有限的持续性:
短期持续性: - 动量效应:过去3-12个月的赢家倾向于继续跑赢 - 可能反映信息的逐渐扩散或行为偏差
负向持续性: - 过去的输家倾向于继续表现不佳 - 这比正向持续性更强且更持久 - 可能反映真实的管理无能或结构性障碍
成本的持续性: - 高费用基金持续表现不佳 - 交易成本和管理费是可预测的拖累
22.4.3 基金绩效研究¶
大量研究检验了共同基金绩效的持续性:
早期研究: 发现很少或没有持续性证据 - 过去赢家和输家未来绩效相似 - 与随机游走一致
近期研究: 发现适度持续性,特别是: - 极端输家倾向于继续表现不佳 - 调整费用后,极少有基金持续跑赢 - 低成本指数基金持续表现良好(通过降低成本)
总体结论: 过去绩效是未来绩效的弱预测因子,主要通过成本渠道。
22.4.4 为何持续性有限?¶
几个因素限制了绩效持续性:
竞争: - 成功的策略吸引资金和模仿者 - 增加的竞争侵蚀利润 - 阿尔法是零和游戏
资产增长: - 成功基金吸引大量资金流入 - 大规模使执行困难策略更难 - 最佳机会的容量有限
均值回归: - 极端绩效部分是运气 - 运气随时间均值回归 - 真实技能信号被噪音淹没
变化的环境: - 在一种市场环境中有效的策略在另一种中可能失败 - 技能可能是环境特定的 - 很少有策略在所有环境中有效
22.5 预测绩效的替代方法¶
既然我们理解了仅依赖过去回报预测绩效的局限性,让我们考虑更好的方法。
22.5.1 基于特征的预测¶
不只是看过去回报,而是看预测未来绩效的特征:
成本: - 费用率是未来绩效的强力负向预测因子 - 周转率(交易成本的代理)预测较差绩效 - 低成本是可持续优势
规模: - 较小基金倾向于跑赢较大基金 - 资产增长预测较差的未来回报 - 寻找尚未发展到最优规模之外的基金
经理特征: - 经理任期:经验丰富的经理可能表现更好 - 经理共投 (skin in the game):大量个人投资使激励一致 - 经理教育和背景
投资组合特征: - 主动份额 (active share):与基准的差异度 - 集中度:持股集中可能表明信念 - 风格一致性:漂移策略表现较差
22.5.2 基于过程的评估¶
评估投资过程而不只是结果:
研究能力: - 分析团队的规模和质量 - 数据和技术资源 - 研究过程的严谨性
执行能力: - 交易台质量 - 交易成本分析 - 风险管理系统
组织结构: - 激励一致性 - 决策过程 - 组织稳定性
哲学和纪律: - 清晰阐述的投资哲学 - 遵守该哲学的纪律 - 从错误中学习的能力
良好的过程不保证良好的结果,但它增加了成功的概率。
22.5.3 情境分析¶
理解策略在不同市场环境中何时表现良好:
风格分析: - 价值 vs 成长 - 大盘 vs 小盘 - 动量 vs 反转
因子暴露: - 市场、规模、价值、动量因子 - 理解回报来源 - 评估因子暴露是否有意为之
情境绩效: - 在牛市 vs 熊市中的表现 - 在高波动性 vs 低波动性中的表现 - 在不同利率环境中的表现
这有助于评估经理是否适合你的需求和市场观点。
22.5.4 元认知评估¶
评估经理对其自身能力和局限的理解:
校准: - 经理对其预测有多自信? - 他们的信心与准确性匹配吗? - 过度自信是常见偏差
适应性: - 经理如何应对不利绩效? - 他们从错误中学习吗? - 他们适应变化的条件吗?
诚实: - 经理对其策略的局限性坦诚吗? - 他们夸大其能力吗? - 他们能说"我不知道"吗?
优秀的经理理解其能力圈的界限并在其中运作。
22.6 投资管理合同¶
理解绩效评估的局限性对设计投资管理合同至关重要。
22.6.1 激励费用结构¶
许多合同包括基于绩效的费用:
对称激励费用:
这在上行和下行都奖励/惩罚经理。
非对称激励费用:
这只在经理跑赢时奖励,创造了期权样的回报结构。
22.6.2 激励问题¶
非对称激励费用创造道德风险:
风险承担: - 经理从上行获益但不承担全部下行 - 鼓励过度冒险 - 类似于给经理一个免费看涨期权
风格漂移: - 表现不佳的经理可能承担更多风险以"追赶" - 偏离声明的策略 - 损害客户
短期主义: - 如果绩效在短期内衡量,经理可能牺牲长期价值 - 机会主义交易 - 窗口修饰
22.6.3 高水位标记¶
为缓解激励问题,许多合同包括高水位标记 (high-water mark):
- 激励费用仅在投资组合超过先前峰值时支付
- 防止经理在损失后恢复到盈亏平衡时获得激励费用
- 使激励更对称
22.6.4 绩效衡量期¶
合同必须指定绩效衡量期:
短期(季度或年度): - 允许快速识别问题 - 但增加噪音,使技能和运气难以区分 - 可能鼓励短期思维
长期(3-5年): - 提供更好的技能信号 - 但延迟反馈和纠正行动 - 更符合长期投资
滚动期限(例如,滚动3年)提供折衷。
22.6.5 赎回条款¶
合同条款管理投资者何时可以撤资:
流动性条款: - 赎回通知期 - 赎回频率(月度、季度、年度) - 封闭期(投资者必须保持投资的时间)
门槛和侧袋: - 门槛限制一次可以赎回多少 - 侧袋将非流动性资产分离 - 保护剩余投资者免受赎回影响
这些条款平衡投资者流动性需求与经理实施长期策略的能力。
22.7 指数化的论证¶
绩效评估和预测的困难为被动指数化提供了强有力的论证。
22.7.1 主动管理的挑战¶
大多数主动经理表现不佳的原因:
成本: - 主动管理费用通常为0.5-2%每年 - 交易成本增加0.5-1% - 这些成本每年复合,长期累积巨大
竞争: - 你在与高技能的专业人士竞争 - 市场相当有效率 - 发现并利用错误定价困难
运气主导: - 短期至中期绩效主要是运气 - 识别真正技能需要很长时间 - 大多数优秀绩效是运气,会消失
22.7.2 指数化优势¶
被动指数基金提供:
低成本: - 指数基金费用低至0.03-0.20%每年 - 最小交易成本 - 成本差异确保指数基金平均跑赢大多数主动基金
分散化: - 即时分散化到整个市场或部门 - 消除公司特定风险 - 获得市场回报
简单性: - 容易理解和监控 - 无需评估经理技能 - 无需担心风格漂移
税收效率: - 低周转率最小化资本利得 - 特别有利于应税账户
22.7.3 何时考虑主动管理¶
尽管存在挑战,主动管理在某些情况下可能合适:
低效市场: - 新兴市场 - 小盘股 - 专业部门 - 可能提供更多错误定价机会
特殊技能: - 真正独特的洞察或能力 - 信息优势 - 优越的执行能力
定制需求: - 税收管理 - 社会责任筛选 - 特定风险暴露 - 指数基金可能不满足
补充策略: - 核心-卫星方法:被动核心 + 主动卫星 - 在低成本指数持股周围选择性使用主动管理
22.8 实用建议¶
基于我们对绩效评估和预测的讨论,以下是实用建议:
22.8.1 对投资者¶
-
怀疑短期绩效:几年的优秀绩效可能只是运气。需要至少10-20年的数据来可靠地识别技能,而大多数人没有那么多时间。
-
关注成本:成本是可预测的,而回报不是。最小化成本是增加预期回报的最可靠方法。
-
考虑指数化:对大多数投资者来说,低成本指数基金是简单、有效的解决方案。
-
如果使用主动管理:
- 基于过程,而不只是过去回报选择
- 寻找低成本、规模合理的基金
- 对费用结构持怀疑态度
-
保持长期视角
-
了解你自己:你能容忍跑输指数的时期吗?你能抵制追逐过去赢家的诱惑吗?
22.8.2 对投资经理¶
-
诚实对待能力:理解你的能力圈。不要声称你不具备的技能。
-
关注过程:你无法控制短期结果,但可以控制过程。良好的过程长期产生良好的结果。
-
管理规模:不要让基金增长超过策略的容量。有时说"不"对更多资产更好。
-
对客户透明:解释策略、风险和局限性。在困难时期尤其沟通。
-
使激励一致:将自己的钱投资于与客户相同的策略。
22.8.3 对监管机构¶
-
要求披露:全面披露费用、绩效和风险。标准化格式使比较容易。
-
打击虚假广告:禁止误导性绩效宣传。要求适当的免责声明。
-
促进竞争:降低进入壁垒。鼓励低成本替代品。
-
投资者教育:帮助投资者理解风险、多样化和成本重要性。
-
监控激励:确保费用结构不鼓励过度冒险或其他有害行为。
小结¶
绩效评估和预测充满挑战:
-
技能与运气难以区分:短期至中期绩效主要由运气驱动。可靠地识别技能需要大量数据,而大多数投资者没有。
-
样本选择偏差很普遍:生存偏差、回填偏差和多重检验问题使绩效看起来比实际更好。
-
绩效持续性有限:过去绩效是未来绩效的弱预测因子,主要通过成本。成功策略吸引竞争,侵蚀阿尔法。
-
成本是可预测的:虽然回报不确定,成本是确定的。最小化成本是增加预期回报的最可靠方法。
-
过程胜过结果:在短期内评估过程,而不只是结果。良好的过程不保证良好的结果,但增加概率。
-
指数化的论证是强有力的:对大多数投资者来说,低成本指数基金是简单、有效的解决方案。主动管理的高门槛意味着只有在特殊情况下才合理。
-
激励结构很重要:投资管理合同必须仔细设计以使激励一致并避免鼓励不当行为。
理解这些原则对做出明智的投资决策至关重要。无论你是投资自己的钱还是管理他人的钱,认识到绩效评估和预测的局限性有助于你避免代价高昂的错误。
要点回顾¶
- 投资组合绩效反映技能、运气和投资政策的结合
- 区分技能和运气需要大量历史数据,通常无法获得
- 多重检验、生存偏差和回填偏差夸大表面绩效
- 绩效持续性有限;过去赢家不一定是未来赢家
- 成本是可预测的绩效拖累;低成本策略具有持久优势
- 评估过程和特征,而不只是过去回报
- 激励费用结构必须仔细设计以避免道德风险
- 对大多数投资者,低成本指数化是合理的默认选择
思考题¶
-
为什么即使经理有真实技能,从有限的绩效历史中检测到它也如此困难?需要多少年的数据?
-
解释生存偏差如何导致对基金行业绩效的过度乐观评估。如何纠正这种偏差?
-
如果过去绩效是未来绩效的弱预测因子,投资者应该使用什么其他信息来选择投资经理?
-
为什么绩效持续性如此有限?描述限制持续性的主要因素。
-
非对称激励费用(只在上行支付)如何创造道德风险?高水位标记如何有所帮助?
-
在什么情况下,尽管存在挑战,主动管理可能优于被动指数化?
-
核心-卫星方法如何结合指数化和主动管理的优势?
-
作为投资委托人评估候选投资经理时,你应该提出什么关键问题?你如何评估他们的过程而不只是结果?