跳转至

AI + 量化金融系统性学习规划(双轨并行版)

Scriptorium · Curriculum — 本路线图是 scriptorium(外部经典文献研习室)的总图,指导未来扩展方向。已落成的研习成果(如 trading-exchanges-zh/)与未来规划文献,均按本路线图组织。

Context

用户画像

  • 角色:程序员,使用 Claude Code + Codex 开发金融量化
  • 工具栈:fork 了 superpowers + get-shit-done(GSD)工作流
  • 项目载体:The Alephain Guild 量化生态
  • Synedrion(AI Council 系统)、Speculum(回测平台)、Philosophers-Stone(策略孵化)、Crucible(生产执行)、Grimoire(方法论)
  • AI/ML 基础:知道概念但没系统学过(API 调用层,没动过深度学习内部)
  • 量化基础:刚入门(知道夏普/回撤,但因子/微观结构/组合优化未系统学)
  • 时间预算:边做边学,长期持续(12-18 个月规划)
  • 学习偏好:工程优先,但选择方案 C 双轨并行——希望知识体系完整,不要碎片化

为什么是双轨并行(方案 C)

  • 工程优先 ≠ 不要理论。工程优先是"先看到代码长什么样再补数学",但补的过程必须系统。
  • 单轨(只学 AI 或只学量化)会导致 Synedrion 与 Crucible 之间的知识断层——理解不了"AI Council 为什么要这么辩论"或"为什么策略代码要 immutable"。
  • 双轨在 Alephain Guild 里天然交汇:每个子系统都是 AI×量化的组合,学完一层就能在项目里立刻用上。

最终目标(12-18 个月后)

  1. 能独立解读 Synedrion/Crucible/Speculum 任何模块的源码与设计意图
  2. 能在 Philosophers-Stone 里独立实现 ML 增强的多因子策略并通过 Speculum 验证
  3. 能用 Synedrion AI Council 设计新的研究 pipeline,而不是只调用现有 pipeline
  4. 能判断"哪些金融问题适合用 ML 解决,哪些是 ML 的陷阱"——这是最值钱的能力
  5. 能为 Alephain Guild 写自定义 skill / MCP server / hooks,把个人工作流沉淀为团队资产——AI 协作能力可量化、可复用

知识体系总览

                  Alephain Guild 项目(三轨交汇点)
          ┌─────────────────┼─────────────────┐
          │                 │                 │
       AI 轨               量化轨           工具轨(Track 0)
   (从工程到原理)      (从市场到执行)      (贯穿性技能)
          │                 │                 │
   L1 ML 工程基础   ←  L1 市场微观结构  →  T0.1 Claude Code 深度
   L2 深度学习      ←  L2 因子模型      →  T0.2 Codex 协同
   L3 LLM 与 Agent  ←  L3 组合与风险    →  T0.3 MCP 与 Agent 工程
   L4 AI for Finance←  L4 算法交易      →  T0.4 Prompt/Context 工程
          │                 │                 │
          └─────────────────┼─────────────────┘
                  数学基础(横向按需补)
        概率统计 / 线性代数 / 随机过程 / 优化 / 时序

为什么是三轨而不是双轨

工具轨(Track 0)不是与 AI/量化平级的"第三主线",而是"贯穿性技能"——你每天都在用 Claude Code+Codex,工具熟练度的复利效应最大。把工具学习独立列出,但定位是"为前两轨服务",避免变成三条平行学习线让总量爆炸。


AI 轨:从工程到原理,层层深入

Layer A1:ML 工程基础(2-3 个月)

学习目标

熟练使用 pandas / NumPy / scikit-learn / PyTorch,能独立完成监督学习、无监督学习、特征工程的完整工作流,理解过拟合/正则化/交叉验证。

核心读物

作者 年份 用法
《Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow》(3rd ed.) Aurélien Géron 2022 主线,通读。工程优先的 ML 标杆教材
《Python Machine Learning》(4th ed.) Sebastian Raschka 2022 配合 PyTorch 实战的副线
《The Hundred-Page Machine Learning Book》 Andriy Burkov 2019 速读补盲(2 周)

配套实战

  • Kaggle "Optiver Realized Volatility Prediction" 或 "Two Sigma Financial News" 题目走一遍
  • 在 Speculum 里给一个现有策略加一个 ML 特征筛选环节

验收标准(能回答这些问题)

  • 为什么交叉验证在金融时序里要用 walk-forward 而不是 KFold?
  • L1/L2 正则化的几何含义?为什么 L1 产生稀疏解?
  • Bias-Variance tradeoff 怎么用学习曲线诊断?

Layer A2:深度学习(2-3 个月)

学习目标

理解 CNN / RNN / Transformer 工作原理,能用 PyTorch 从零实现 attention 机制,能微调预训练模型。

核心读物

作者 年份 用法
《动手学深度学习》(D2L,中英双版) 李沐 等 2024 第 2 版 主线。代码驱动,中文友好,d2l.ai 在线版本免费
《Deep Learning with PyTorch》 Eli Stevens 等 2020 PyTorch 工程视角的副线
《Deep Learning》(花书) Goodfellow / Bengio / Courville 2016 索引参考,不通读,遇到原理回查

论文必读清单(每篇配一份手写笔记)

  • "Attention Is All You Need"(Transformer 原文,Vaswani 2017)
  • "BERT: Pre-training of Deep Bidirectional Transformers"(Devlin 2018)
  • "An Image is Worth 16x16 Words"(ViT,Dosovitskiy 2020)

进阶在线课

  • Stanford CS231n(计算机视觉)
  • Stanford CS224n(NLP,2024 版重点讲 LLM)

配套实战

  • 实现一个 LSTM 时序预测模型预测 BTC 收益率,然后用 Transformer 替换对比
  • 微调一个小型 BERT 做金融文本情感分类

验收标准

  • 能从零实现 self-attention(numpy + PyTorch 两版)
  • 能解释 BERT 的 MLM 与 GPT 的 CLM 在训练目标上的差异
  • 能讲清 Layer Norm vs Batch Norm 的应用场景

Layer A3:LLM 与 Agent(2-3 个月)——与 Synedrion 直接对接

学习目标

掌握 LLM 应用工程,能设计 multi-agent 系统、做 RAG、调试 prompt,理解为什么 Synedrion 的 5-role council 这样设计。

核心读物

作者 年份 用法
《AI Engineering: Building Applications with Foundation Models》 Chip Huyen 2025 主线。系统级 LLM 工程教材
《Designing Machine Learning Systems》 Chip Huyen 2022 ML 系统设计基础(Synedrion 架构借鉴)
《Building LLMs for Production》 Louis-François Bouchard 等 2024 LangChain / LlamaIndex 实战手册

论文必读

  • "Chain-of-Thought Prompting"(CoT,Wei 2022)
  • "ReAct: Synergizing Reasoning and Acting"(Yao 2022)
  • "Retrieval-Augmented Generation"(RAG 原文,Lewis 2020)
  • "Constitutional AI"(Bai 2022,Anthropic)——Synedrion 的 Constitution Engine 直接受此启发
  • "Self-Consistency Improves Chain of Thought"(Wang 2022)

配套实战(直接用 Synedrion 代码)

  • 通读 synedrion/src/core/constitution.py,理解 Grimoire 原则注入机制
  • 通读 synedrion/src/core/ai_council.py + debate_engine.py,理解 5-role 辩论
  • 用 ChromaDB(knowledge_base.py)做一个个人金融论文 RAG 问答系统
  • 给 AI Council 增加一个新角色(如 "Quant Theorist"),走完整 brainstorming → 落地流程

验收标准

  • 能用 LiteLLM 调用 6 个 provider 并比较输出差异
  • 能设计一个新的 multi-agent 辩论流程,而不是只调用现有 pipeline
  • 能解释 prompt cache、temperature、top-p 在 council 不同角色里为什么这样配

Layer A4:AI for Finance(持续,与项目并行)

学习目标

理解 ML 在量化里的真实边界——什么场景能用、什么场景是陷阱。这是双轨融合的核心。

核心读物(顺序很重要)

作者 年份 用法
《Advances in Financial Machine Learning》 Marcos López de Prado 2018 必读。AFML 是量化 ML 圣经,讨论 dollar bar / triple barrier / meta-labeling 等独门方法
《Machine Learning for Asset Managers》 López de Prado 2020 AFML 的精炼版,薄但密度高
《Machine Learning for Algorithmic Trading》(2nd ed.) Stefan Jansen 2020 实战大全,代码全部开源在 GitHub
《Machine Learning in Finance》 Dixon / Halperin / Bilokon 2020 学术派,理论与实证并重

论文必读

  • "Empirical Asset Pricing via Machine Learning"(Gu, Kelly, Xiu, RFS 2020)——ML 资产定价奠基作
  • "Deep Hedging"(Buehler 等 2019)——衍生品对冲的深度学习方法
  • "FinBERT"(Araci 2019)、"BloombergGPT"(2023)——金融 LLM
  • "Forecasting Stock Returns: A Comparison of Methods"——传统方法 vs ML 对比

配套实战

  • 在 Philosophers-Stone 里实现 López de Prado 的 triple-barrier labeling
  • 在 Speculum 里跑一组对比实验:OLS 因子 vs Random Forest 因子 vs XGBoost 因子
  • 用 Synedrion 让 Critic 角色对一个 ML 策略做 overfitting 审查

验收标准

  • 能列出"金融时序 ML"相比"标准 ML"的至少 5 个特殊处理(如 fractional differentiation、purged k-fold)
  • 能判断一篇 ML 量化论文是否存在 lookahead bias / survivorship bias

量化轨:从市场到执行,逐层下沉

Layer Q1:市场认知与微观结构(2-3 个月)

现状:scriptorium 已通过 trading-exchanges-zh/ 完成 Q1 超额产出 ——Larry Harris 全书 29 章 + 38 章扩展(HFT、暗池、加密 CEX/DEX/AMM、MEV、ETF、A 股、期权、期货、外汇、信用、稳定币、SRE 风控、回测仿真等),覆盖 Q1 全部目标 + 部分 Q2/Q3/Q4 主题。本 Layer 重心从"读 Harris"转为"实战 + 补充经典":读 Cartea / Jaimungal / Penalva 与 Hasbrouck,把已有研习转化为 Speculum/Crucible 中的代码资产。

学习目标

理解市场是怎么运作的——价格形成机制、流动性、订单流、做市商动机。没有这一层,所有"alpha 信号"都是空中楼阁。

核心读物

作者 年份 用法
《Trading and Exchanges: Market Microstructure for Practitioners》 Larry Harris 2003 主线必读。微观结构圣经,虽老但根基
《Algorithmic and High-Frequency Trading》 Cartea / Jaimungal / Penalva 2015 数学化的微观+算法交易,Cambridge 出版
《Empirical Market Microstructure》 Joel Hasbrouck 2007 实证视角,补充 Harris

中文/入门补充

  • 《海龟交易法则》(Curtis Faith)——经典系统化交易思维
  • 《量化投资:策略与技术》(丁鹏)——中文入门,A 股语境

配套实战

  • 拿一个交易品种(BTC/USDT 或 沪深 300 ETF)的 Level-2 数据,写出:
  • 加权中间价 / 价差 / 深度 / 订单流不平衡(OFI)指标
  • 实证检验:OFI 对未来 10 秒收益率是否有预测力?
  • 在 Crucible 的 risk module 里实现一个滑点+市场冲击成本模型

验收标准

  • 能解释为什么 limit order 与 market order 的成交结构在牛熊不同
  • 能讨论"为什么手续费、滑点、市场冲击成本不能忽略"——这是新手最容易踩的坑
  • 能讲清做市商的 inventory risk 与 adverse selection

Layer Q2:因子模型与统计套利(2-3 个月)

学习目标

理解 alpha 的来源——为什么有些因子赚钱、为什么会失效。能独立构建多因子模型。

核心读物

作者 年份 用法
《Active Portfolio Management》(2nd ed.) Grinold / Kahn 1999 必读。主动管理圣经,IR / IC / Fundamental Law
《Quantitative Equity Portfolio Management》 Chincarini / Kim 2006 因子模型实战
《Asset Pricing》(Revised) John Cochrane 2005 资产定价理论根基,数学严格
《Expected Returns》 Antti Ilmanen 2011 各类资产收益的实证综述,经典

论文必读

  • Fama-French 三因子(1993)、五因子(2015)
  • Carhart 四因子(1997)
  • "Bayesian Alpha-Forecasting"(Jorion)
  • "Betting Against Beta"(Frazzini & Pedersen 2014)

进阶

  • 《Quantitative Investment Analysis》(CFA Institute)——系统教材
  • 《Efficiently Inefficient》(Pedersen)——对冲基金视角

配套实战

  • 在 Philosophers-Stone 里加一个新的多因子策略(动量 + 价值 + 质量)
  • 在 Speculum 里做一次 IC / IR / 分组回测全套分析
  • 用 Synedrion AI Council 辩论一个因子是否会失效——让 Critic 找漏洞,Architect 提改进

验收标准

  • 能解释"为什么价值因子在 2010-2020 年失效",并列出至少 3 种修复思路
  • 能从零写一个截面回归求 factor return
  • 能讨论 Barra 风险模型的结构与 alpha 模型的差异

Layer Q3:组合优化与风险管理(2-3 个月)

学习目标

从单策略到组合管理。理解"凑齐 10 个 0.5 夏普的策略,组合后能跑出 1.5 夏普"的数学是怎么来的。

核心读物

作者 年份 用法
《Risk and Asset Allocation》 Attilio Meucci 2005 必读。资产配置数学全书,从分布到优化
《Modern Portfolio Theory and Investment Analysis》(9th ed.) Elton / Gruber 2014 经典教材
《Robust Portfolio Optimization and Management》 Fabozzi 等 2007 鲁棒优化
《Risk Management and Financial Institutions》(5th ed.) John Hull 2018 风控基础,VaR/ES
《Volatility Trading》(2nd ed.) Euan Sinclair 2013 波动率交易实战

配套实战

  • 在 Crucible 里实现:
  • 组合层 VaR / Expected Shortfall 计算
  • 多策略权重分配(等风险贡献 ERC、最小方差、Black-Litterman 三选一)
  • 给 Crucible 的 circuit breaker 加一个 portfolio-level drawdown 触发器

验收标准

  • 能从零推导 Markowitz mean-variance 解析解
  • 能讨论 mean-variance 的失败原因(estimation error)与 Black-Litterman 的修复
  • 能在多策略组合中做风险预算

Layer Q4:算法交易与执行(持续)

学习目标

从信号到订单——生产环境工程。这是 Crucible 的核心。

核心读物

作者 年份 用法
《Algorithmic Trading: Winning Strategies and Their Rationale》 Ernest Chan 2013 必读。Chan 系列入门款
《Quantitative Trading: How to Build Your Own Algorithmic Trading Business》(2nd) Ernest Chan 2021 工程实战
《Optimal Trading Strategies》 Robert Kissell 2003 TWAP / VWAP / IS 等执行算法
《The Science of Algorithmic Trading and Portfolio Management》 Robert Kissell 2013 执行成本分析,综合教材

配套实战

  • 通读 Crucible 的 crucible_engine/ 源码,理解 immutable strategy 设计
  • 在 Crucible 里实现一个 TWAP 执行算法
  • 实现一个 Implementation Shortfall 度量,接入 observability dashboard

验收标准

  • 能解释 TWAP / VWAP / Implementation Shortfall 各自适合什么市场
  • 能讨论"strategy code 为什么要 immutable"——研究与执行分离的工程哲学
  • 能设计 fill quality 监控

工具效率轨(Track 0:贯穿全程)

这一轨不是与 AI/量化轨平级的"第三主线",而是"贯穿性技能"。 你每天都在用 Claude Code+Codex 写代码,工具熟练度提升 1 倍 = AI 轨/量化轨学习速度也提升 1 倍。所以早期(Month 0-3)集中投入,之后持续优化。


T0.1 Claude Code 深度精通(Month 0-2 集中,之后持续)

学习目标

掌握 Claude Code 全功能:skills / hooks / subagents / MCP servers / slash commands / output styles / CLAUDE.md 层级 / settings.json 配置 / sessions / plan mode / worktrees。

核心资料

  • Claude Code 官方文档(docs.claude.com/en/docs/claude-code)——每个章节都看一遍,不要跳
  • Anthropic 工程博客的 Claude Code 系列(尤其 "Claude Code Best Practices"、"Building Effective Agents"、"Engineering at Anthropic")
  • 你已 fork 的 superpowers / get-shit-done 仓库源码——这是一手最佳实践,直接读
  • ~/.claude/ 整个目录(plugins、skills、commands、settings)——通读,理解每个文件作用

配套实战

  • 通读 superpowers 7 阶段(brainstorming → writing-plans → using-git-worktrees → tdd → systematic-debugging → requesting-code-review → finishing-a-development-branch)源码,理解每个 skill 的设计动机
  • 通读 GSD 全部 gsd-* 命令(用 /gsd-help 列出),理解 phase-driven 开发为什么有效
  • 给 Alephain Guild 写 1-2 个自定义 skill(例如 /quant:overfit-check 自动用 Synedrion Critic 审查 ML 策略;/synedrion:debate 让 5 角色对一个想法快速辩论)
  • 配置 settings.json 的 hooks(commit 前自动跑 pytest、PR 前跑 GSD 完整 phase 检查)
  • 设计 CLAUDE.md 的三级层级:global(~/.claude/CLAUDE.md)/ project(the-alephain-guild/CLAUDE.md)/ module(各子项目独立)

验收标准

  • 能解释 skill / subagent / hook / MCP server 各自的适用场景与边界
  • 能从零写一个完整 skill(metadata + frontmatter + 流程图 + checklist)
  • 能用 hooks 把"代码改动后自动跑测试""commit 前自动 GSD 检查"做成无感自动化
  • 能讲清 plan mode 的约束(只能写 plan 文件)与价值(强制设计先行)

T0.2 Codex CLI 与多 AI 协同(Month 1-2)

学习目标

理解 OpenAI Codex CLI 的设计哲学,与 Claude Code 的核心差异、何时用哪个、如何协同。多 AI 协同不是"用得多",而是"知道每个 AI 擅长什么"。

核心资料

  • Codex 官方仓库:github.com/openai/codex(README + docs/)
  • Codex 文档与 changelog
  • 社区评测:Hacker News 讨论、Twitter/X 上 AI 工程师的实际使用对比
  • 重要原则参考:OpenAI "Practices for Building Reliable Agents"

配套实战

  • 同一个任务在 Claude Code 与 Codex 各做一遍(例如"给 Speculum 加一个新指标"),记录差异
  • 设计你的"双 AI 工作流":
  • 探索/重构/复杂推理 → Claude Code(更深的 plan mode、更强的 reasoning)
  • 短平快编辑、单文件操作 → Codex(更轻量、更快)
  • 跨仓库集成、长上下文项目管理 → Claude Code(1M context、subagent)
  • 写一份个人对比笔记到 .planning/learnings/ai-tool-comparison.md,持续更新

验收标准

  • 能列出 Claude Code 与 Codex 在 5+ 维度的差异(模型、context、tool use、subagent、MCP、cost、speed)
  • 能给团队成员一句话讲清"什么任务用哪个 AI"

T0.3 MCP 协议与 Agent 工程(与 A3 同步,Month 6-9)

学习目标

深入 MCP 协议规范,掌握 mcp Python SDK,能为任何系统写 MCP server——这正是 Alephain Guild 跨仓库集成的核心(PROJECT.md 的目标就是建立这一层)。

核心资料

  • MCP 协议官方规范:modelcontextprotocol.io/specification(协议设计哲学+完整 spec)
  • mcp Python SDK 源码:github.com/modelcontextprotocol/python-sdk(尤其 mcp.server.fastmcp)
  • Anthropic "How We Build Effective Agents" 白皮书
  • 已有 MCP 服务源码:synedrion/src/mcp_servers/speculum_fastmcp.pycore_server.py

配套实战(直接对接 PROJECT.md 已规划的工作)

  • 完成 PROJECT.md 已规划的 Crucible MCP 服务(参考 speculum MCP 模式,12 个工具,P0~P2 优先级)
  • 完成 debate-bridge MCP(跨 6+ provider 的辩论桥接)
  • 设计 alephain-contracts 共享 Pydantic 包,避免跨仓库 schema 漂移
  • 用 Schemathesis 给 Speculum / Crucible API 加自动化合约测试

验收标准

  • 能从零写一个生产级 MCP server(auth + structured logging + error handling + rate limit)
  • 能解释 FastMCP 内置版(mcp 1.27.0)与 standalone fastmcp 3.x 的取舍——为什么本项目选内置版(与现有代码一致)
  • 能讨论 MCP 与传统 RPC/REST 的差异

T0.4 Prompt 与 Context 工程(Month 4-6,与 A3 协同)

学习目标

系统掌握 prompt 设计模式与 context window 管理。LLM 时代的"程序设计"是 prompt 设计——这是新一代工程师的核心技能。

核心资料

  • Anthropic Prompt Engineering Guide(官方文档,免费)
  • "The Prompt Report"(Schulhoff 等 2024)——58 种 prompt 技巧综述,索引型必读
  • Lilian Weng 博客:《Prompt Engineering》《LLM Powered Autonomous Agents》
  • 《AI Engineering》(Chip Huyen)第 3-5 章
  • Anthropic "Constitutional AI" 论文——直接对应 Synedrion 的 Constitution Engine

配套实战

  • 优化 Synedrion 5 角色 prompt(用 eval 数据集对比改进前后,例如 Critic 找问题率、Architect 假设新颖度)
  • 给 Synedrion 加 prompt cache 监控(命中率目标 >70%)
  • 设计一套"prompt 版本控制"机制(每次改 prompt 都记录在 audit_logs)
  • 实验 zero-shot / few-shot / CoT / Self-Consistency / ToT,看哪种最适合金融场景

验收标准

  • 能讨论 zero-shot / few-shot / CoT / ToT / ReAct 各自适用场景
  • 能为 Critic 写出"故意尖锐但不伤害协作"的 prompt
  • 能解释 prompt cache 的工作原理与命中率优化策略

T0.5 个人效率度量(持续)

学习目标

度量自己的开发效率,迭代改进。能用数据回答"AI 协作让我快了多少、哪些任务 AI 不擅长"。

核心资料

  • 《Accelerate》(Forsgren / Humble / Kim)——DORA 4 指标(部署频率、变更前置时间、失败率、恢复时间)
  • 《The Pragmatic Programmer》(20 周年版)——工程素养
  • superpowers + GSD 内置度量(commits per phase、turnaround time、phase 失败率)

配套实战

  • /gsd-stats 跟踪每月 phase 数、commit 数、turnaround time
  • 月末做一次复盘:本月 AI 协作节省多少时间、哪些任务 AI 不擅长(写到 .planning/retros/)
  • 记录"AI 协作反模式"——例如:在 plan 不清楚时盲目执行、context 太长时不主动 compact

验收标准

  • 能给 12 个月后的自己说出"我比一年前快/好在哪里"——并有数据支撑
  • 能识别并避免至少 5 种 AI 协作反模式

数学基础(横向支撑,按需补)

核心原则:不预先啃,遇到时回查。

主题 主要参考 何时回查
概率论与数理统计 《Statistical Inference》(Casella & Berger);《All of Statistics》(Wasserman) A1 / Q2 学到假设检验、回归
线性代数 《Linear Algebra and Its Applications》(Strang);3Blue1Brown 视频系列 A2 / Q3 学到 PCA、矩阵分解
随机过程 《Stochastic Calculus for Finance I+II》(Steven Shreve) Q3 学到衍生品定价、Itô 引理
凸优化 《Convex Optimization》(Boyd & Vandenberghe);Stanford EE364A 公开课 Q3 学到组合优化
时间序列 《Analysis of Financial Time Series》(Tsay);《Time Series Analysis》(Hamilton) A2 / Q1 学到 GARCH、协整

中文补充:《概率论与数理统计》(陈希孺)——简洁经典。


工程基础(辅助提升)

用途
《Designing Data-Intensive Applications》(Martin Kleppmann) 数据系统设计——理解 Speculum / Crucible 后端架构
《Python for Finance》(2nd ed., Yves Hilpisch) 量化 Python 编程
《Building Microservices》(2nd ed., Sam Newman) Synedrion 的 microservice 拆分

与 Superpowers / GSD 工作流的集成

每个 Layer 完成时的标准流程

  1. 学习阶段
  2. /gsd-explore 做苏格拉底式提问,梳理学完的关键概念
  3. /gsd-capture 把笔记捕获到知识库(可同时进 Synedrion 的 ChromaDB RAG)
  4. 实战阶段
  5. /superpowers:brainstorming 设计实战项目
  6. /superpowers:writing-plans 写实施计划
  7. /gsd-quant-pipeline 走完整 Alpha Alchemy 4 阶段(INSIGHT → MODELING → REFINEMENT → VERIFICATION)
  8. 沉淀阶段
  9. /gsd-extract-learnings 提取本 Layer 的关键决策、踩坑、模式
  10. /gsd-lessons 记录到 historical-lessons.md
  11. 综合演练
  12. 每完成 2 个 Layer 配对(A1+Q1、A2+Q2…),在 Alephain Guild 里走一次完整流程: 从想法 → AI Council 辩论 → 数学建模 → Speculum 回测 → Crucible 部署

时间安排(弹性,以产出物为里程碑)

总周期:12-18 个月(双轨并行,每条轨 4 个 Layer × 2-3 月,可重叠)

不严格按月,而是用产出物作为里程碑:

时点 AI/量化轨状态 工具轨状态 Alephain Guild 产出
Month 0 建立学习仓库 + 模板 T0.1 启动:Claude Code 全功能精通 个人 learning-tracker + 自定义 1 个 skill
Month 1-2 A1 + Q1 启动 T0.1 完成 + T0.2 启动(Codex 协同) superpowers 源码精读完成 + 双 AI 工作流确立
Month 3 A1 + Q1 完成 T0.2 完成 Speculum 中跑通 ML 策略 + 微观结构分析报告
Month 4-5 A2 + Q2 推进 T0.4 启动(Prompt 工程) Synedrion 5 角色 prompt 优化(带 eval 对比)
Month 6 A2 + Q2 完成 T0.4 完成 + T0.3 启动(MCP/Agent) Philosophers-Stone 中实现 LSTM/Transformer 因子
Month 7-8 A3 + Q3 推进 T0.3 推进 Crucible MCP 服务上线(P0 工具)
Month 9 A3 + Q3 完成 T0.3 完成 Synedrion 新 Council 角色 + Crucible portfolio VaR + debate-bridge MCP
Month 10-11 A4 + Q4 推进 T0.5 持续 论文复现 1-2 篇
Month 12 A4 + Q4 完成 全部贯穿性技能成熟 1 个生产级 ML 增强策略部署到 Crucible
Month 12-18 进阶深耕 T0.5 持续度量 贡献开源策略库、写技术 blog、复现前沿论文

关键文件路径与现有资产对接

学习模块 项目对接文件 备注
A3 LLM/Agent synedrion/src/core/constitution.pyai_council.pydebate_engine.py Constitution AI / multi-agent 实战
A3 RAG synedrion/src/services/knowledge_base.py ChromaDB 实战
A4 AI for Finance alchymia-labs/philosophers-stone/_template/ 策略模板
Q1 微观结构 Speculum 数据层 Level-2 数据接入
Q2 因子 philosophers-stone/momentum/portfolio/rebalancing/ 现有因子代码参考
Q3 组合 tesseract-trading/the-crucible/config/risk/ 风控规则集成
Q4 执行 tesseract-trading/the-crucible/crucible_engine/ 执行引擎
方法论 grimoire/methodology/01-alchemy-overview.md-05-verification-phase.md Alpha Alchemy 4 阶段对应学习的实战流程

验证(End-to-End 检查)

每个 Layer 完成后,通过以下方式验证学习效果:

  1. 代码验证:能独立修改 Alephain Guild 对应模块,通过 pytest 与 Speculum 回测验证
  2. 概念验证:能用自己的话向"3 个月前的自己"解释本 Layer 的核心概念,无需查书
  3. 批判验证:能找出对应模块当前实现的 1-2 个可改进点(过拟合风险、未处理的 edge case 等)
  4. Council 验证:用 Synedrion 让 5 个角色对你写的代码做一轮辩论,看 Critic 能否找到你没想到的问题

最终验证(Month 12+):

  • 能独立完成一个论文复现:从 paper → mathematical model → code → backtest → 写复现报告
  • 能在 Alephain Guild 主仓库提交 PR(策略、组件、文档任一)并通过 code review

学习反模式(避免)

  1. 不要先啃数学:数学基础按需补,不要花 3 个月看完 Strang 再开始——你会忘光
  2. 不要只看不写:每个 Layer 必须有代码产出,Markdown 笔记不算
  3. 不要跳过 Q1:微观结构是后面所有 Q 模块的根基,跳过会导致 Q2 的因子设计无市场感
  4. 不要积压论文:每周最多新读 1 篇,优先消化已读
  5. 不要孤立学习:每个 Layer 至少完成一次 Synedrion AI Council 辩论,让 Critic 找漏洞
  6. 不要忽视工具轨:Track 0 的复利效应最大——Claude Code/Codex 熟练度 +1 倍 ≈ 学习速度 +1 倍。前 2 个月先把工具吃透,比急着推 AI/量化轨更划算
  7. 不要让 AI 替你思考:AI 能写代码、能解释概念,但不能替你形成"市场直觉"。工具轨的目的是让你写得更快,不是让你思考更少