AI + 量化金融系统性学习规划(双轨并行版)¶
Scriptorium · Curriculum — 本路线图是 scriptorium(外部经典文献研习室)的总图,指导未来扩展方向。已落成的研习成果(如
trading-exchanges-zh/)与未来规划文献,均按本路线图组织。
Context¶
用户画像
- 角色:程序员,使用 Claude Code + Codex 开发金融量化
- 工具栈:fork 了 superpowers + get-shit-done(GSD)工作流
- 项目载体:The Alephain Guild 量化生态
- Synedrion(AI Council 系统)、Speculum(回测平台)、Philosophers-Stone(策略孵化)、Crucible(生产执行)、Grimoire(方法论)
- AI/ML 基础:知道概念但没系统学过(API 调用层,没动过深度学习内部)
- 量化基础:刚入门(知道夏普/回撤,但因子/微观结构/组合优化未系统学)
- 时间预算:边做边学,长期持续(12-18 个月规划)
- 学习偏好:工程优先,但选择方案 C 双轨并行——希望知识体系完整,不要碎片化
为什么是双轨并行(方案 C)
- 工程优先 ≠ 不要理论。工程优先是"先看到代码长什么样再补数学",但补的过程必须系统。
- 单轨(只学 AI 或只学量化)会导致 Synedrion 与 Crucible 之间的知识断层——理解不了"AI Council 为什么要这么辩论"或"为什么策略代码要 immutable"。
- 双轨在 Alephain Guild 里天然交汇:每个子系统都是 AI×量化的组合,学完一层就能在项目里立刻用上。
最终目标(12-18 个月后)
- 能独立解读 Synedrion/Crucible/Speculum 任何模块的源码与设计意图
- 能在 Philosophers-Stone 里独立实现 ML 增强的多因子策略并通过 Speculum 验证
- 能用 Synedrion AI Council 设计新的研究 pipeline,而不是只调用现有 pipeline
- 能判断"哪些金融问题适合用 ML 解决,哪些是 ML 的陷阱"——这是最值钱的能力
- 能为 Alephain Guild 写自定义 skill / MCP server / hooks,把个人工作流沉淀为团队资产——AI 协作能力可量化、可复用
知识体系总览¶
Alephain Guild 项目(三轨交汇点)
▲
┌─────────────────┼─────────────────┐
│ │ │
AI 轨 量化轨 工具轨(Track 0)
(从工程到原理) (从市场到执行) (贯穿性技能)
│ │ │
L1 ML 工程基础 ← L1 市场微观结构 → T0.1 Claude Code 深度
L2 深度学习 ← L2 因子模型 → T0.2 Codex 协同
L3 LLM 与 Agent ← L3 组合与风险 → T0.3 MCP 与 Agent 工程
L4 AI for Finance← L4 算法交易 → T0.4 Prompt/Context 工程
│ │ │
└─────────────────┼─────────────────┘
▼
数学基础(横向按需补)
概率统计 / 线性代数 / 随机过程 / 优化 / 时序
为什么是三轨而不是双轨
工具轨(Track 0)不是与 AI/量化平级的"第三主线",而是"贯穿性技能"——你每天都在用 Claude Code+Codex,工具熟练度的复利效应最大。把工具学习独立列出,但定位是"为前两轨服务",避免变成三条平行学习线让总量爆炸。
AI 轨:从工程到原理,层层深入¶
Layer A1:ML 工程基础(2-3 个月)¶
学习目标
熟练使用 pandas / NumPy / scikit-learn / PyTorch,能独立完成监督学习、无监督学习、特征工程的完整工作流,理解过拟合/正则化/交叉验证。
核心读物
| 书 | 作者 | 年份 | 用法 |
|---|---|---|---|
| 《Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow》(3rd ed.) | Aurélien Géron | 2022 | 主线,通读。工程优先的 ML 标杆教材 |
| 《Python Machine Learning》(4th ed.) | Sebastian Raschka | 2022 | 配合 PyTorch 实战的副线 |
| 《The Hundred-Page Machine Learning Book》 | Andriy Burkov | 2019 | 速读补盲(2 周) |
配套实战
- Kaggle "Optiver Realized Volatility Prediction" 或 "Two Sigma Financial News" 题目走一遍
- 在 Speculum 里给一个现有策略加一个 ML 特征筛选环节
验收标准(能回答这些问题)
- 为什么交叉验证在金融时序里要用 walk-forward 而不是 KFold?
- L1/L2 正则化的几何含义?为什么 L1 产生稀疏解?
- Bias-Variance tradeoff 怎么用学习曲线诊断?
Layer A2:深度学习(2-3 个月)¶
学习目标
理解 CNN / RNN / Transformer 工作原理,能用 PyTorch 从零实现 attention 机制,能微调预训练模型。
核心读物
| 书 | 作者 | 年份 | 用法 |
|---|---|---|---|
| 《动手学深度学习》(D2L,中英双版) | 李沐 等 | 2024 第 2 版 | 主线。代码驱动,中文友好,d2l.ai 在线版本免费 |
| 《Deep Learning with PyTorch》 | Eli Stevens 等 | 2020 | PyTorch 工程视角的副线 |
| 《Deep Learning》(花书) | Goodfellow / Bengio / Courville | 2016 | 索引参考,不通读,遇到原理回查 |
论文必读清单(每篇配一份手写笔记)
- "Attention Is All You Need"(Transformer 原文,Vaswani 2017)
- "BERT: Pre-training of Deep Bidirectional Transformers"(Devlin 2018)
- "An Image is Worth 16x16 Words"(ViT,Dosovitskiy 2020)
进阶在线课
- Stanford CS231n(计算机视觉)
- Stanford CS224n(NLP,2024 版重点讲 LLM)
配套实战
- 实现一个 LSTM 时序预测模型预测 BTC 收益率,然后用 Transformer 替换对比
- 微调一个小型 BERT 做金融文本情感分类
验收标准
- 能从零实现 self-attention(numpy + PyTorch 两版)
- 能解释 BERT 的 MLM 与 GPT 的 CLM 在训练目标上的差异
- 能讲清 Layer Norm vs Batch Norm 的应用场景
Layer A3:LLM 与 Agent(2-3 个月)——与 Synedrion 直接对接¶
学习目标
掌握 LLM 应用工程,能设计 multi-agent 系统、做 RAG、调试 prompt,理解为什么 Synedrion 的 5-role council 这样设计。
核心读物
| 书 | 作者 | 年份 | 用法 |
|---|---|---|---|
| 《AI Engineering: Building Applications with Foundation Models》 | Chip Huyen | 2025 | 主线。系统级 LLM 工程教材 |
| 《Designing Machine Learning Systems》 | Chip Huyen | 2022 | ML 系统设计基础(Synedrion 架构借鉴) |
| 《Building LLMs for Production》 | Louis-François Bouchard 等 | 2024 | LangChain / LlamaIndex 实战手册 |
论文必读
- "Chain-of-Thought Prompting"(CoT,Wei 2022)
- "ReAct: Synergizing Reasoning and Acting"(Yao 2022)
- "Retrieval-Augmented Generation"(RAG 原文,Lewis 2020)
- "Constitutional AI"(Bai 2022,Anthropic)——Synedrion 的 Constitution Engine 直接受此启发
- "Self-Consistency Improves Chain of Thought"(Wang 2022)
配套实战(直接用 Synedrion 代码)
- 通读
synedrion/src/core/constitution.py,理解 Grimoire 原则注入机制 - 通读
synedrion/src/core/ai_council.py+debate_engine.py,理解 5-role 辩论 - 用 ChromaDB(
knowledge_base.py)做一个个人金融论文 RAG 问答系统 - 给 AI Council 增加一个新角色(如 "Quant Theorist"),走完整 brainstorming → 落地流程
验收标准
- 能用 LiteLLM 调用 6 个 provider 并比较输出差异
- 能设计一个新的 multi-agent 辩论流程,而不是只调用现有 pipeline
- 能解释 prompt cache、temperature、top-p 在 council 不同角色里为什么这样配
Layer A4:AI for Finance(持续,与项目并行)¶
学习目标
理解 ML 在量化里的真实边界——什么场景能用、什么场景是陷阱。这是双轨融合的核心。
核心读物(顺序很重要)
| 书 | 作者 | 年份 | 用法 |
|---|---|---|---|
| 《Advances in Financial Machine Learning》 | Marcos López de Prado | 2018 | 必读。AFML 是量化 ML 圣经,讨论 dollar bar / triple barrier / meta-labeling 等独门方法 |
| 《Machine Learning for Asset Managers》 | López de Prado | 2020 | AFML 的精炼版,薄但密度高 |
| 《Machine Learning for Algorithmic Trading》(2nd ed.) | Stefan Jansen | 2020 | 实战大全,代码全部开源在 GitHub |
| 《Machine Learning in Finance》 | Dixon / Halperin / Bilokon | 2020 | 学术派,理论与实证并重 |
论文必读
- "Empirical Asset Pricing via Machine Learning"(Gu, Kelly, Xiu, RFS 2020)——ML 资产定价奠基作
- "Deep Hedging"(Buehler 等 2019)——衍生品对冲的深度学习方法
- "FinBERT"(Araci 2019)、"BloombergGPT"(2023)——金融 LLM
- "Forecasting Stock Returns: A Comparison of Methods"——传统方法 vs ML 对比
配套实战
- 在 Philosophers-Stone 里实现 López de Prado 的 triple-barrier labeling
- 在 Speculum 里跑一组对比实验:OLS 因子 vs Random Forest 因子 vs XGBoost 因子
- 用 Synedrion 让 Critic 角色对一个 ML 策略做 overfitting 审查
验收标准
- 能列出"金融时序 ML"相比"标准 ML"的至少 5 个特殊处理(如 fractional differentiation、purged k-fold)
- 能判断一篇 ML 量化论文是否存在 lookahead bias / survivorship bias
量化轨:从市场到执行,逐层下沉¶
Layer Q1:市场认知与微观结构(2-3 个月)¶
✅ 现状:scriptorium 已通过
trading-exchanges-zh/完成 Q1 超额产出 ——Larry Harris 全书 29 章 + 38 章扩展(HFT、暗池、加密 CEX/DEX/AMM、MEV、ETF、A 股、期权、期货、外汇、信用、稳定币、SRE 风控、回测仿真等),覆盖 Q1 全部目标 + 部分 Q2/Q3/Q4 主题。本 Layer 重心从"读 Harris"转为"实战 + 补充经典":读 Cartea / Jaimungal / Penalva 与 Hasbrouck,把已有研习转化为 Speculum/Crucible 中的代码资产。
学习目标
理解市场是怎么运作的——价格形成机制、流动性、订单流、做市商动机。没有这一层,所有"alpha 信号"都是空中楼阁。
核心读物
| 书 | 作者 | 年份 | 用法 |
|---|---|---|---|
| 《Trading and Exchanges: Market Microstructure for Practitioners》 | Larry Harris | 2003 | 主线必读。微观结构圣经,虽老但根基 |
| 《Algorithmic and High-Frequency Trading》 | Cartea / Jaimungal / Penalva | 2015 | 数学化的微观+算法交易,Cambridge 出版 |
| 《Empirical Market Microstructure》 | Joel Hasbrouck | 2007 | 实证视角,补充 Harris |
中文/入门补充
- 《海龟交易法则》(Curtis Faith)——经典系统化交易思维
- 《量化投资:策略与技术》(丁鹏)——中文入门,A 股语境
配套实战
- 拿一个交易品种(BTC/USDT 或 沪深 300 ETF)的 Level-2 数据,写出:
- 加权中间价 / 价差 / 深度 / 订单流不平衡(OFI)指标
- 实证检验:OFI 对未来 10 秒收益率是否有预测力?
- 在 Crucible 的 risk module 里实现一个滑点+市场冲击成本模型
验收标准
- 能解释为什么 limit order 与 market order 的成交结构在牛熊不同
- 能讨论"为什么手续费、滑点、市场冲击成本不能忽略"——这是新手最容易踩的坑
- 能讲清做市商的 inventory risk 与 adverse selection
Layer Q2:因子模型与统计套利(2-3 个月)¶
学习目标
理解 alpha 的来源——为什么有些因子赚钱、为什么会失效。能独立构建多因子模型。
核心读物
| 书 | 作者 | 年份 | 用法 |
|---|---|---|---|
| 《Active Portfolio Management》(2nd ed.) | Grinold / Kahn | 1999 | 必读。主动管理圣经,IR / IC / Fundamental Law |
| 《Quantitative Equity Portfolio Management》 | Chincarini / Kim | 2006 | 因子模型实战 |
| 《Asset Pricing》(Revised) | John Cochrane | 2005 | 资产定价理论根基,数学严格 |
| 《Expected Returns》 | Antti Ilmanen | 2011 | 各类资产收益的实证综述,经典 |
论文必读
- Fama-French 三因子(1993)、五因子(2015)
- Carhart 四因子(1997)
- "Bayesian Alpha-Forecasting"(Jorion)
- "Betting Against Beta"(Frazzini & Pedersen 2014)
进阶
- 《Quantitative Investment Analysis》(CFA Institute)——系统教材
- 《Efficiently Inefficient》(Pedersen)——对冲基金视角
配套实战
- 在 Philosophers-Stone 里加一个新的多因子策略(动量 + 价值 + 质量)
- 在 Speculum 里做一次 IC / IR / 分组回测全套分析
- 用 Synedrion AI Council 辩论一个因子是否会失效——让 Critic 找漏洞,Architect 提改进
验收标准
- 能解释"为什么价值因子在 2010-2020 年失效",并列出至少 3 种修复思路
- 能从零写一个截面回归求 factor return
- 能讨论 Barra 风险模型的结构与 alpha 模型的差异
Layer Q3:组合优化与风险管理(2-3 个月)¶
学习目标
从单策略到组合管理。理解"凑齐 10 个 0.5 夏普的策略,组合后能跑出 1.5 夏普"的数学是怎么来的。
核心读物
| 书 | 作者 | 年份 | 用法 |
|---|---|---|---|
| 《Risk and Asset Allocation》 | Attilio Meucci | 2005 | 必读。资产配置数学全书,从分布到优化 |
| 《Modern Portfolio Theory and Investment Analysis》(9th ed.) | Elton / Gruber | 2014 | 经典教材 |
| 《Robust Portfolio Optimization and Management》 | Fabozzi 等 | 2007 | 鲁棒优化 |
| 《Risk Management and Financial Institutions》(5th ed.) | John Hull | 2018 | 风控基础,VaR/ES |
| 《Volatility Trading》(2nd ed.) | Euan Sinclair | 2013 | 波动率交易实战 |
配套实战
- 在 Crucible 里实现:
- 组合层 VaR / Expected Shortfall 计算
- 多策略权重分配(等风险贡献 ERC、最小方差、Black-Litterman 三选一)
- 给 Crucible 的 circuit breaker 加一个 portfolio-level drawdown 触发器
验收标准
- 能从零推导 Markowitz mean-variance 解析解
- 能讨论 mean-variance 的失败原因(estimation error)与 Black-Litterman 的修复
- 能在多策略组合中做风险预算
Layer Q4:算法交易与执行(持续)¶
学习目标
从信号到订单——生产环境工程。这是 Crucible 的核心。
核心读物
| 书 | 作者 | 年份 | 用法 |
|---|---|---|---|
| 《Algorithmic Trading: Winning Strategies and Their Rationale》 | Ernest Chan | 2013 | 必读。Chan 系列入门款 |
| 《Quantitative Trading: How to Build Your Own Algorithmic Trading Business》(2nd) | Ernest Chan | 2021 | 工程实战 |
| 《Optimal Trading Strategies》 | Robert Kissell | 2003 | TWAP / VWAP / IS 等执行算法 |
| 《The Science of Algorithmic Trading and Portfolio Management》 | Robert Kissell | 2013 | 执行成本分析,综合教材 |
配套实战
- 通读 Crucible 的
crucible_engine/源码,理解 immutable strategy 设计 - 在 Crucible 里实现一个 TWAP 执行算法
- 实现一个 Implementation Shortfall 度量,接入 observability dashboard
验收标准
- 能解释 TWAP / VWAP / Implementation Shortfall 各自适合什么市场
- 能讨论"strategy code 为什么要 immutable"——研究与执行分离的工程哲学
- 能设计 fill quality 监控
工具效率轨(Track 0:贯穿全程)¶
这一轨不是与 AI/量化轨平级的"第三主线",而是"贯穿性技能"。 你每天都在用 Claude Code+Codex 写代码,工具熟练度提升 1 倍 = AI 轨/量化轨学习速度也提升 1 倍。所以早期(Month 0-3)集中投入,之后持续优化。
T0.1 Claude Code 深度精通(Month 0-2 集中,之后持续)¶
学习目标
掌握 Claude Code 全功能:skills / hooks / subagents / MCP servers / slash commands / output styles / CLAUDE.md 层级 / settings.json 配置 / sessions / plan mode / worktrees。
核心资料
- Claude Code 官方文档(docs.claude.com/en/docs/claude-code)——每个章节都看一遍,不要跳
- Anthropic 工程博客的 Claude Code 系列(尤其 "Claude Code Best Practices"、"Building Effective Agents"、"Engineering at Anthropic")
- 你已 fork 的 superpowers / get-shit-done 仓库源码——这是一手最佳实践,直接读
~/.claude/整个目录(plugins、skills、commands、settings)——通读,理解每个文件作用
配套实战
- 通读 superpowers 7 阶段(brainstorming → writing-plans → using-git-worktrees → tdd → systematic-debugging → requesting-code-review → finishing-a-development-branch)源码,理解每个 skill 的设计动机
- 通读 GSD 全部
gsd-*命令(用/gsd-help列出),理解 phase-driven 开发为什么有效 - 给 Alephain Guild 写 1-2 个自定义 skill(例如
/quant:overfit-check自动用 Synedrion Critic 审查 ML 策略;/synedrion:debate让 5 角色对一个想法快速辩论) - 配置 settings.json 的 hooks(commit 前自动跑 pytest、PR 前跑 GSD 完整 phase 检查)
- 设计 CLAUDE.md 的三级层级:global(
~/.claude/CLAUDE.md)/ project(the-alephain-guild/CLAUDE.md)/ module(各子项目独立)
验收标准
- 能解释 skill / subagent / hook / MCP server 各自的适用场景与边界
- 能从零写一个完整 skill(metadata + frontmatter + 流程图 + checklist)
- 能用 hooks 把"代码改动后自动跑测试""commit 前自动 GSD 检查"做成无感自动化
- 能讲清 plan mode 的约束(只能写 plan 文件)与价值(强制设计先行)
T0.2 Codex CLI 与多 AI 协同(Month 1-2)¶
学习目标
理解 OpenAI Codex CLI 的设计哲学,与 Claude Code 的核心差异、何时用哪个、如何协同。多 AI 协同不是"用得多",而是"知道每个 AI 擅长什么"。
核心资料
- Codex 官方仓库:github.com/openai/codex(README + docs/)
- Codex 文档与 changelog
- 社区评测:Hacker News 讨论、Twitter/X 上 AI 工程师的实际使用对比
- 重要原则参考:OpenAI "Practices for Building Reliable Agents"
配套实战
- 同一个任务在 Claude Code 与 Codex 各做一遍(例如"给 Speculum 加一个新指标"),记录差异
- 设计你的"双 AI 工作流":
- 探索/重构/复杂推理 → Claude Code(更深的 plan mode、更强的 reasoning)
- 短平快编辑、单文件操作 → Codex(更轻量、更快)
- 跨仓库集成、长上下文项目管理 → Claude Code(1M context、subagent)
- 写一份个人对比笔记到
.planning/learnings/ai-tool-comparison.md,持续更新
验收标准
- 能列出 Claude Code 与 Codex 在 5+ 维度的差异(模型、context、tool use、subagent、MCP、cost、speed)
- 能给团队成员一句话讲清"什么任务用哪个 AI"
T0.3 MCP 协议与 Agent 工程(与 A3 同步,Month 6-9)¶
学习目标
深入 MCP 协议规范,掌握 mcp Python SDK,能为任何系统写 MCP server——这正是 Alephain Guild 跨仓库集成的核心(PROJECT.md 的目标就是建立这一层)。
核心资料
- MCP 协议官方规范:modelcontextprotocol.io/specification(协议设计哲学+完整 spec)
mcpPython SDK 源码:github.com/modelcontextprotocol/python-sdk(尤其mcp.server.fastmcp)- Anthropic "How We Build Effective Agents" 白皮书
- 已有 MCP 服务源码:
synedrion/src/mcp_servers/speculum_fastmcp.py、core_server.py
配套实战(直接对接 PROJECT.md 已规划的工作)
- 完成 PROJECT.md 已规划的 Crucible MCP 服务(参考 speculum MCP 模式,12 个工具,P0~P2 优先级)
- 完成 debate-bridge MCP(跨 6+ provider 的辩论桥接)
- 设计
alephain-contracts共享 Pydantic 包,避免跨仓库 schema 漂移 - 用 Schemathesis 给 Speculum / Crucible API 加自动化合约测试
验收标准
- 能从零写一个生产级 MCP server(auth + structured logging + error handling + rate limit)
- 能解释 FastMCP 内置版(mcp 1.27.0)与 standalone fastmcp 3.x 的取舍——为什么本项目选内置版(与现有代码一致)
- 能讨论 MCP 与传统 RPC/REST 的差异
T0.4 Prompt 与 Context 工程(Month 4-6,与 A3 协同)¶
学习目标
系统掌握 prompt 设计模式与 context window 管理。LLM 时代的"程序设计"是 prompt 设计——这是新一代工程师的核心技能。
核心资料
- Anthropic Prompt Engineering Guide(官方文档,免费)
- "The Prompt Report"(Schulhoff 等 2024)——58 种 prompt 技巧综述,索引型必读
- Lilian Weng 博客:《Prompt Engineering》《LLM Powered Autonomous Agents》
- 《AI Engineering》(Chip Huyen)第 3-5 章
- Anthropic "Constitutional AI" 论文——直接对应 Synedrion 的 Constitution Engine
配套实战
- 优化 Synedrion 5 角色 prompt(用 eval 数据集对比改进前后,例如 Critic 找问题率、Architect 假设新颖度)
- 给 Synedrion 加 prompt cache 监控(命中率目标 >70%)
- 设计一套"prompt 版本控制"机制(每次改 prompt 都记录在 audit_logs)
- 实验 zero-shot / few-shot / CoT / Self-Consistency / ToT,看哪种最适合金融场景
验收标准
- 能讨论 zero-shot / few-shot / CoT / ToT / ReAct 各自适用场景
- 能为 Critic 写出"故意尖锐但不伤害协作"的 prompt
- 能解释 prompt cache 的工作原理与命中率优化策略
T0.5 个人效率度量(持续)¶
学习目标
度量自己的开发效率,迭代改进。能用数据回答"AI 协作让我快了多少、哪些任务 AI 不擅长"。
核心资料
- 《Accelerate》(Forsgren / Humble / Kim)——DORA 4 指标(部署频率、变更前置时间、失败率、恢复时间)
- 《The Pragmatic Programmer》(20 周年版)——工程素养
- superpowers + GSD 内置度量(commits per phase、turnaround time、phase 失败率)
配套实战
- 用
/gsd-stats跟踪每月 phase 数、commit 数、turnaround time - 月末做一次复盘:本月 AI 协作节省多少时间、哪些任务 AI 不擅长(写到
.planning/retros/) - 记录"AI 协作反模式"——例如:在 plan 不清楚时盲目执行、context 太长时不主动 compact
验收标准
- 能给 12 个月后的自己说出"我比一年前快/好在哪里"——并有数据支撑
- 能识别并避免至少 5 种 AI 协作反模式
数学基础(横向支撑,按需补)¶
核心原则:不预先啃,遇到时回查。
| 主题 | 主要参考 | 何时回查 |
|---|---|---|
| 概率论与数理统计 | 《Statistical Inference》(Casella & Berger);《All of Statistics》(Wasserman) | A1 / Q2 学到假设检验、回归 |
| 线性代数 | 《Linear Algebra and Its Applications》(Strang);3Blue1Brown 视频系列 | A2 / Q3 学到 PCA、矩阵分解 |
| 随机过程 | 《Stochastic Calculus for Finance I+II》(Steven Shreve) | Q3 学到衍生品定价、Itô 引理 |
| 凸优化 | 《Convex Optimization》(Boyd & Vandenberghe);Stanford EE364A 公开课 | Q3 学到组合优化 |
| 时间序列 | 《Analysis of Financial Time Series》(Tsay);《Time Series Analysis》(Hamilton) | A2 / Q1 学到 GARCH、协整 |
中文补充:《概率论与数理统计》(陈希孺)——简洁经典。
工程基础(辅助提升)¶
| 书 | 用途 |
|---|---|
| 《Designing Data-Intensive Applications》(Martin Kleppmann) | 数据系统设计——理解 Speculum / Crucible 后端架构 |
| 《Python for Finance》(2nd ed., Yves Hilpisch) | 量化 Python 编程 |
| 《Building Microservices》(2nd ed., Sam Newman) | Synedrion 的 microservice 拆分 |
与 Superpowers / GSD 工作流的集成¶
每个 Layer 完成时的标准流程
- 学习阶段
/gsd-explore做苏格拉底式提问,梳理学完的关键概念/gsd-capture把笔记捕获到知识库(可同时进 Synedrion 的 ChromaDB RAG)- 实战阶段
/superpowers:brainstorming设计实战项目/superpowers:writing-plans写实施计划/gsd-quant-pipeline走完整 Alpha Alchemy 4 阶段(INSIGHT → MODELING → REFINEMENT → VERIFICATION)- 沉淀阶段
/gsd-extract-learnings提取本 Layer 的关键决策、踩坑、模式/gsd-lessons记录到 historical-lessons.md- 综合演练
- 每完成 2 个 Layer 配对(A1+Q1、A2+Q2…),在 Alephain Guild 里走一次完整流程: 从想法 → AI Council 辩论 → 数学建模 → Speculum 回测 → Crucible 部署
时间安排(弹性,以产出物为里程碑)¶
总周期:12-18 个月(双轨并行,每条轨 4 个 Layer × 2-3 月,可重叠)
不严格按月,而是用产出物作为里程碑:
| 时点 | AI/量化轨状态 | 工具轨状态 | Alephain Guild 产出 |
|---|---|---|---|
| Month 0 | 建立学习仓库 + 模板 | T0.1 启动:Claude Code 全功能精通 | 个人 learning-tracker + 自定义 1 个 skill |
| Month 1-2 | A1 + Q1 启动 | T0.1 完成 + T0.2 启动(Codex 协同) | superpowers 源码精读完成 + 双 AI 工作流确立 |
| Month 3 | A1 + Q1 完成 | T0.2 完成 | Speculum 中跑通 ML 策略 + 微观结构分析报告 |
| Month 4-5 | A2 + Q2 推进 | T0.4 启动(Prompt 工程) | Synedrion 5 角色 prompt 优化(带 eval 对比) |
| Month 6 | A2 + Q2 完成 | T0.4 完成 + T0.3 启动(MCP/Agent) | Philosophers-Stone 中实现 LSTM/Transformer 因子 |
| Month 7-8 | A3 + Q3 推进 | T0.3 推进 | Crucible MCP 服务上线(P0 工具) |
| Month 9 | A3 + Q3 完成 | T0.3 完成 | Synedrion 新 Council 角色 + Crucible portfolio VaR + debate-bridge MCP |
| Month 10-11 | A4 + Q4 推进 | T0.5 持续 | 论文复现 1-2 篇 |
| Month 12 | A4 + Q4 完成 | 全部贯穿性技能成熟 | 1 个生产级 ML 增强策略部署到 Crucible |
| Month 12-18 | 进阶深耕 | T0.5 持续度量 | 贡献开源策略库、写技术 blog、复现前沿论文 |
关键文件路径与现有资产对接¶
| 学习模块 | 项目对接文件 | 备注 |
|---|---|---|
| A3 LLM/Agent | synedrion/src/core/constitution.py、ai_council.py、debate_engine.py |
Constitution AI / multi-agent 实战 |
| A3 RAG | synedrion/src/services/knowledge_base.py |
ChromaDB 实战 |
| A4 AI for Finance | alchymia-labs/philosophers-stone/_template/ |
策略模板 |
| Q1 微观结构 | Speculum 数据层 | Level-2 数据接入 |
| Q2 因子 | philosophers-stone/momentum/、portfolio/rebalancing/ |
现有因子代码参考 |
| Q3 组合 | tesseract-trading/the-crucible/config/risk/ |
风控规则集成 |
| Q4 执行 | tesseract-trading/the-crucible/crucible_engine/ |
执行引擎 |
| 方法论 | grimoire/methodology/01-alchemy-overview.md-05-verification-phase.md |
Alpha Alchemy 4 阶段对应学习的实战流程 |
验证(End-to-End 检查)¶
每个 Layer 完成后,通过以下方式验证学习效果:
- 代码验证:能独立修改 Alephain Guild 对应模块,通过
pytest与 Speculum 回测验证 - 概念验证:能用自己的话向"3 个月前的自己"解释本 Layer 的核心概念,无需查书
- 批判验证:能找出对应模块当前实现的 1-2 个可改进点(过拟合风险、未处理的 edge case 等)
- Council 验证:用 Synedrion 让 5 个角色对你写的代码做一轮辩论,看 Critic 能否找到你没想到的问题
最终验证(Month 12+):
- 能独立完成一个论文复现:从 paper → mathematical model → code → backtest → 写复现报告
- 能在 Alephain Guild 主仓库提交 PR(策略、组件、文档任一)并通过 code review
学习反模式(避免)¶
- 不要先啃数学:数学基础按需补,不要花 3 个月看完 Strang 再开始——你会忘光
- 不要只看不写:每个 Layer 必须有代码产出,Markdown 笔记不算
- 不要跳过 Q1:微观结构是后面所有 Q 模块的根基,跳过会导致 Q2 的因子设计无市场感
- 不要积压论文:每周最多新读 1 篇,优先消化已读
- 不要孤立学习:每个 Layer 至少完成一次 Synedrion AI Council 辩论,让 Critic 找漏洞
- 不要忽视工具轨:Track 0 的复利效应最大——Claude Code/Codex 熟练度 +1 倍 ≈ 学习速度 +1 倍。前 2 个月先把工具吃透,比急着推 AI/量化轨更划算
- 不要让 AI 替你思考:AI 能写代码、能解释概念,但不能替你形成"市场直觉"。工具轨的目的是让你写得更快,不是让你思考更少