sqlboy2ai 转型总脑图 — 由点及面¶
定位:卷一 · 转型架构全书(索引 + 正文)— 广告大数据 → AI 应用 / Agent / MLOps 的 干货正文,非玩具工程清单。
用法:精读 §1–§6 · 查询 §0 + 附录 A · 术语 术语速查 · 全景 展开图 · 交互 Canvassqlboy2ai-master-mindmap.canvas.tsx
锚点:依赖 MkDocsattr_list;跳不准请硬刷新。旧 id:#scene_m90→#scene_portfolio_90d;#sym_demo_broken→#sym_run_fail(文内保留 span 别名)。
深读:机制与排期仍链 apr3/sqlboy2ai
纵轴(共享):H0 目标与约束 → H1 场景/岗位 → H2 项目与产品 → H3 Agent 运行时 → H4 模型与 RAG → H5 工程与交付 → H6 成本与节奏 · H7 实践横切(学习/求职/副业/工程)
一句话定位(面试/简介复用)→ 个人定位与差异化叙事
本书体例¶
| 篇 | 对应 § | 读什么 |
|---|---|---|
| 第一篇 目标与场景 | §1 · §2 | 九宫格、八类转型场景与岗位路径 |
| 第二篇 项目与链路 | §3 · 拓扑 | 作品集优先级、交付验证链路 |
| 第三篇 原理下钻 | §4 | Agent / RAG / 数据衔接 / MCP |
| 第四篇 实践与节奏 | §5 · §6 | 问题库、里程碑、Token/精力 TCO |
| 工具章 | §0 · §7 · §8 · 附录 A · §9 | 罗盘、自测、节点表、百科、apr3 地图 |
三种读法
| 读法 | 入口 | 适合 | 时间盒 |
|---|---|---|---|
| 正文精读 | §1 → §2 定场景 → §3 锁项目 → §4 机制 | 周末 2–3h 系统推进 | 单次读完一章 |
| 查询/排障 | §0 罗盘 → 附录 A / §5 runbook | 工作日卡住、明天就要动作 | 5–15 min |
| 目录/链路 | Markmap 展开 + 拓扑图注 | 建立全景、面试前复习结构 | 20–30 min |
维护顺序:Markmap → §8 节点表 → 附录 A 百科 → Canvas NODES / SYMPTOM_HIGHLIGHT → apr3 README 回链一句。
与 DDIA 卷一 对照:体例同为四篇 + 工具章 + 附录 A;sqlboy 增 §9 apr3 地图与转型术语;数据优势用 path_data_bridge 衔接,勿在两脑图间重复抄 Flink 教程正文。
节点 id 迁移(2026-06)¶
| 旧 id | 新 id | 说明 |
|---|---|---|
scene_m90 |
scene_portfolio_90d |
90 天作品集闭合(非「M90 Demo」) |
sym_demo_broken |
sym_run_fail |
交付跑不通(环境/工程) |
与 apr3 文档对照¶
| apr3 文档 | 脑图落点 |
|---|---|
| 实施手册 | §1–§2、scene_offer |
| 6 个月双轨 | scene_dual、§6 |
| 作品集优先级 | §3 |
| 项目 1–5 | §3 各 proj_* |
| sql_audit_mvp | proj_sql_audit、sym_run_fail |
| 知识补齐清单 | §4 H4–H5 |
| Agent 递进路径 | goal_side、B01 |
术语速查¶
| 锚点 | 术语 | 含义 |
|---|---|---|
| anti-pattern | 反模式 | 常见但长期有害的做法(见组件/项目卡片) |
| agent | Agent | 能分解目标、调用工具、根据观察再规划的程序;非单次 Chat |
| mcp | MCP | Model Context Protocol:标准方式暴露工具给模型,带权限边界 |
| rag | RAG | 检索增强生成:先查知识库再生成,降低胡编 |
| skill | Skill | 可售卖/可安装的垂直能力包(如 SQL 审计规则集) |
| portfolio | 作品集 | 求职可讲述的 2–3 个闭环项目,重相关而非数量 |
| milestone | M30/M60/M90 | 交付检查点:可复现运行 / 录屏 / 面试叙事 |
| bridge | 数据衔接 | 批流/对账/分区思维迁移到审计规则与 Agent 输入 |
| eval | 评测集 | 固定问答/审计用例;发布前回归,抑幻觉与误报 |
| rules | 规则引擎 | 可版本化规则;sql_audit 核心,LLM 可选解释 |
| main-battle | 主战役 | 每周求职/副业/学习只选一个为主 |
| dual | 双轨 | 岗位与副业同步推进,见 scene_dual |
| hallucination | 幻觉 | 模型编造;RAG 用引用+评测缓解 |
| fc | Function Calling | 模型 API 内嵌工具调用,与 MCP 协议层不同 |
| lg | LangGraph | 有向图编排 Agent 状态与边 |
| obs | 可观测 | Prompt 日志、成本、评测通过率 |
| idempotent | 幂等 | 重复执行同输入得同结果;工具侧亦重要 |
展开图导读¶
| 形态 | 适合什么时候 | 跳转 |
|---|---|---|
| 正文 | 选项目、写 SLA、学机制 | §1 · §2 · §4 |
| 查询 | 卡住、5 分钟定位 | §0 · 附录 A · Canvas |
| 树形 | 转型全貌 | Markmap |
| 拓扑 | 交付链、纵轴 | 纵轴 · 交付链路 · 卡点 |
维护顺序:Markmap 树 → §8 节点表 → 附录 A → Canvas NODES。
导读 · 精读:第一次阅读建议 纵轴拓扑(理解 H0–H7)→ 交付验证链路(理解 sql_audit 中枢)→ 回到 §2 选你的 scene_*。卡住时走 卡点拓扑 或 §0,不要从 apr3 README 随机翻页。MkDocs 站内跳转依赖 attr_list + 标题 {#锚点};本地 mkdocs serve 改锚点后需 硬刷新 浏览器缓存。
树形 · Markmap(可交互展开)¶
拓扑 · 纵向下钻(H0→H6)¶
flowchart TB
subgraph H0_box [H0 目标]
GJ[goal_job]
GS[goal_side]
GB[goal_brand]
end
subgraph H1_box [H1 场景]
SO[scene_offer]
SM[scene_portfolio_90d]
SD[scene_dual]
end
subgraph H2_box [H2 项目]
PA[proj_sql_audit]
PR[proj_ad_review]
PC[proj_coach]
PG[proj_rag]
end
subgraph H3_box [H3 Agent]
AG[path_agent]
MCP[path_mcp]
BR[path_data_bridge]
end
subgraph H4_box [H4 RAG]
RG[path_rag]
end
subgraph H5_box [H5 工程]
API[stack_fastapi]
end
subgraph H6_box [H6 节奏]
M30[ops_m30]
COST[ops_cost]
end
GJ --> SO
GS --> PC
SM --> PA
SO --> PA
SO --> PR
PA --> AG
PR --> AG
PG --> RG
AG --> API
RG --> API
PA --> M30
sym_hub[H7 卡点]
sym_hub -.-> PA
sym_hub -.-> API
sym_hub -.-> GB
图注 · 精读:H0 决定本周 主战役(求职/副业/学习只能选一个为主)。H1 场景不直接写代码,而是选 岗位路径 + 默认项目组合。H2 proj_sql_audit 是能力证明中枢;H3–H5 是技术栈落地层。H6 用 M30/M60/M90 检查 可复现交付,不是「做完界面」。H7 横切:卡住先 §0,勿翻整库 apr3。
拓扑 · 项目与交付验证链路¶
flowchart TB
subgraph audit [sql_audit_mvp 中心]
SQL[SQL输入]
Rules[规则引擎]
LLM[可选LLM解释]
HTTP[FastAPI HTTP]
SQL --> Rules
Rules --> LLM
Rules --> HTTP
LLM --> HTTP
end
subgraph scenes [场景挂载]
SM[scene_portfolio_90d]
SS[scene_sql_audit]
SJ[scene_offer]
end
subgraph others [并行项目]
AR[proj_ad_review 复盘]
CO[proj_coach 教练]
RAG[proj_rag 知识库]
end
SM --> audit
SS --> audit
SJ --> AR
AR --> RAG
CO --> RAG
BRIDGE[path_data_bridge]
BRIDGE --> Rules
图注 · 精读:规则引擎 → HTTP 是求职与副业都可验收的硬交付;LLM 分支可选(enable_llm:false 仍可证明工程能力)。path_data_bridge 把 DDIA 的分区/对账思维接到 审计规则,是差异化叙事核心。复盘/RAG 并行但不抢 sql_audit 的 M30 检查点。
拓扑 · 卡点路径¶
flowchart TB
sym_run_fail[sym_run_fail]
sym_no_project[sym_no_project]
sym_interview_gap[sym_interview_gap]
sym_no_revenue[sym_no_revenue]
sym_scope_creep[sym_scope_creep]
sym_learning_overload[sym_learning_overload]
sym_run_fail --> proj_sql_audit
sym_run_fail --> stack_fastapi
sym_run_fail --> path_agent
sym_no_project --> proj_sql_audit
sym_no_project --> proj_ad_review
sym_no_project --> scene_offer
sym_interview_gap --> goal_brand
sym_interview_gap --> goal_job
sym_interview_gap --> path_data_bridge
sym_no_revenue --> goal_side
sym_no_revenue --> proj_coach
sym_scope_creep --> scene_dual
sym_scope_creep --> ops_m30
sym_learning_overload --> path_rag
sym_learning_overload --> stack_langgraph
proj_sql_audit[proj_sql_audit]
stack_fastapi[stack_fastapi]
path_agent[path_agent]
goal_brand[goal_brand]
goal_job[goal_job]
path_data_bridge[path_data_bridge]
goal_side[goal_side]
proj_coach[proj_coach]
scene_dual[scene_dual]
ops_m30[ops_m30]
图注 · 精读:sym_run_fail 先查 H5 工程再怀疑模型;sym_no_project 回 §3 优先级;sym_interview_gap 必过 goal_brand + path_data_bridge。与 §0 表 一致。
0. 5 分钟决策罗盘¶
步骤:① 选卡点 → ② 先问自己 → ③ 锁定
H?→ ④ §正文或 apr3 → ⑤ QA
| 卡点 | 先问自己 | 层 | 第一跳转 |
|---|---|---|---|
| 不知先做哪项目 | 本周主目标是求职还是副业? | H2 | §3 |
| 交付跑不通 | PYTHONPATH?8765?必须 LLM key? | H5 | sym_run_fail |
| 面试讲不清优势 | 30s/90s 能否口述? | H0 | sym_interview_gap |
| 副业零收入 | 是否在卖平台而非 Skill? | H6 | sym_no_revenue |
| 学不动 / 贪全 | 是否在囤课而非做增量? | H4 | sym_learning_overload |
| 范围蔓延 | 新功能是否服务 M30/M60/M90? | H6 | sym_scope_creep |
| 算法面试慌 | Top3 是否含算法? | H1 | scene_algo |
| 与数据岗脱节 | 能否讲 Flink/对账 → 审计价值? | H3 | path_data_bridge |
卡点精读¶
sym_run_fail — 交付跑不通¶
定义:sql_audit 按 README 无法得到预期 JSON/审计结果。验收:curl 本地 HTTP 或 CLI 有结构化输出;无 API key 时规则路径仍通。下钻:H5 stack_fastapi → H2 proj_sql_audit。根因:PYTHONPATH、端口占用、依赖未装、误开 LLM 导致超时。应急:enable_llm:false、按 README 逐步排。→ E01 · E02
sym_no_project — 不知做哪项目¶
定义:并行开太多方向,无本周可验收增量。必问:主战役是求职还是副业?下钻:H2 §3 优先级表。应急:只保留 sql_audit 一条交付线直到 M30 通过。
sym_interview_gap — 面试讲不清¶
定义:项目讲成 CRUD,未突出广告+数据+Agent。指标:90s 无卡顿、标签一致。下钻:H0 goal_brand、path_data_bridge。应急:重写 个人定位 三句话。→ J01 · J02
sym_no_revenue — 副业零收入¶
定义:有产品无付费。根因:卖「大平台」、无痛点 Skill。下钻:goal_side、proj_sql_audit Skill 化。→ B01
sym_learning_overload — 学不动贪全¶
定义:课/论文堆积,无周交付。规避:项目驱动、默认栈锁定。→ L01
sym_scope_creep — 范围蔓延¶
定义:新 feature 不服务当前 里程碑。验收:本周 PR/提交是否让 M30/M60/M90 检查项多勾一项?下钻:H6 ops_m30 + scene_dual。根因:双主战役、追新框架、完美主义 UI。应急:功能冻结清单,非 P0 需求进 backlog。→ B03
sym_learning_overload — 学不动贪全(精读补)¶
定义:输入(课/论文/框架)远大于输出(可验收增量)。指标:本周是否有 README 可跟的交付。下钻:H4 path_rag/path_agent 仅服务当前项目,不平行开新课。明天一个动作:删 1 门进行中的课,改写 1 条评测用例。
算法面试慌(罗盘表延伸)
定义:scene_algo 与 H2 抢时间或 Top3 无算法。验收:连续 7 天每日 1 题打卡。下钻:H1 scene_algo + J03。明天一个动作:早晨 25min 刷 1 题,晚间只碰 sqlboy。
与数据岗脱节(罗盘表延伸)
定义:面试只讲 Flink/数仓,不讲 AI 闭环。验收:能否在 90s 内说出「分区/对账思维 → SQL 审计规则」。下钻:H3 path_data_bridge + DDIA 卷一。明天一个动作:写 1 条审计规则并绑定 rule_id。
5 分钟口述模板
卡点 __ → 本周主目标 __ → 层 H__ → 项目/文档 __ → 明天一个动作 __
1. 目标九宫格¶
转型期 不可九格全满 — 标出牺牲项(见下三角)。
| 维度 | 在问什么 | 可量化例 | 要点 | 常牺牲 |
|---|---|---|---|---|
| 求职窗口 | 何时投简历、面试 | 数据+AI 岗 Q2 | 作品集 > 证书 | 副业首发 |
| 副业收入 | 第一笔付费 | Skill 99–499 | 先卖清单再卖平台 | 深度学论文 |
| 作品集 | 几个可验证闭环 | M90 检查:sql_audit + 1 Agent | 3 高相关 > 6 泛项目 | 完美架构 |
| 个人品牌 | 叙事是否清晰 | 广告+数据+Agent | 个人定位 | 泛自媒体 |
| 技能深度 | Agent/RAG 掌握度 | 能画工作流 + 评测集 | 够用优先 | 底模训练 |
| 可验证交付 | 他人能否复现 | HTTP 8765 / README 逐步 | 无 key 可验收 | 纯 PPT |
| 可维护 | 规则/测试 | 规则即代码 | 可迭代 | 一次写完 |
| 合规 | PII/API | 脱敏样例 | 不上传生产 SQL | — |
| 每日精力 | 小时分配 | P0≤4h;sqlboy≤14h/周 | §6 | 通宵 |
不可同时最大化(背三角)
- 主战役:求职 / 副业 / 系统学习每周只选一个为主。
- 深度 vs 广度:sql_audit 闭合 → 复盘 Agent → RAG/教练。
- 可验证交付 vs 空壳 SaaS:先规则+HTTP+评测,再收费;勿先造大平台。
goal_job — 求职¶
窗口期内 作品集与叙事 优先于证书与论文。可量化:2–3 个可复现闭环、90s 故事线无卡顿、简历每段含「AI 应用/Agent/审计」之一。本周必问:「若只推进一件事,是否让面试官下周能打开我的 HTTP 8765?」与副业冲突:周一日历标主战役,副业大版本推迟(B03)。牺牲项常包括:深度数学、第六个小项目、泛自媒体更新频率。
goal_side — 副业¶
第一笔收入来自 垂直 Skill(SQL 审计清单/规则包/投放复盘模板),非「通用 AI 助手 SaaS」。可量化:每周 ≥1 次目标用户对话、首单 ¥99–499 验证付费意愿。本周必问:「卖的是痛点清单还是平台账号?」与求职冲突时 周一只选主目标;维护崩见 B02。牺牲项:完美 UI、多租户、过早 API 对外开放。
goal_brand — 品牌¶
标签统一:广告大数据 → 数据+AI 应用+Agent;拒绝「我又做大数据又做 NLP 又做 CV」散弹叙事。可量化:三句话定位背诵、LinkedIn/简历同一主标签、录屏开场 10s 不改口。本周必问:「陌生人能否在 30s 内复述我是干什么的?」不一致触发 sym_interview_gap。牺牲项:追热点模型名、与定位无关的证书堆叠。
goal_energy — 精力¶
P0 求职(如 Binance 流程)与 sqlboy 项目 分桶填数;sqlboy 建议 ≤10–14h/周,P0 建议 ≤4h/日。可量化:§6.2 表每周复盘是否超限。双主战役是 反模式 — 同周冲刺投递 + 副业大发布必导致 sym_scope_creep。本周必问:「今晚 2 小时给算法、sqlboy 还是休息?」牺牲项:通宵、无缓冲的「再学一门新课」。
2. 场景 → 路径 → 产出¶
scene_offer — 拿 offer¶
转型约束:时间窗内拿到 AI 应用/数据+AI 岗;允许牺牲副业首发与底模学习。
产出契约:三件套(proj_sql_audit + proj_ad_review 或审计叙事 + 可选 proj_rag)+ 90s/3min 录屏 + 简历每 bullet 含 AI/Agent 关键词;模拟面试能讲清 path_data_bridge。
推荐路径与岗位:默认 LLM 应用工程师;有平台经验可叠 MLOps 叙事,勿冒充纯算法岗。
默认项目分工:proj_sql_audit(M30)→ proj_ad_review(M60)→ 可选 proj_rag。
备选:仅审计岗 JD 时强化 scene_sql_audit,暂缓教练/CTR。
失败 Top3:① 项目 >3 个且无闭环 ② 讲成 CRUD(J02)③ 算法与 sqlboy 抢同一晚间块。
周/月节奏:周更 1 个可验收增量(README 逐步);月对齐 双轨路线 检查点。
scene_portfolio_90d — 90 天作品集闭合¶
转型约束:90 天内形成 可面试讲述 的闭环;不是堆界面或依赖 API key 的炫技。
产出契约:
| 检查点 | 交付物 | 验收 |
|---|---|---|
| M30 | sql_audit CLI+HTTP | 无 key 规则路径可复现 |
| M60 | + 复盘 Agent 或 RAG 其一 | 3min 录屏讲清价值 |
| M90 | 三件套叙事 + 评测集 | 90s 流畅 + 他人可按 README 复现 |
机制:sql_audit = 规则引擎 + HTTP + 可选 LLM — 工程能力证明;LLM 仅解释层。
推荐路径:path_agent + path_data_bridge 为主;path_rag 为加成。
失败 Top3:① sym_run_fail(PYTHONPATH/端口)② 强依赖 LLM 导致无法验收 ③ 未录屏导致面试讲不清。
运维节奏:按 sql_audit README 逐步验收;每周五固定「录屏 rehearsal」15min。
scene_sql_audit — SQL 审计交付¶
转型约束:面向 数据研发/AI 应用 岗,证明你能发现性能/口径/链路风险,而非「Chat 写 SQL」。
产出契约:规则 ID + SQL 片段 + 严重级别 + 报告模板;P01 可解释;可选 Skill 定价锚点。
推荐路径:path_data_bridge → proj_sql_audit;工具栈 stack_fastapi + 规则即代码。
默认/备选:默认唯一 M30 核心;备选仅当 JD 纯 MLOps 时叠部署叙事,不另起第四大项目。
失败 Top3:误报风暴(E03)、规则不可版本化、把审计做成通用聊天。
scene_ad_review — 广告复盘¶
转型约束:体现 广告域壁垒(投放/归因/ROI),与泛 BI 助手区分。
产出契约:指标口径表 + Agent 工作流(Plan-Tool-Observe)+ 可选 RAG 引用来源;面试 90s 含「复盘提效」量化句。
推荐路径:path_agent + path_rag(引用投放文档);岗位叙事:智能化投放/增长分析。
默认项目:M60 第二优先 proj_ad_review;依赖 M30 sql_audit 的工程习惯(日志/测试)。
失败 Top3:指标口径前后不一致、Agent 无 max_steps、复盘结论无数据来源。
深读:项目 2
scene_rag — 广告知识库¶
转型约束:知识问答 可追溯,服务投放/审计引用,非企业百科炫技。
产出契约:ingest 清单 + chunk 策略说明 + 黄金问答集 通过率 ≥ 约定阈值 + 生成带引用片段。
推荐路径:path_rag;与 path_agent 组合时 Agent 只负责编排,事实以检索为准。
失败 Top3:幻觉(P02)、chunk 过大丢细节、无权限隔离上传生产文档。
周节奏:每周固定回归评测集;发布前禁止「静默换嵌入模型」。
深读:项目 5
scene_coach — 转型教练¶
转型约束:方法论与 内容产品;读者已是转型者,不是零基础科普。
产出契约:内容专栏/咨询 SOP + 可选轻量 Agent(FAQ);不替代 H2 工程闭环。
推荐路径:副业 goal_side;求职仅作加分(品牌一致性)。
失败 Top3:与 M30 抢时间、卖「大而全训练营」无案例、叙事与 sql_audit 不一致。
节奏:sql_audit、复盘 闭合后 再放大教练;见 项目 4
scene_dual — 6–12 月双轨¶
产出契约:路线图分月里程碑(求职投递窗 + 副业首单窗);§6.2 精力表填实数。
推荐路径:岗位线 scene_offer + 副业线 scene_sql_audit Skill 化;冲突仲裁见 B03。
内联摘要(双轨干货 ≤15 行):
- 月 1–2:M30 闭合 + 简历叙事定稿
- 月 3–4:M60 第二项目 + 模拟面试
- 月 5–6:M90 三件套 + 副业 Skill 上架
- 每周一只标「主:求职|副业|学习」
- API 预算与 P0 求职小时设硬顶
深读:6 个月双轨
scene_algo — 面试算法¶
转型约束:算法关与 Agent 项目 并行,不替代 H2 可验证交付。
产出契约:Top3 刷题计划 + 每日 1 题打卡;面试能口述复杂度,但 90s 项目故事仍以 sql_audit 为主。
推荐路径:scene_algo 早晨块 + 晚间 sqlboy;挂算法关见 J03。
失败 Top3:停项目只刷题、刷题无广告业务变种、考前 72h 仍开新 Agent feature。
深读:算法总览
学习路径(横向宽)
| 路径 | 适合 | 文档 |
|---|---|---|
| LLM 应用工程师 | 第一优先 | 05-LLM应用工程师 |
| MLOps | 平台/DevOps 背景 | 03-MLOps |
| AI 平台 | 分布式/调度 | 02-AI平台 |
| ML 工程师 | 特征/训练更重 | 01-机器学习 |
岗位路径决策(LLM 应用 / MLOps / AI 平台 / ML)¶
LLM 应用:默认选;匹配 sql_audit + Agent 工作流。MLOps:你已有数据平台经验时加强部署/评测/成本叙事。AI 平台:偏调度与分布式,勿与「训练算法岗」混淆。ML 工程师:仅当岗位 JD 明确要求训练/特征;转型期 不优先 补数学推导(L02)。
3. 项目与产品层(H2)¶
flowchart LR
subgraph deliverable [可交付]
Audit[sql_audit_mvp]
end
subgraph design [设计稿]
P2[复盘Agent]
P4[转型教练]
P5[广告RAG]
end
subgraph optional [可选]
P1[CTR预测]
end
Audit --> P2
P5 --> P2
Audit --> P4
| 节点 ID | 项目 | 求职 | 副业 | 状态 | 文档 |
|---|---|---|---|---|---|
proj_sql_audit |
SQL 与数据任务审计 | 数据+AI 工程 | Skill 最先收费 | 可复现交付 | 项目 3 · 工具 |
proj_ad_review |
广告投放复盘 Agent | 广告智能化 | 模板/日报 | 设计+迭代 | 项目 2 |
proj_coach |
AI 转型教练 Agent | 方法论 | 内容/咨询 | 设计 | 项目 4 |
proj_rag |
广告知识库 RAG | RAG 工程 | 知识产品 | 可选加成 | 项目 5 |
proj_ctr |
点击率预测 | 经典 ML | 弱副业 | 参考 | 项目 1 |
推荐优先级(默认)
- sql_audit — 最贴数据工程、最快演示、最易 Skill 化
- 广告复盘 Agent — 业务壁垒、求职叙事
- 转型教练 — 品牌与内容(前两个后再沉淀)
| 方案 | 顺序 |
|---|---|
| 求职优先 | sql_audit → 复盘 → 教练 |
| 副业优先 | 教练内容 → sql_audit 收费 |
| 平衡(推荐) | sql_audit → 复盘 → 教练 |
一鱼两吃:同一 proj_sql_audit 同时服务 求职作品集(规则+工程)与 副业 Skill(审计清单/模板),避免两套代码叙事。
proj_sql_audit — 项目卡片¶
问题域:SQL/任务 审计(性能、口径、链路),非万能写 SQL。求职:数据+AI 工程、平台化能力。副业:最先收费的垂直 Skill。交付物:规则包 + HTTP API + 可选 LLM 解释 + 测试用例。反模式(术语速查·反模式):强依赖 key、无规则 ID、生产 SQL 入库。验收:README 逐步可复现;审计 JSON 含规则引用。
proj_ad_review — 复盘 Agent¶
问题域:投放复盘自动化。求职:广告智能化叙事。交付:结构化指标 + Agent 流程;可接 RAG 引用。反模式:纯 Chat 无口径、无业务指标定义。
proj_coach — 转型教练¶
问题域:转型方法论内容化。副业:咨询/内容;第三优先级,不抢 M30。反模式:泛 AI 鸡汤无工程锚点。
proj_rag — 广告 RAG¶
问题域:广告知识可追溯回答。机制:RAG + 评测集。反模式:无权限、无更新策略、无评测即上线。
proj_ctr — CTR 预测(参考)¶
问题域:经典广告 ML(特征+训练+离线评估)。求职:仅当 JD 强调训练/特征工程时作 第四叙述,非 M30 必做。副业:弱 — 难 Skill 化、交付周期长。交付物:离线 AUC 报告 + 特征说明即可,勿与 sql_audit 抢 4 周。反模式:转型期深挖数学推导却无 Agent 闭环。验收:能口述特征与标签 leakage,不必生产级 serving。
项目选型决策(3 问)
- 本周主战役是求职还是副业?→ 定 §3 优先级行。
- 新想法是否让 M30/M60/M90 多勾一项?→ 否则进 backlog。
- 能否用 同一仓库 讲清两个故事(工程+商业)?→ 优先
proj_sql_audit一鱼两吃。
4. 原理下钻(H3–H5)四条路径¶
结构:动机 → 端到端 → 机制 → 参数 → 资源 → 信号 → 内联干货。
path_agent — Agent 工作流¶
动机:把「多步任务 + 工具 + 状态」编排成可维护工作流(复盘、审计解释、教练对话)。
端到端:用户目标 → Planner 分解 → 工具调用(含 MCP)→ 观察结果 → 再规划或结束。
机制:状态机记录步骤;max_steps 防 P03;LangGraph 等编排有向图。上下文:token 窗口有限 → 摘要/裁剪。持久化:Prompt 版本、会话日志、评测集。
参数表
| 参数 | 调大 | 调小 |
|---|---|---|
| max_steps | 能完成复杂任务 | 死循环成本高 |
| temperature | 创造性升 | 审计类宜低 |
| 超时/重试 | 抗网络抖动 | 卡死久 |
信号:工具失败率、单请求成本暴涨、循环检测触发。
内联干货:Agent ≠ 单次 LLM;价值在 可控多步 + 可审计工具。→ MCP 科普
path_rag — RAG 链路¶
动机:让生成 有据可查,服务广告知识库与复盘引用。
端到端:文档 ingest → chunk → embed → 查询 →(可选 rerank)→ 填入 prompt → LLM 生成。
机制:chunk 过大丢细节、过小丢上下文;top_k 与阈值权衡召回率/精度。信号:幻觉、召回空、知识过期(P02)。
参数:chunk_size、top_k、相似度阈值、嵌入模型维度。
→ 项目 5
path_data_bridge — 数据工程衔接¶
动机:把 广告大数据工程师 的硬栈优势讲进 AI 岗。
机制:分区键/增量/对账/幂等思维 → SQL 审计规则;Flink 延迟与窗口 → 实时特征说明;勿把整表 scan 结果塞进 prompt。
面试句:「我用批流一致性与分区设计经验,做 可解释的 SQL 审计 Agent,不是泛 Chat。」
path_mcp — MCP / 工具层¶
动机:标准化工具暴露,替代每家模型私有 Function Calling 碎片集成。
机制:MCP Server 注册 tool → Client 调用 → 结构化返回;须 权限允许列表 + 审计日志。
与 Function Calling:FC 是模型侧接口;MCP 是跨应用协议 — 见 术语速查。
→ mcp.md
H4–H5 默认工具栈¶
| 层 | 选型 | 何时换 | 反模式 |
|---|---|---|---|
| H4 模型 | API 多厂商 + Ollama 本地 | 成本/合规 | 频繁换模型无评测 |
| H4 检索 | Chroma/Qdrant/pgvector | 规模/权限 | 无版本管理 |
| H5 服务 | FastAPI + pytest | — | 无日志无测试 |
| H5 可观测 | Prompt 日志、成本、评测 | — | 只看炫酷 UI |
→ 默认工具栈清单
拓扑 · Agent vs RAG 选型¶
flowchart TB
Q[需求类型]
Q -->|多步工具编排| AG[path_agent]
Q -->|知识问答可追溯| RG[path_rag]
Q -->|SQL审计规则| SA[proj_sql_audit]
图注:审计优先 规则引擎;知识问答才上 RAG;复杂流程用 Agent 编排,三者可组合但 M30 先闭合 sql_audit。
图注 · 精读:若 JD 强调「智能化投放」,复盘 Agent(path_agent)+ 可选 path_rag 引用投放文档;若 JD 强调「数据质量/审计」,proj_sql_audit + path_data_bridge 为主,Agent 仅作解释层。三者组合时 评测集 必须分域:审计用例 ≠ 问答用例。
H4–H5 选型决策(补充)¶
| 你现在的信号 | 优先栈 | 暂缓 |
|---|---|---|
| curl 8765 失败 | FastAPI + 规则引擎 | LangGraph 新编排 |
| 工具调用 Permission denied | MCP 允许列表 | 换模型 |
| 回答无引用 | RAG + 黄金问答集 | 加大 Agent 步数 |
| 面试问 Flink/对账 | path_data_bridge 叙事 | 新 RAG 知识库 |
| API 预算告警 | Ollama 本地 + 关 LLM | 新嵌入模型 |
内联摘自默认工具栈(≤20 行)
- 锁栈 4 周:H5 FastAPI + 规则引擎;H3 LangGraph 仅当复盘/教练需要多步。
- 换栈条件:书面记录「替换理由 + 节省交付天数」;否则 L03。
- 观测最小集:请求 id、规则命中列表、token 计数、评测通过率 — 见 可观测。
- 测试最小集:≥10 条黄金 SQL/问答;CI 或 pre-commit 跑回归。
path_rag — 评测与发布清单(补充)¶
| 阶段 | 动作 | 通过标准 |
|---|---|---|
| ingest | 文档清单+版本号 | 无生产 PII |
| chunk | 记录 chunk_size | 抽样可读 |
| embed | 固定模型版本 | 换模型需全量重跑 |
| retrieve | top_k/阈值 | 黄金集召回率达标 |
| generate | 强制引用片段 | 无引用则降级为「未找到」 |
path_agent — 与 DDIA「无单点」类比(补充)¶
Agent 编排层类似 协调者:工具失败要有重试上限与降级(规则-only),避免把「模型聪明」当成系统可靠性。面试可对照 DDIA 的复制/分区思维:多步 Agent = 多副本尝试,但必须有 边界(max_steps、允许工具列表)。
5. 实践问题库(横切 H7)¶
格式:现象 → 根因 → 规避 → 日常 → 应急;高优条目下附 排障叙述。
学习¶
| ID | 现象 | 根因 | 规避 | 日常 | 应急 |
|---|---|---|---|---|---|
| L01 | 课太多做不完 | 囤课不输出 | 项目驱动 | 每周 1 个可演示增量 | 砍课单 |
| L02 | 数学焦虑 | 目标岗不需要推导 | 读 MLOps 价值文 | 只学够用概念 | 大模型时代 MLOps |
| L03 | 工具换太勤 | FOMO | 默认栈锁定 | 新工具需替换理由 | 回 FastAPI+规则引擎 |
求职¶
| ID | 现象 | 根因 | 规避 | 日常 | 应急 |
|---|---|---|---|---|---|
| J01 | 简历像纯大数据 | 未改标签 | 统一「AI 应用+Agent」 | 每 bullet 带 AI 关键词 | 个人定位 |
| J02 | 项目讲成 CRUD | 无业务价值 | 先 ROI/审计价值 | 90s 排练 | 复盘 Agent 故事线 |
| J03 | 算法关挂 | 练太少 | Top3 含算法 | 每日 1 题 | 算法专题 |
副业¶
| ID | 现象 | 根因 | 规避 | 日常 | 应急 |
|---|---|---|---|---|---|
| B01 | 零付费 | 卖平台不卖痛点 | Skill/清单先行 | 每周 1 次用户对话 | 递进路径 §2 |
| B02 | 维护崩 | 范围太大 | 72h MVP | 功能冻结清单 | 下架非核心 |
| B03 | 与求职抢时间 | 双主战役 | 周一只选主目标 | 日历块 | §6 填表 |
工程¶
| ID | 现象 | 根因 | 规避 | 日常 | 应急 |
|---|---|---|---|---|---|
| E01 | sql_audit import 失败 | PYTHONPATH | README 逐步 | 一键脚本 | export PYTHONPATH |
| E02 | LLM 超时 | 网络/key | 默认关 LLM | 规则仍可验收 | enable_llm:false |
| E03 | 规则误报多 | 规则未版本化 | 测试用例 | CI 回归 | 降级规则集 |
产品¶
| ID | 现象 | 根因 | 规避 | 日常 | 应急 |
|---|---|---|---|---|---|
| P01 | 用户不信结果 | 无可解释性 | 规则 ID + 片段 | 审计报告模板 | 人工复核模式 |
| P02 | RAG 胡说 | 无评测 | 黄金问答集 | 周回归 | 关自动生成 |
| P03 | Agent 死循环 | 无 max_steps | 步数上限 | 日志告警 | 强制终止 |
L01 — 课太多做不完¶
验证:本周是否有可展示增量。规避:项目驱动,砍课单。应急:只保留 sql_audit 交付线。
J01 — 简历像纯大数据¶
验证:每 bullet 是否含 AI/Agent/审计关键词。应急:按 个人定位 重写。
J02 — 项目讲成 CRUD¶
验证:90s 是否含业务 ROI(审计降风险、复盘提效)。应急:用复盘故事线练口述。
B01 — 零付费¶
验证:是否在卖平台。规避:Skill/清单 99–499 先行。
E01 — import 失败¶
验证:PYTHONPATH、工作目录。应急:README 逐步;→ sym_run_fail
E02 — LLM 超时¶
验证:规则路径是否独立可用。应急:enable_llm:false 先验收工程交付。
P02 — RAG 胡说¶
验证:黄金问答集通过率。规避:发布前周回归。
P03 — Agent 死循环¶
验证:max_steps、日志循环模式。应急:强制终止并降 temperature。
L02 — 数学焦虑¶
现象:看到 loss/梯度就停,与目标岗 JD 脱节。根因:把「算法岗」与「LLM 应用岗」混为一谈。规避:只读 MLOps 价值 中「部署/评测/成本」章节。日常:面试若问推导,答「我负责应用层闭环与可观测,训练由平台团队」并转 sql_audit 案例。应急:本周不新开数学课,改写 1 条评测用例。
L03 — 工具换太勤¶
现象:每周换框架,无稳定交付。根因:FOMO + 无替换理由文档。规避:锁定 默认工具栈(FastAPI + 规则引擎 + 可选 LangGraph)。验证:新工具是否让 M30 提前 ≥1 周?否则拒绝。应急:回滚到上一可复现 tag,删未合并实验分支。
J03 — 算法关挂¶
现象:笔试/手撕挂,项目却强。根因:Top3 未含算法、与 Agent 抢同一晚间时段。规避:scene_algo 与 H2 并行 — 早晨 1 题,晚上 sqlboy。日常:LeetCode 中等 + 广告业务变种(区间/哈希)。应急:面试前 72h 只刷公司标签 Top10,暂停新 feature。
B02 — 维护崩¶
现象:副业产品需求爆炸、无人付费却天天改。根因:72h MVP 未做功能冻结。规避:上架清单 ≤5 条;非核心功能 下架 而非堆叠。日常:每周二固定「维护窗」2h,其余只写 Skill 文档。应急:公告暂停新功能,只修 P0 崩溃。
B03 — 与求职抢时间¶
现象:同周既冲刺投递又首发副业大版本。根因:双 主战役。规避:周一日历标注「本周主:求职|副业|学习」其一。验证:§6.2 表 P0+sqlboy 是否超上限。应急:副业推迟 2 周,保 M30/M60 检查点。
E03 — 规则误报多¶
现象:审计报告满屏红,业务方不信。根因:规则未版本化、无黄金 SQL 样例集。规避:每条规则绑定 rule_id + 最小复现 SQL;CI 对样例集跑回归。日常:误报率 >30% 则降级规则集,先保 零漏报高危项。应急:发布 rules/v0-safe 子集,LLM 仅作解释不作判决。
P01 — 用户不信结果¶
现象:「黑盒 AI」质疑。根因:无可解释输出。规避:报告模板固定字段:规则 ID、命中片段、严重级别、建议动作。日常:提供「人工复核模式」开关。应急:关 LLM,只输出规则命中 JSON,附文档链接。
日常节奏(建议)
| 频率 | 动作 |
|---|---|
| 日 | Top3:算法 / 面试 / sqlboy 其一为主 |
| 周 | 交付可复现(README 逐步验收);内容 1 篇可选 |
| 月 | M30/M60/M90 里程碑 勾选 |
| 季 | 作品集录屏;规则包版本发布 |
6. 成本与节奏¶
6.1 Token 与 API(填数)¶
| 输入 | 你的值 | 备注 |
|---|---|---|
| 日开发调用次数 | 调试用 | |
| 月均 API 预算 ¥ | ||
| 默认模型 | gpt-4o-mini 等 | sql_audit 可选 |
| 生产是否必须 LLM | 否(规则先行) |
| 变量 | 敏感度 |
|---|---|
| 日调用次数 | 开发调试主导;上线后应骤降 |
| 月均预算 | 超支则强制本地/Ollama |
| 默认模型 | mini 类适合审计解释 |
6.2 时间 / 精力(填数)¶
| 桶 | 小时/周 | 上限建议 |
|---|---|---|
| P0 求职(Binance 等) | 与总纲一致 | |
| sqlboy2ai 项目 | ≤10–14h | |
| 算法 | 与面试窗对齐 | |
| DDIA / 数仓复习 | 面试向 |
| 桶 | 敏感度 |
|---|---|
| P0 求职 | 超 4h/日易挤压项目交付 |
| sqlboy | >14h/周常导致 sym_scope_creep |
6.3 里程碑¶
| 里程碑 | 交付检查(非「做完界面」) | 验收 |
|---|---|---|
| M30 | sql_audit CLI+HTTP;规则路径无 key | README 逐步可复现 |
| M60 | + 复盘 Agent 或 RAG 其一 | 3min 录屏可讲清价值 |
| M90 | 三件套叙事 + 1 份评测集 | 模拟面试 90s 流畅 |
→ 6 个月双轨
6.4 人力 TCO(口述)¶
转型 TCO ≈ 学习时间(机会成本)+ API 费用 + 副业工具订阅
一鱼两吃:proj_sql_audit 同时服务作品集与 Skill
双轨冲突:用 §6.2 表仲裁,每周一个主战役
变量含义
| 变量 | 含义 | 敏感度 |
|---|---|---|
| 学习时间 | 下班/周末投入 sqlboy+算法 | 超 14h/周 → 质量下降、家庭冲突 |
| API 费用 | 开发调试 + 可选生产 LLM | 规则先行可压至近零 |
| 工具订阅 | 向量库/托管/域名 | 副业未首单前尽量用本地栈 |
| 机会成本 | 暂缓的其他收入/深造 | 求职窗内通常可接受 |
双轨时间块冲突处理
- 周日填 §6.2 表,标下周 主战役(求职|副业|学习)。
- 若 P0 面试密集 → sqlboy 仅保 M30 维护,副业冻结 feature。
- 若副业首单验证周 → 求职投递减至维护量,不新开 RAG。
- 算法与 sqlboy 分时段(晨/晚),禁止同晚 3h 混刷。
M90 交付检查清单(面试口述用)
- sql_audit:他人按 README 得到 JSON
- 第二项目:复盘或 RAG 有录屏
- 评测集:≥10 条黄金用例有通过率记录
- 90s:广告+数据+Agent 标签一致
- 无「只能在我电脑上跑」依赖
7. 自信拆解练习¶
| # | 现象(自测) | 提示 |
|---|---|---|
| T1 | sql_audit curl 无响应 | H5 E01 |
| T2 | 你和算法岗差异 | H0 J01 |
| T3 | 教练+审计+CTR 同时做 | sym_scope_creep |
| T4 | RAG 无引用 | P02 |
| T5 | Flink 经验怎么用 | path_data_bridge |
| T6 | 副业通用助手 | B01 |
| T7 | Checkpoint 懂 Agent 不懂 | path_agent |
| T8 | 30 天要入职无作品集 | scene_portfolio_90d |
| T9 | MCP vs FC | path_mcp |
| T10 | 精力不够还开新课 | L01 |
T1 参考答案
卡点:交付失败 → H5 → proj_sql_audit → PYTHONPATH/8765 → `curl` 有 JSON → README + `enable_llm:false`。T2 参考答案
数据+AI 应用:硬栈 [path_data_bridge](#path-data-bridge) + 审计 [proj_sql_audit](#proj-sql-audit),非纯算法训练岗。T3 参考答案
**H6** sym_scope_creep → 砍 CTR/教练 → 只留 sql_audit 至 M30 → 对照 [ops_m30](#63-里程碑)。T4 参考答案
**H4** path_rag P02 → 建黄金问答集 → 周回归 → 无引用则关自动生成。T5 参考答案
**H3** path_data_bridge → 讲分区/对账如何变成审计规则 → 链 [DDIA 卷一](../data-engineering/ddia-master-mindmap.md)。T6 参考答案
**B01** → 垂直 SQL 审计 Skill,非通用助手。T7 参考答案
**H3** path_agent:Plan-Tool-Observe;对比 Flink checkpoint 是状态快照,Agent 是任务编排。T8 参考答案
聚焦 M30:仅 sql_audit 闭合;勿新开 CTR/教练大坑。→ [scene_portfolio_90d](#scene-portfolio-90d)T9 参考答案
**path_mcp**:跨应用工具协议;Function Calling 是单模型 API 能力 — [术语速查](#术语速查-mcp)。T10 参考答案
**L01** → 停新课 → 本周只交付 sql_audit 一个增量。对接 → 知识点出题 · 转型拆 6 层
使用建议
- 卡住 → §0,不翻整库 apr3。
- 选项目 → §3,不增第 4 大项目。
- 每周 2 题 §7。
- 数据优势 → DDIA 卷一。
8. 节点 ID 表 + 分区简图(与 Canvas 同步)¶
节点主表¶
| id | layer | label | mdAnchor | 百科 |
|---|---|---|---|---|
| goal_job | H0 | 求职 | #goal_job | A |
| goal_side | H0 | 副业 | #goal_side | A |
| goal_brand | H0 | 品牌 | #goal_brand | A |
| goal_energy | H0 | 精力 | #goal_energy | A |
| scene_offer | H1 | 拿 offer | #scene-offer | A |
| scene_portfolio_90d | H1 | 90天作品集 | #scene-portfolio-90d | A |
| scene_sql_audit | H1 | SQL审计 | #scene-sql-audit | A |
| scene_ad_review | H1 | 广告复盘 | #scene-ad-review | A |
| scene_rag | H1 | 广告RAG | #scene-rag | A |
| scene_coach | H1 | 转型教练 | #scene-coach | A |
| scene_dual | H1 | 双轨 | #scene-dual | A |
| scene_algo | H1 | 面试算法 | #scene-algo | A |
| proj_sql_audit | H2 | sql_audit | #proj-sql-audit | A |
| proj_ad_review | H2 | 复盘 | #proj-ad-review-card | A |
| proj_coach | H2 | 教练 | #proj-coach-card | A |
| proj_rag | H2 | RAG | #proj-rag-card | A |
| proj_ctr | H2 | CTR参考 | §3 表 | A |
| path_agent | H3 | Agent | #path-agent | A |
| path_mcp | H3 | MCP | #path-mcp | A |
| path_data_bridge | H3 | 数据衔接 | #path-data-bridge | A |
| path_rag | H4 | RAG路径 | #path-rag | A |
| stack_fastapi | H5 | FastAPI | #h4-h5-工具栈 | A |
| stack_langgraph | H3 | LangGraph | #h4-h5-工具栈 | A |
| ops_m30 | H6 | M30 | #63-里程碑 | A |
| ops_cost | H6 | 成本 | #6-成本与节奏 | A |
| sym_run_fail | H7 | 交付失败 | #sym_run_fail-交付跑不通 | A |
| sym_no_project | H7 | 不知项目 | #sym_no_project-不知做哪项目 | A |
| sym_interview_gap | H7 | 面试不清 | #sym_interview_gap-面试讲不清 | A |
| sym_no_revenue | H7 | 零收入 | #sym_no_revenue-副业零收入 | A |
| sym_scope_creep | H7 | 蔓延 | #sym_scope_creep-范围蔓延 | A |
| sym_learning_overload | H7 | 贪全 | #sym_learning_overload-学不动贪全 | A |
分区简图(H 层)
H0 goal_* → H1 scene_* → H2 proj_* → H3–H5 path_* / stack_*
↘
H6 ops_* ← 交付检查点 H7 sym_* 横切 §0 §5
Canvas 同步字段:NODES[].id = 上表 id;mdAnchor 优先用显式 {#锚点};场景筛选 portfolio 对应 scene_portfolio_90d 交付链。
卡点 → Canvas 高亮(SYMPTOM_HIGHLIGHT)
| symptomId | highlightNodes |
|---|---|
| sym_run_fail | sym_run_fail, proj_sql_audit, stack_fastapi, path_agent |
| sym_no_project | sym_no_project, proj_sql_audit, proj_ad_review, scene_offer |
| sym_interview_gap | sym_interview_gap, goal_brand, goal_job, proj_sql_audit, path_data_bridge |
| sym_no_revenue | sym_no_revenue, goal_side, proj_sql_audit, proj_coach |
| sym_scope_creep | sym_scope_creep, scene_dual, ops_m30, goal_energy |
| sym_learning_overload | sym_learning_overload, path_rag, path_agent, stack_langgraph |
附录 A · 节点百科¶
goal_job
**是什么**:求职主目标。**为何**:窗口期驱动优先级。**机制**:作品集+叙事。**坑**:副业抢时间。**指标**:投递/面试转化。**深读**:§1goal_side
**是什么**:副业收入。**机制**:Skill 先于平台。**坑**:卖通用助手。**深读**:[Agent 递进](../../../apr3/sqlboy2ai/Agent、Skill、SaaS副业递进路径.md)goal_brand
**是什么**:垂直品牌。**机制**:统一标签。**坑**:叙事不一致。**深读**:[个人定位](../../../apr3/sqlboy2ai/个人定位与差异化叙事.md)goal_energy
**是什么**:每日精力分配。**坑**:双主战役。**深读**:§6.2scene_portfolio_90d
**是什么**:90 天作品集闭合。**机制**:M30/M60/M90 检查点。**坑**:强依赖 LLM。**深读**:[scene-portfolio-90d](#scene-portfolio-90d)proj_sql_audit
**是什么**:SQL 审计能力证明。**机制**:规则+HTTP+可选 LLM。**指标**:curl JSON、规则 ID。**深读**:[proj-sql-audit](#proj-sql-audit)path_agent
**是什么**:Agent 工作流路径。**机制**:Plan-Tool-Observe。**信号**:死循环、成本。**深读**:[path-agent](#path-agent)path_data_bridge
**是什么**:数据工程→AI 叙事桥。**机制**:分区/对账→审计规则。**深读**:[DDIA 卷一](../data-engineering/ddia-master-mindmap.md)sym_run_fail
**是什么**:交付跑不通。**机制**:环境/路径/端口。**应急**:README、`enable_llm:false`。**深读**:[sym_run_fail](#sym_run_fail-交付跑不通)ops_m30
**是什么**:首里程碑。**验收**:sql_audit 可复现。**深读**:[#63-里程碑](#63-里程碑)scene_offer
**是什么**:拿 offer 场景。**产出**:三件套+90s。**坑**:项目散。**深读**:[scene-offer](#scene-offer)scene_sql_audit
**是什么**:审计交付场景。**机制**:规则引擎。**副业**:Skill 优先。**深读**:[scene-sql-audit](#scene-sql-audit)scene_ad_review
**是什么**:投放复盘。**机制**:指标+Agent。**深读**:[scene-ad-review](#scene-ad-review)scene_rag
**是什么**:广告知识库。**机制**:RAG+评测。**深读**:[scene-rag](#scene-rag)scene_coach
**是什么**:转型教练。**机制**:内容/咨询。**坑**:抢 M30。**深读**:[scene-coach](#scene-coach)scene_dual
**是什么**:6–12 月双轨。**机制**:岗位+副业里程碑。**深读**:[scene-dual](#scene-dual)scene_algo
**是什么**:算法面试。**机制**:与项目并行。**深读**:[scene-algo](#scene-algo)proj_ad_review
**是什么**:复盘 Agent 项目。**求职**:广告智能化。**深读**:[proj-ad-review-card](#proj-ad-review-card)proj_coach
**是什么**:教练 Agent。**副业**:内容。**深读**:[proj-coach-card](#proj-coach-card)proj_rag
**是什么**:广告 RAG 项目。**机制**:向量检索+生成。**深读**:[proj-rag-card](#proj-rag-card)proj_ctr
**是什么**:CTR 预测参考项。**定位**:经典 ML,弱副业,非 M30 必做。path_rag
**是什么**:RAG 技术路径。**信号**:幻觉、召回空。**深读**:[path-rag](#path-rag)path_mcp
**是什么**:MCP 工具层。**坑**:权限过大。**深读**:[path-mcp](#path-mcp)stack_fastapi
**是什么**:H5 HTTP 服务栈。**机制**:sql_audit 8765。**深读**:[#h4-h5-工具栈](#h4-h5-工具栈)stack_langgraph
**是什么**:Agent 编排框架。**坑**:工具换太勤。**深读**:知识补齐清单ops_cost
**是什么**:Token 与时间成本。**机制**:API 预算+周小时。**深读**:§6sym_no_project
**是什么**:不知做哪项目。**应急**:§3 优先级+本周主战役。**深读**:[sym_no_project](#sym_no_project-不知做哪项目)sym_interview_gap
**是什么**:面试讲不清。**应急**:30s/90s 排练。**深读**:[sym_interview_gap](#sym_interview_gap-面试讲不清)sym_no_revenue
**是什么**:副业零收入。**应急**:卖 Skill。**深读**:[sym_no_revenue](#sym_no_revenue-副业零收入)sym_scope_creep
**是什么**:范围蔓延。**应急**:对齐 M30–M90。**深读**:[sym_scope_creep](#sym_scope_creep-范围蔓延)sym_learning_overload
**是什么**:学不动贪全。**应急**:项目驱动砍课。**深读**:[sym_learning_overload](#sym_learning_overload-学不动贪全)proj_ctr
**是什么**:CTR 预测参考项。**为何**:经典 ML 叙事补充。**机制**:特征+离线 AUC。**坑**:抢 M30。**指标**:leakage 可口述。**深读**:[proj-ctr-card](#proj-ctr-card)附录 A 说明:与 §8 全部 id 一一对应;机制长文见 §2–§4,此处为 5 分钟速查卡。
9. 源文档地图(apr3/sqlboy2ai)¶
| 你先遇到… | 读这篇 |
|---|---|
| 刚开始转型 | README → 实施手册 |
| 本地验证 sql_audit | sql_audit_mvp |
| 副业变现 | Agent、Skill、SaaS 递进 |
| 选岗路径 | learning-paths/05-LLM应用工程师 |
| 工具栈锁定 | 知识补齐与默认工具栈 |
| MCP 实践 | mcp.md |
| 作品集组合 | 作品集组合与优先级 |
阅读顺序建议(首次)
- 本卷一 §0 → 定本周卡点
- §3 → 锁
proj_sql_audit - apr3 README → sql_audit README 逐步验收
- §4
path_data_bridge+ DDIA 卷一对照叙事 - §6 填数 → §7 每周 2 题自测
与 DDIA / 数据工程衔接¶
| 优势 | 脑图 | 链接 |
|---|---|---|
| 批流、对账 | path_data_bridge | DDIA 卷一 |
| SQL 规则 | proj_sql_audit | 双指针 |
QA 疑问解答¶
体例、锚点、与 DDIA 衔接、id 迁移 — 面试前可速扫。
Q1:卷一与 apr3 分工?
A1:本页 = 架构全书与索引;apr3 = 实施细节与代码 README。
Q2:为何去掉 Demo 说法?
A2:求职要 可验证交付(规则+评测+叙事),不是玩具界面;M30/M60/M90 是检查点名称。
Q3:scene_m90 去哪了?
A3:改为 scene_portfolio_90d;旧锚点 #scene_m90 仍可用(span 别名)。
Q4:#path-agent 跳不准?
A4:确认 attr_list 已启用;硬刷新;或用 #path_agent。
Q5:从 DDIA 卷一切过来如何读?
A5:先 #path-data-bridge 建立叙事桥,再 #proj-sql-audit 做 M30;体例与 DDIA 卷一一致(§0/附录/Markmap)。
Q6:Canvas 症状高亮对不上?
A6:2026-06 起用 sym_run_fail、scene_portfolio_90d;场景筛选用「90天作品集」非旧 Demo 筛选项。
Q7:M30/M60/M90 还是 Demo 吗?
A7:否 — 仅为 交付检查点 id(ops_m30 等),文案已全部改为可复现/录屏/评测验收。
Q8:何时先 Agent 何时先 RAG?
A8:见 §4「Agent vs RAG 选型」拓扑;M30 必须先闭合规则审计,再叠 RAG/Agent。
Q9:附录 A 与 §2–§4 重复吗?
A9:附录是 §8 各 id 的 5 分钟卡;机制长文只在 §2–§4 展开一次,避免双份教程。
待沉淀¶
- M30 录屏脚本链到 sql_audit
- 复盘 Agent 与 DDIA 实时章节对照表
- 副业首单复盘写入 §5 B01