06 — 数据层、AI、向量库与 RAG¶

前一专题为控制篇幅，对数据库与 AI 栈着墨较少。本章按官方产品文档补齐：关系型与外部数据库、Workers AI、Vectorize、AI Gateway，以及与 RAG 的关系。套餐、配额与定价以各自文档为准。

1. 数据存储总览（Workers 视角）¶

官方在 Workers platform — Storage options 中把常见选择串在一起，核心包括：

能力	角色（简述）	文档入口
D1	托管 serverless SQL，语义贴近 SQLite；适合用户/账户等结构化数据、读多写少 Web 工作负载	D1
Durable Objects	强一致协调 + SQLite 存储（与 D1 产品定位不同，官方文档有对比章节）	DO storage
KV	全球低延迟键值，终局一致性	KV
R2	对象存储，强调无典型云存储 Egress 计费模式	R2
Queues / Workflows	异步卸峰、长流程编排	Queues、Workflows

官方说明：若单库工作数据超过 10 GB，应考虑拆成多个更小的 D1 数据库（例如按用户/租户分片）。见 Storage options 中 D1 小节说明。

2. 连接「外部」数据库¶

Worker 并非只能使用 D1。官方 Connect to databases 列出：

D1：通过 Workers binding、HTTP API；可与 Prisma、Drizzle 等集成。
传统 Postgres/MySQL：推荐通过 Hyperdrive 加速全球访问（从边缘连区域库时的 latency 仍然是架构题）。
Supabase、MongoDB Atlas、PlanetScale 等 serverless/托管库也可按文档中的驱动与连接模式接入。

架构提示：边缘计算 + 单区域强一致数据库的组合，需要显式设计 缓存、连接池、读写路径、超时与回退；Hyperdrive 解决的是「加速查询」之一环，不是「魔法消解 CAP」。

3. Workers AI（边缘侧推理绑定）¶

Workers AI 提供一组托管的开源模型，用于文本生成、嵌入、图像等任务；通过 Wrangler 配置 ai binding（代码里常见 env.AI），在 Worker/Pages Functions 中调用 env.AI.run(...)。

入门：Get started — Workers + Wrangler
模型目录：Workers AI models
限制与计费：Limits、Pricing

TypeScript：配置 binding 后应运行 wrangler types 生成 Env（含 Ai 等类型）；与 AI Gateway 的 Worker binding 文档一致。

4. AI Gateway（观测、缓存、限流与多模型路由）¶

AI Gateway 用于在 AI 调用路径上增加可观测性、缓存、速率限制、重试、fallback 等。文档说明可将 Workers AI 与第三方模型统一到网关 URL / binding 调用路径（例如 env.AI.run 可走网关）。

与 Workers AI 的关系见 Workers AI 文档中的 Related products 小节。

5. Vectorize（向量数据库）¶

Vectorize 被官方描述为全球分布的向量数据库，用于：

存储来自任意嵌入模型的向量（Bring your own embeddings）；
与 RAG 结合，为 LLM 检索上下文；
按 metadata 过滤缩小召回范围。

官方入门教程：Vectorize + Workers AI 生成/查询文本嵌入（示例中通过 wrangler vectorize create ... 建立索引，并在 Wrangler 中配置 [[vectorize]] binding）。

与存储的组合：文档举例向量结果可关联 R2 中图像、KV 中文本、D1 中用户资料，在 Workers 平台内完成「向量命中 → 具体业务对象」的闭环（见 Vectorize 首页说明）。

6. AI Search（托管 RAG 产品线）¶

若希望更少自建流水线，官方还提供 AI Search：面向「托管 RAG」的产品叙述（含与 Vectorize、Workers AI 的边界）。AI Search 相关 limits/pricing 页中有基础设施迁移说明（例如 Vector 托管形态变化），上线前以该页日期与条款为准。

7. 典型模式小结¶

仅结构化业务数据：D1（或 DO SQLite）+ 必要时 Hyperdrive 连外部 RDBMS。
语义搜索 / 推荐：Vectorize +（自管或 Workers AI）嵌入；业务元数据在 D1/KV/R2。
对话/生成：Workers AI 或经 AI Gateway 调第三方模型；重任务可 Queues 异步。
合规与成本：推理与向量写入通常有单独计费与限额；需与 Workers 的请求/CPU 限额一并做预算。

上一篇：未来挑战与方向（可与本篇对照阅读：AI 与数据层加重了「配额与链路」复杂度）。

下一篇：横向对比：Java EE、Python 等。