跳转至

06 — 数据层、AI、向量库与 RAG

前一专题为控制篇幅,对数据库与 AI 栈着墨较少。本章按官方产品文档补齐:关系型与外部数据库、Workers AI、Vectorize、AI Gateway,以及与 RAG 的关系。套餐、配额与定价以各自文档为准。

1. 数据存储总览(Workers 视角)

官方在 Workers platform — Storage options 中把常见选择串在一起,核心包括:

能力 角色(简述) 文档入口
D1 托管 serverless SQL,语义贴近 SQLite;适合用户/账户等结构化数据、读多写少 Web 工作负载 D1
Durable Objects 强一致协调 + SQLite 存储(与 D1 产品定位不同,官方文档有对比章节) DO storage
KV 全球低延迟键值,终局一致性 KV
R2 对象存储,强调无典型云存储 Egress 计费模式 R2
Queues / Workflows 异步卸峰、长流程编排 QueuesWorkflows

官方说明:若单库工作数据超过 10 GB,应考虑拆成多个更小的 D1 数据库(例如按用户/租户分片)。见 Storage options 中 D1 小节说明。

2. 连接「外部」数据库

Worker 并非只能使用 D1。官方 Connect to databases 列出:

  • D1:通过 Workers binding、HTTP API;可与 PrismaDrizzle 等集成。
  • 传统 Postgres/MySQL:推荐通过 Hyperdrive 加速全球访问(从边缘连区域库时的 latency 仍然是架构题)。
  • Supabase、MongoDB Atlas、PlanetScale 等 serverless/托管库也可按文档中的驱动与连接模式接入。

架构提示:边缘计算 + 单区域强一致数据库的组合,需要显式设计 缓存、连接池、读写路径、超时与回退;Hyperdrive 解决的是「加速查询」之一环,不是「魔法消解 CAP」。

3. Workers AI(边缘侧推理绑定)

Workers AI 提供一组托管的开源模型,用于文本生成、嵌入、图像等任务;通过 Wrangler 配置 ai binding(代码里常见 env.AI),在 Worker/Pages Functions 中调用 env.AI.run(...)

TypeScript:配置 binding 后应运行 wrangler types 生成 Env(含 Ai 等类型);与 AI Gateway 的 Worker binding 文档一致。

4. AI Gateway(观测、缓存、限流与多模型路由)

AI Gateway 用于在 AI 调用路径上增加可观测性、缓存、速率限制、重试、fallback 等。文档说明可将 Workers AI第三方模型统一到网关 URL / binding 调用路径(例如 env.AI.run 可走网关)。

与 Workers AI 的关系见 Workers AI 文档中的 Related products 小节。

5. Vectorize(向量数据库)

Vectorize 被官方描述为全球分布的向量数据库,用于:

  • 存储来自任意嵌入模型的向量(Bring your own embeddings);
  • RAG 结合,为 LLM 检索上下文;
  • 按 metadata 过滤 缩小召回范围。

官方入门教程:Vectorize + Workers AI 生成/查询文本嵌入(示例中通过 wrangler vectorize create ... 建立索引,并在 Wrangler 中配置 [[vectorize]] binding)。

与存储的组合:文档举例向量结果可关联 R2 中图像、KV 中文本、D1 中用户资料,在 Workers 平台内完成「向量命中 → 具体业务对象」的闭环(见 Vectorize 首页说明)。

6. AI Search(托管 RAG 产品线)

若希望更少自建流水线,官方还提供 AI Search:面向「托管 RAG」的产品叙述(含与 Vectorize、Workers AI 的边界)。AI Search 相关 limits/pricing 页中有基础设施迁移说明(例如 Vector 托管形态变化),上线前以该页日期与条款为准。

7. 典型模式小结

  • 仅结构化业务数据:D1(或 DO SQLite)+ 必要时 Hyperdrive 连外部 RDBMS。
  • 语义搜索 / 推荐:Vectorize +(自管或 Workers AI)嵌入;业务元数据在 D1/KV/R2。
  • 对话/生成:Workers AI 或经 AI Gateway 调第三方模型;重任务可 Queues 异步。
  • 合规与成本:推理与向量写入通常有单独计费与限额;需与 Workers 的请求/CPU 限额一并做预算。

上一篇:未来挑战与方向(可与本篇对照阅读:AI 与数据层加重了「配额与链路」复杂度)。

下一篇:横向对比:Java EE、Python 等