1 / 1

Project Vibrant

AI 驱动的软件开发“空中交管系统”

设计哲学:交管系统

Vibrant 不是一个 IDE,而是一个控制平面 (Control Plane)。

编排,而非执行

人类只需提出方向,顶层的 Gatekeeper (守门人) 进行工程拆解。而执行阶段,被统筹分配给庞大的、随时抛弃的底层智能体子进程舰队去完成。

单体 Agent 的诅咒

为什么现存的所有 AI 编程助手最终都会陷入泥沼?

单体大模型智能体在持续运行约 1 小时后,不可避免地会遭遇上下文越界、记忆污染与严重的智力降级。

架构哲学 (一):一切皆 Agent

将系统核心从“执行者”退格为“管弦乐指挥”。

隔离的物理子进程

Vibrant 的核心系统从不亲自动手。所有非平凡操作 —— 无论是起草代码、跑单元测试、解决 Git 合并冲突还是端到端验证 —— 全部被封装并委派给新孵化的短生命周期独立 Agent 进程来完成。

架构哲学 (二):共识作为绝对契约

如何让一群随时失忆的 Agent 形成合力?

Consensus Pool

这是一份具有版本控制的 Markdown 文档,记录了任务的背景大纲、架构决策与目标。Gatekeeper (守门人) 是该池的唯一写入者。没有任何一个 Agent 允许偏离共识的内容。

架构哲学 (三):即时上下文

抵制“把整个代码库全塞给大模型”的粗暴冲动。

JIT Context

为保证每一次 Agent 执行的智力纯净度,系统只会针对当前被拆解的具体任务,精准摘取对应的“技能 (Skills)”文件与小范围源码。在 Agent 孵化时做到即时、极简的上下文注入。

架构哲学 (四):恰到好处的人环路

将人类程序员从“打字机”和“审核员”的位置上解放。

Human-in-the-loop, Not in the way

普通的代码报错、环境错误完全由 Agent 流水线自我消化。人类绝不应当被叫去解决实现细节,系统只在面临无法逾越的架构级或产品方向级抉择时,才会鸣响终端要求人类干预。

高层架构:抽象适配层

将世界顶级的异构模型,变成标准流水线的积木。

Unified Provider Abstraction

我们在底层建立了一套极高抽象度的 Provider 协议。无论是 Codex App Server 还是 Claude Code,它们底层的特殊通信,在此处都被抹平、并被转化为绝对统一的 CanonicalEventEnvelope 标准生命周期事件流,交由 Orchestrator 消费。

高层架构:MCP 驱动的控制面板

给 Gatekeeper 赋予“开火权”。

Model Context Protocol 深度集成

普通 AI 只能处理文本。但我们将系统底层的核心能力 —— “孵化 Sub-agent”、“修改任务”、“阻塞工作流等待人类指令” —— 全部包装成了 MCP Server Tools。Gatekeeper 现在可以像一位真正的长官,通过强类型的系统工具来操纵项目状态。

高层架构:严格的读写分离与状态控制

不要试图从 AI 的闲聊中提取项目状态。

Interface Control Plane

在 Vibrant 的 Orchestrator 核心设计中:工作流状态才是绝对权威。我们彻底抛弃了“用正则解析大模型闲聊文本来做决策”的脆弱做法。Gatekeeper 的所有决策和状态修改,必须通过强制且确定的接口协议下发。

底层设计:物理沙箱隔离

让多个 Agent 并发而不翻车。

WorkspaceService

当编排器决定起草一段代码时,它不会让 Agent 直接修改项目源码。相反,它会开辟一个纯净的 深拷贝 Git Worktree 工作区

每个任务的试图都在绝对隔离的沙盒中进行(甚至可以强制套上 Read-only 策略),直到 Gatekeeper 全盘验证通过才会 Merge 回主干。

踩坑经验

疯狂的工程效率

仅仅 7 天 的自主开发...

300 个 Commits
+100,000
-60,000

AI 带来的效率是疯狂的,同时烧掉了我们 ~$500 USD 的 token.

Github Commits showing huge productivity

狂暴的副作用:失控的 Git 树

并发构建的狂欢与随之而来的混乱。

Tangled Git Tree due to concurrent workspaces

缠成一团的 Worktree

每一个任务都在独立的深拷贝 Git Worktree 中肆意生长。如果缺乏严苛的管理,分支合并图谱将瞬间演变成毫无可读性的线团。

踩坑经验:AI 的小聪明

代码命名的灾难。

模糊与短视

绝不能盲目相信 AI 的命名品味。遇到稍微复杂的工程架构,如果不提前注入词汇表共识,AI 一定会造出极为相似、模棱两可引发歧义的内部接口名称。

踩坑经验:暴栈与兼容层怪圈

日产万行代码带来的并发并发症。

堆砌带来的崩塌

遇到接口不匹配或逻辑冲突时,大模型的本能反应从来都不是“推翻重构”,而是叠床架屋地继续加 “兼容层”。极速的原型推进背后,往往掩埋着巨大的“架构债务”。

踩坑经验:测试悖论

AI 单元测试的死循环谜题。

千万不要只信 AI 的 Test

如果它自己生成的测试跑过了,很大可能是测试用例极其薄弱;如果这个测试跑挂了,往往它连测试代码本身都写错了。

要打破这个闭环只能引入严苛的端到端(E2E)验证 Agent。

踩坑经验:设计审美塌方

强大的推理模型 ≠ 优秀的设计师。

自带廉价的 UI 基因

如果不施加硬性的像素级质检,AI 生成的 Web 前端默认极差:滥用的软渐变色、巨大的违和圆角以及没完没了的浮动毛玻璃。

想要高级感?必须用极强烈的审美约束和常量模板彻底锁死它的排版自由权。

开发账本:能力与成本的魔鬼三角

Vibe Coding 依然是一件极为奢侈的事。

多Agent编杠杆
+20% 上限 / +300% 消耗
复杂的多 Agent 架构能够确信抬高系统天花板约 20%,但由于上下文在节点间反复传递,Token 的燃烧速度是单体流的 300% 甚至更高。
算力的瓶颈
$200/月的资源仅勉强可用
在全职、高强度的自主构建工作流中,即便开通了最顶配的千元级别 Pro 平台调用额度,也会很快碰触到计费墙与速率限制。

最后的底线

我们不缺生成代码的机器,缺的是安全感。

无论自动化架构做到多完美,
永远不要把主分支的合并权限无监控地扔给 AI。

Q & A

感谢聆听。