Project Vibrant

AI 驱动的软件开发“空中交管系统”

设计哲学：交管系统

Vibrant 不是一个 IDE，而是一个控制平面 (Control Plane)。

编排，而非执行

人类只需提出方向，顶层的 Gatekeeper (守门人) 进行工程拆解。而执行阶段，被统筹分配给庞大的、随时抛弃的底层智能体子进程舰队去完成。

单体 Agent 的诅咒

为什么现存的所有 AI 编程助手最终都会陷入泥沼？

单体大模型智能体在持续运行约 1 小时后，不可避免地会遭遇上下文越界、记忆污染与严重的智力降级。

架构哲学 (一)：一切皆 Agent

将系统核心从“执行者”退格为“管弦乐指挥”。

隔离的物理子进程

Vibrant 的核心系统从不亲自动手。所有非平凡操作 —— 无论是起草代码、跑单元测试、解决 Git 合并冲突还是端到端验证 —— 全部被封装并委派给新孵化的短生命周期独立 Agent 进程来完成。

架构哲学 (二)：共识作为绝对契约

如何让一群随时失忆的 Agent 形成合力？

Consensus Pool

这是一份具有版本控制的 Markdown 文档，记录了任务的背景大纲、架构决策与目标。Gatekeeper (守门人) 是该池的唯一写入者。没有任何一个 Agent 允许偏离共识的内容。

架构哲学 (三)：即时上下文

抵制“把整个代码库全塞给大模型”的粗暴冲动。

JIT Context

为保证每一次 Agent 执行的智力纯净度，系统只会针对当前被拆解的具体任务，精准摘取对应的“技能 (Skills)”文件与小范围源码。在 Agent 孵化时做到即时、极简的上下文注入。

架构哲学 (四)：恰到好处的人环路

将人类程序员从“打字机”和“审核员”的位置上解放。

Human-in-the-loop, Not in the way

普通的代码报错、环境错误完全由 Agent 流水线自我消化。人类绝不应当被叫去解决实现细节，系统只在面临无法逾越的架构级或产品方向级抉择时，才会鸣响终端要求人类干预。

高层架构：抽象适配层

将世界顶级的异构模型，变成标准流水线的积木。

Unified Provider Abstraction

我们在底层建立了一套极高抽象度的 Provider 协议。无论是 Codex App Server 还是 Claude Code，它们底层的特殊通信，在此处都被抹平、并被转化为绝对统一的 CanonicalEventEnvelope 标准生命周期事件流，交由 Orchestrator 消费。

高层架构：MCP 驱动的控制面板

给 Gatekeeper 赋予“开火权”。

Model Context Protocol 深度集成

普通 AI 只能处理文本。但我们将系统底层的核心能力 —— “孵化 Sub-agent”、“修改任务”、“阻塞工作流等待人类指令” —— 全部包装成了 MCP Server Tools。Gatekeeper 现在可以像一位真正的长官，通过强类型的系统工具来操纵项目状态。

高层架构：严格的读写分离与状态控制

不要试图从 AI 的闲聊中提取项目状态。

Interface Control Plane

在 Vibrant 的 Orchestrator 核心设计中：工作流状态才是绝对权威。我们彻底抛弃了“用正则解析大模型闲聊文本来做决策”的脆弱做法。Gatekeeper 的所有决策和状态修改，必须通过强制且确定的接口协议下发。

底层设计：物理沙箱隔离

让多个 Agent 并发而不翻车。

WorkspaceService

当编排器决定起草一段代码时，它不会让 Agent 直接修改项目源码。相反，它会开辟一个纯净的 深拷贝 Git Worktree 工作区。

每个任务的试图都在绝对隔离的沙盒中进行（甚至可以强制套上 Read-only 策略），直到 Gatekeeper 全盘验证通过才会 Merge 回主干。

踩坑经验

疯狂的工程效率

仅仅 7 天的自主开发...

300 个 Commits
+100,000 行
-60,000 行

AI 带来的效率是疯狂的，同时烧掉了我们 ~$500 USD 的 token.

Github Commits showing huge productivity

狂暴的副作用：失控的 Git 树

并发构建的狂欢与随之而来的混乱。

Tangled Git Tree due to concurrent workspaces

缠成一团的 Worktree

每一个任务都在独立的深拷贝 Git Worktree 中肆意生长。如果缺乏严苛的管理，分支合并图谱将瞬间演变成毫无可读性的线团。

踩坑经验：AI 的小聪明

代码命名的灾难。

模糊与短视

绝不能盲目相信 AI 的命名品味。遇到稍微复杂的工程架构，如果不提前注入词汇表共识，AI 一定会造出极为相似、模棱两可引发歧义的内部接口名称。

踩坑经验：暴栈与兼容层怪圈

日产万行代码带来的并发并发症。

堆砌带来的崩塌

遇到接口不匹配或逻辑冲突时，大模型的本能反应从来都不是“推翻重构”，而是叠床架屋地继续加 “兼容层”。极速的原型推进背后，往往掩埋着巨大的“架构债务”。

踩坑经验：测试悖论

AI 单元测试的死循环谜题。

千万不要只信 AI 的 Test

如果它自己生成的测试跑过了，很大可能是测试用例极其薄弱；如果这个测试跑挂了，往往它连测试代码本身都写错了。

要打破这个闭环只能引入严苛的端到端（E2E）验证 Agent。

踩坑经验：设计审美塌方

强大的推理模型 ≠ 优秀的设计师。

自带廉价的 UI 基因

如果不施加硬性的像素级质检，AI 生成的 Web 前端默认极差：滥用的软渐变色、巨大的违和圆角以及没完没了的浮动毛玻璃。

想要高级感？必须用极强烈的审美约束和常量模板彻底锁死它的排版自由权。

开发账本：能力与成本的魔鬼三角

Vibe Coding 依然是一件极为奢侈的事。

多Agent编杠杆

+20% 上限 / +300% 消耗
复杂的多 Agent 架构能够确信抬高系统天花板约 20%，但由于上下文在节点间反复传递，Token 的燃烧速度是单体流的 300% 甚至更高。

算力的瓶颈

$200/月的资源仅勉强可用
在全职、高强度的自主构建工作流中，即便开通了最顶配的千元级别 Pro 平台调用额度，也会很快碰触到计费墙与速率限制。

最后的底线

我们不缺生成代码的机器，缺的是安全感。

无论自动化架构做到多完美，
永远不要把主分支的合并权限无监控地扔给 AI。

Q & A

感谢聆听。