Capabilities › Quant v1.1 › 工程协作框架

证明 · 能力 03 · 人主导的多 Agent 开发

我们如何用 AI 开发 AI 系统，而不让 AI 失控

多个 Agent 可以建议、起草、实现，但最终方向和高风险授权永远在人手上。这不是口号——这是我们在自己的工程实践里强制执行的纪律。

2026 年了，“用 LLM 写代码”已经不是难题。难题是当这些代码、配置、运行时变更要进入真正的生产环境时——谁负责？谁批准？怎么追溯？什么时候必须停下来等人？这一层工程框架就是为回答这些问题而存在的。

层框架

5+1

Agent 角色 + 人类审批者

强制暂停点

最终权威

本页证明

AI 可以加速研发，但最终方向、高风险授权、生产部署永远在人手上。

为什么这一页对应能力 03

“人主导的多 Agent 开发”作为 yunforce 的核心能力之一，需要在真实压力下被验证——不是在一两个 demo 任务里，而是在一个跨越多个月、涉及高风险变更、需要长期工程纪律的项目里。Quant v1.1 是我们实施这套方法的场地。

这一页讲的是这套方法的完整机制：它如何分配角色、设定边界、强制暂停、保留证据，让多个 AI Agent 协同工作而不失控。

关于“AI 开发 AI”，客户最常问的三个问题

我们直接回应。

你们用 AI 开发，会不会失控？

不会。最终方向、高风险授权、生产部署都由人类审批。Agent 可以建议和起草，但不能自己决定推进。三个关键节点（规格、计划、实现）上，系统强制暂停等待人工批准。

多个 Agent 一起工作，会不会互相乱改？

不会。每个 Agent 有明确的角色边界：产品 Agent 只能审查、不能实现；开发 Agent 只能改代码、不能部署；运维 Agent 只能在已批准的范围内执行；研究 Agent 只读，不写入正式系统。跨边界的动作需要明确委派。

AI 做的事情出了问题，谁负责？谁来回溯？

最终责任人始终是人类审批者——因为是他们批准了变更。回溯靠的是证据：每一次 Agent 的建议、计划、实现、部署，都通过 GitHub 议题、commit、审查文档、关闭评论留下完整可审计的轨迹。

真正的问题，不是 AI 能不能产出

我们使用多个 Agent，但目标不是最大化自主性。

目标是一个许多贡献者都能帮忙的系统，而不侵蚀问责、执行纪律或可审计性——一旦工作变得真正运营化。

许多 Agent 可以贡献。只有人类能批准最终方向。

组织不能比软件更不守纪律

Quant v1.1 在运行时已经分离了建议、审批、执行和证据。这个项目的团队运营方法刻意采用了相同的形状——这样组织就不会比软件更不守纪律。

产品运行时

-顾问 / 研究对象 → 治理对象可以建议，但不执行
-人类审批 → 决定是否授予权限
-执行系统 → 仍是唯一执行权威
-证据与验证 → 每一个有意义的动作都以证据闭合

团队运营系统

-Agent 建议和构建 → 在定义的角色边界内贡献
-人类批准 → 直接授权保持在人手上
-开发 / 运维执行 → 实现和变更只通过被分配的执行角色发生
-证据闭合 → GitHub 评论、审查文档、测试结果闭合循环

关键设计选择：审批门、执行边界、证据轨迹不只是产品特性。它们也是团队运营规则。

运营模型被分成四个独立的控制层

角色框架

产品框定和审查，开发实现，运维执行运行时跟进，副驾驶路由，研究保持只读，人类最终决策人保留最终权威。

授权框架

高影响变更需要直接授权：生产系统重启、外部接口写入、配置切换、治理覆盖、凭证、生产状态声明。

执行框架

工作通过一条可重复路径流动：议题、规格确认、实现计划、产品审查、实现、实现后审查、授权门、验证、证据闭合。

恢复框架

恢复是系统设计的一部分。在压力下应用相同纪律：保留证据、陈述失败、定义回滚路径、保持权威边界可见。

深度案例细节 · Deep Case Detail · 完整机制详解

上面已经展示了核心机制（四层框架、三个暂停点、最终权威、三个客户问题）。下面进入完整角色拆解和执行路径——属于深度内容，不必读完。

不同的 Agent 服务于不同的任务，而不是可互换的声音

人类最终决策人

方向、委派、授权边界的最终决策拥有生产 go / no-go 决策

不把最终批准权委派出去

产品 Agent

塑造议题、规格、验收逻辑、推广边界对照风险和范围审查实现

不应成为默认实现者

开发 Agent

起草实现计划和测试计划修改代码、测试和技术文档

不为了通过绿色检查而削弱测试，也不部署

运维 Agent

拥有运行时连续性、服务器支持、监控、证据收集在运行手册和授权边界内执行

不把转达的批准当作变更许可

副驾驶 Agent

协调和转达；它是路由层，不是内容层保留项目方法和明确的交接

不成为隐藏的第二审批者

研究 Agent

只读研究和分析为产品审查产出发现

不实现代码，不触碰正式系统路径

仓库边界：本地 Agent 默认只在自己的主仓库内编辑和提交。跨仓库编辑需要明确的人类委派。

工作路径刻意比“问一下 Agent”更重

工作流系统和审查流程为工作强制了一个共享形状。这让计划、实现、审查、运行时授权保持分离，而不是塌缩进单一对话。

议题与范围

工作从一个明确的议题开始，带有问题、动作、验收、测试契约。

产品确认规格

在开发计划任何东西之前，产品检查这个切片是真的、有边界、可实现的。

开发起草计划和测试

实现计划和验证计划一起起草，包括授权期望和回滚条件。

产品审查计划

产品批准、拒绝，或带发现循环直到计划可接受。

开发实现

代码、测试、技术文档在批准范围内变更，并带 Agent 归属推送。

产品实现后审查

对照批准的计划、真实文件、实际测试 / 证据界面审查实现。

授权与发布

如果需要运行时变更，产品和开发就验证计划对齐，然后由人类最终决策人授权动作。

证据闭合

审查文档、议题评论、日志、测试输出、关闭评论保存了什么改变了、为什么完成了。

三个强制暂停点

规格缺口 — 切片还没准备好；产品必须澄清或缩小它才能让开发计划

计划批准 — 计划可接受、实现可以开始，但批准本身是明确的

实现批准 — 代码可接受；如果需要部署，下一步是授权，而不是静默执行

工作流由边界定义，而不是由某个模型厂商定义

LLM 厂商会变，模型 API 会变，账户会被限制。一个真正的工程框架不应该绑死在任何特定供应商身上。这是我们专门为“压力情景”做的三个设计。

角色名高于模型名

仓库标签是角色名优先，供应商名其次。这让运营层比当前模型分配更稳定。

工作流逻辑外部化

中继协议、暂停点、工作流系统活在文档和脚本里，而不是在某一个模型的记忆里。这让路径可复现。

模型失败变成换装问题

如果一个角色能在保持相同范围、证据、权威契约的前提下被重新映射，系统在供应商或账户压力下会更优雅地降级。

两个方法论，两个层面，各自独立

yunforce 对外有一个 PROOF 方法论，讲我们如何为客户交付 AI 项目。本页讲的工程协作框架不是同一回事——它是这个特定自研项目内部使用的工程协作机制。

PROOF 方法论 → 对外，跨项目，关于“我们如何与客户共同推进一个 AI 落地”

工程协作框架 → 内部，单项目，关于“一个多 Agent 团队如何在不失控的前提下推进高风险工程变更”

两者解决不同的问题，互相不替代。把它们都展示出来，是因为我们认为客户值得看到——一家声称“懂 AI”的公司，是怎么在自己的工程实践里管住 AI 的。

← 回到 Quant v1.1 主页查看 PROOF 方法论 →