Capabilities › Quant v1.1 › 工程协作框架

证明 · 能力 03 · 人主导的多 Agent 开发

我们如何用 AI 开发 AI 系统,而不让 AI 失控

多个 Agent 可以建议、起草、实现,但最终方向和高风险授权永远在人手上。这不是口号——这是我们在自己的工程实践里强制执行的纪律。

2026 年了,“用 LLM 写代码”已经不是难题。难题是当这些代码、配置、运行时变更要进入真正的生产环境时——谁负责?谁批准?怎么追溯?什么时候必须停下来等人?这一层工程框架就是为回答这些问题而存在的。

4
层框架
5+1
Agent 角色 + 人类审批者
3
强制暂停点
1
最终权威
本页证明

AI 可以加速研发,但最终方向、高风险授权、生产部署永远在人手上。

为什么这一页对应能力 03

“人主导的多 Agent 开发”作为 yunforce 的核心能力之一,需要在真实压力下被验证——不是在一两个 demo 任务里,而是在一个跨越多个月、涉及高风险变更、需要长期工程纪律的项目里。Quant v1.1 是我们实施这套方法的场地。

这一页讲的是这套方法的完整机制:它如何分配角色、设定边界、强制暂停、保留证据,让多个 AI Agent 协同工作而不失控。

关于“AI 开发 AI”,客户最常问的三个问题

我们直接回应。

你们用 AI 开发,会不会失控?

不会。最终方向、高风险授权、生产部署都由人类审批。Agent 可以建议和起草,但不能自己决定推进。三个关键节点(规格、计划、实现)上,系统强制暂停等待人工批准。

多个 Agent 一起工作,会不会互相乱改?

不会。每个 Agent 有明确的角色边界:产品 Agent 只能审查、不能实现;开发 Agent 只能改代码、不能部署;运维 Agent 只能在已批准的范围内执行;研究 Agent 只读,不写入正式系统。跨边界的动作需要明确委派。

AI 做的事情出了问题,谁负责?谁来回溯?

最终责任人始终是人类审批者——因为是他们批准了变更。回溯靠的是证据:每一次 Agent 的建议、计划、实现、部署,都通过 GitHub 议题、commit、审查文档、关闭评论留下完整可审计的轨迹。

真正的问题,不是 AI 能不能产出

我们使用多个 Agent,但目标不是最大化自主性。

目标是一个许多贡献者都能帮忙的系统,而不侵蚀问责、执行纪律或可审计性——一旦工作变得真正运营化。

许多 Agent 可以贡献。只有人类能批准最终方向。

组织不能比软件更不守纪律

Quant v1.1 在运行时已经分离了建议、审批、执行和证据。这个项目的团队运营方法刻意采用了相同的形状——这样组织就不会比软件更不守纪律。

产品运行时

  • -顾问 / 研究对象 → 治理对象可以建议,但不执行
  • -人类审批 → 决定是否授予权限
  • -执行系统 → 仍是唯一执行权威
  • -证据与验证 → 每一个有意义的动作都以证据闭合

团队运营系统

  • -Agent 建议和构建 → 在定义的角色边界内贡献
  • -人类批准 → 直接授权保持在人手上
  • -开发 / 运维执行 → 实现和变更只通过被分配的执行角色发生
  • -证据闭合 → GitHub 评论、审查文档、测试结果闭合循环

关键设计选择:审批门、执行边界、证据轨迹不只是产品特性。它们也是团队运营规则。

运营模型被分成四个独立的控制层

1

角色框架

产品框定和审查,开发实现,运维执行运行时跟进,副驾驶路由,研究保持只读,人类最终决策人保留最终权威。

2

授权框架

高影响变更需要直接授权:生产系统重启、外部接口写入、配置切换、治理覆盖、凭证、生产状态声明。

3

执行框架

工作通过一条可重复路径流动:议题、规格确认、实现计划、产品审查、实现、实现后审查、授权门、验证、证据闭合。

4

恢复框架

恢复是系统设计的一部分。在压力下应用相同纪律:保留证据、陈述失败、定义回滚路径、保持权威边界可见。

深度案例细节 · Deep Case Detail · 完整机制详解

上面已经展示了核心机制(四层框架、三个暂停点、最终权威、三个客户问题)。下面进入完整角色拆解和执行路径——属于深度内容,不必读完。

不同的 Agent 服务于不同的任务,而不是可互换的声音

人类最终决策人

方向、委派、授权边界的最终决策拥有生产 go / no-go 决策

不把最终批准权委派出去

产品 Agent

塑造议题、规格、验收逻辑、推广边界对照风险和范围审查实现

不应成为默认实现者

开发 Agent

起草实现计划和测试计划修改代码、测试和技术文档

不为了通过绿色检查而削弱测试,也不部署

运维 Agent

拥有运行时连续性、服务器支持、监控、证据收集在运行手册和授权边界内执行

不把转达的批准当作变更许可

副驾驶 Agent

协调和转达;它是路由层,不是内容层保留项目方法和明确的交接

不成为隐藏的第二审批者

研究 Agent

只读研究和分析为产品审查产出发现

不实现代码,不触碰正式系统路径

仓库边界:本地 Agent 默认只在自己的主仓库内编辑和提交。跨仓库编辑需要明确的人类委派。

工作路径刻意比“问一下 Agent”更重

工作流系统和审查流程为工作强制了一个共享形状。这让计划、实现、审查、运行时授权保持分离,而不是塌缩进单一对话。

01

议题与范围

工作从一个明确的议题开始,带有问题、动作、验收、测试契约。

02

产品确认规格

在开发计划任何东西之前,产品检查这个切片是真的、有边界、可实现的。

03

开发起草计划和测试

实现计划和验证计划一起起草,包括授权期望和回滚条件。

04

产品审查计划

产品批准、拒绝,或带发现循环直到计划可接受。

05

开发实现

代码、测试、技术文档在批准范围内变更,并带 Agent 归属推送。

06

产品实现后审查

对照批准的计划、真实文件、实际测试 / 证据界面审查实现。

07

授权与发布

如果需要运行时变更,产品和开发就验证计划对齐,然后由人类最终决策人授权动作。

08

证据闭合

审查文档、议题评论、日志、测试输出、关闭评论保存了什么改变了、为什么完成了。

三个强制暂停点

1.

规格缺口 — 切片还没准备好;产品必须澄清或缩小它才能让开发计划

2.

计划批准 — 计划可接受、实现可以开始,但批准本身是明确的

3.

实现批准 — 代码可接受;如果需要部署,下一步是授权,而不是静默执行

工作流由边界定义,而不是由某个模型厂商定义

LLM 厂商会变,模型 API 会变,账户会被限制。一个真正的工程框架不应该绑死在任何特定供应商身上。这是我们专门为“压力情景”做的三个设计。

01

角色名高于模型名

仓库标签是角色名优先,供应商名其次。这让运营层比当前模型分配更稳定。

02

工作流逻辑外部化

中继协议、暂停点、工作流系统活在文档和脚本里,而不是在某一个模型的记忆里。这让路径可复现。

03

模型失败变成换装问题

如果一个角色能在保持相同范围、证据、权威契约的前提下被重新映射,系统在供应商或账户压力下会更优雅地降级。

两个方法论,两个层面,各自独立

yunforce 对外有一个 PROOF 方法论,讲我们如何为客户交付 AI 项目。本页讲的工程协作框架不是同一回事——它是这个特定自研项目内部使用的工程协作机制。

-

PROOF 方法论 → 对外,跨项目,关于“我们如何与客户共同推进一个 AI 落地”

-

工程协作框架 → 内部,单项目,关于“一个多 Agent 团队如何在不失控的前提下推进高风险工程变更”

两者解决不同的问题,互相不替代。把它们都展示出来,是因为我们认为客户值得看到——一家声称“懂 AI”的公司,是怎么在自己的工程实践里管住 AI 的。