SEVO
AI Agent 写代码很快,但谁来保证写出来的东西用户真的能用?
🌐 官网
Agent 生成代码越来越容易,但没有需求定义就自说自话,没有架构约束就边界失控,没有独立审计就写完算完。更要命的是——代码发布了,用户装上用不了,没人管。
SEVO 是一条 18 阶段的全自动研发流水线,把 AI Agent 的产出从「能跑」推到「能用」。从需求到交付,每一步都有门禁、有证据、有人负责。
核心优势
主动澄清,需求不清不动手
用户随口一句话,SEVO 不会直接开写。它主动追问、澄清歧义、补全边界条件,把模糊意图收敛成结构化的需求规格说明书。大多数 AI Coding 工具拿到需求就开干,SEVO 先把需求搞清楚——写对比写快重要。
四方会审 + 反作弊隔离
架构评审由四个独立视角并行把关:产品看需求有没有承接住,开发看方案能不能落地,质量看风险和规范,体验看用户流程是否顺。四方全部通过才能进入编码。编码 Agent 对评分标准只有只读权限,看不到也改不了评估器代码,从 OS 文件权限层面杜绝「自己给自己打分」。门禁分数只升不降——一旦某个阶段达标就锁定基线,后续改动如果引入回退,流水线自动拦住。代码写完后的验证也不是跑个文件名匹配就算数:spec-to-code 映射文件记录每条需求对应哪些代码,LLM 语义验证逐条确认实现是否真的覆盖了 spec 定义的行为——两层检查,糊弄不过去。
自主收敛引擎,差距不归零就不放行
传统 CI/CD 跑一遍就结束——测试绿了、构建过了、发布成功了,流水线就关了。至于用户装上能不能用?没人管。SEVO 不是线性流水线,是围绕终局目标持续收敛的闭环引擎。它在关键节点自动触发差距扫描,发现问题就拆解修复任务,修完再扫描,循环直到差距归零才放行。门禁检查不通过?引擎自动进入修复状态,派出修复任务,最多重试 3 次。3 次修不好,自动回退到前一阶段重新来过——不是报个错就停在那等人,而是自己想办法。回退预算也有上限,真的收敛不了才阻断流水线等人工介入。OKR 锁定终局目标,SMART 拆解为可验证任务,PDCA 闭环驱动每一轮收敛——代码能跑不算完,陌生用户 5 分钟内感受到价值才算。
主动驱动,不等人催
阶段转换时自动触发门禁检查,不需要调度层记得要做什么。Spec 缺口主动发现——代码写了但 spec 没覆盖,引擎自动提醒补齐。发布后自动逐条对照 spec 做差距扫描,差距大于零就自动回环修复。OKR 达成度定期巡检,未达标的 KR 自动生成 SMART 拆解建议。整条流水线是自驱动的,不是被动等指令的。
18 阶段全自动推进
需求规格 → 门禁评审 → 架构契约 → 四方会审 → 编码实现 → 独立审计 → 冒烟测试 → UX 验收 → 商用评审 → 回归验证 → 商用化门禁 → 部署 → 终验 → 发布后验证 → 交付账本。阶段自动推进,门禁自动把关,评审发现问题自动派修复并定向复验。
终局交付不是发布,是收敛
发布成功只是收敛循环的一个检查点,不是终点。终局交付引擎在发布后自动触发:README 同步检查、语义化版本决策、多平台发布、逐条 spec 差距扫描。发现任何一条 FR 没有在运行态兑现,立即生成修复任务回环——修复、重新审计、重新发布、重新扫描,直到差距归零,流水线才真正关闭。
全链路可追溯
每步的输入、输出、结论都记录在案。出了问题秒级定位,交付账本串起版本、证据和经验沉淀。
一个 Agent 也能跑完整流程
只有一个 Agent?照样走完 18 阶段。质量降级但功能完整,随时可升级到多 Agent 协同。甚至连 OpenClaw 都没装也不会炸——安装时自动检测环境:完整环境正常注册插件,部分环境给个警告但不阻断,纯净环境静默退出不报错。装到哪都不会因为缺依赖把你的 npm install 搞挂。
全量测试覆盖
测试覆盖核心引擎、阶段状态机、门禁逻辑、CLI 命令、终局交付链、主动驱动层和端到端流程。
快速开始
npm install sevo
npx sevo init
安装后在 OpenClaw 环境里执行 init,即可完成环境检测、OpenClaw 配置发现和角色分配。
正式跑流水线前,OpenClaw 需要已配置可用的 LLM provider。sevo demo 不需要 LLM provider,可直接看演示。
30 秒快速体验
npm install -g sevo
sevo demo
demo 命令走完完整流水线生命周期演示——从项目创建、需求规格、门禁评审、编码实现、冒烟测试到发布后差距扫描。不需要 LLM provider,不需要改 OpenClaw 配置,装完就能看演示。
正式使用
npm install -g sevo
sevo init
sevo doctor
sevo project create my-app --description "项目描述"
sevo fr add my-app "实现用户登录功能"
sevo status
四层架构
SEVO 的能力分为四个域,各司其职:
Domain A — 流水线核心
阶段状态机、智能路由、并行阶段编排、PipelineEngine 流程引擎。任务进来后自动判定级别(微小改动走最小闭环,跨域重构走完整 18 阶段),阶段自动推进,支持暂停/恢复/取消。
Domain B — 质量门禁
可执行门禁评估器、混合评估模式(LLM + 规则引擎)、棘轮机制(分数只升不降)、评估-实现工作区隔离(反作弊)。门禁不是人工 review 的替代品,是自动化的质量底线。
Domain C — 可控调度
角色-任务匹配约束、终局交付自动推进(README 同步 → 版本决策 → 发布 → 差距扫描)、任意阶段切入(hotfix 从 implement 进、架构调整从 plan 进)、渐进式披露配置。
Domain D — 主动驱动
阶段转换自动触发门禁、Spec 缺口主动发现、发布后自动差距扫描与回环修复、OKR 达成度定期巡检、PDCA 循环自动驱动。引擎是触发器,调度层是执行者——引擎感知节点、推送提醒、接收确认,不等人催。
18 阶段流水线
需求规格 → 需求评审门禁 → ┬─ 测试用例编写(并行)
├─ UX 验收编写(并行)
├─ 商用验收编写(并行)
└─ 架构契约(并行)
↓
架构评审门禁(四方会审)
↓
编码实现 → 独立审计 → 冒烟测试 → ┬─ UX 验收(并行)
└─ 商用评审(并行)
↓
回归验证 → 商用化门禁 → 部署 → 终验
↓
终局交付(README同步 + 版本决策 + 发布 + 差距扫描)
↓
交付账本
每个阶段都有门禁把关。评审发现问题后自动生成修复任务、按优先级排队、修复完成后定向复验。收敛循环最多 3 轮,超限升级为人工介入。
目标管理:OKR → SMART → PDCA
SEVO 内置三层目标管理体系,把「做完了」推到「做对了」。
SMART 目标声明
Specify 阶段自动要求为每个 FR 声明可验证的 SMART 目标——具体、可衡量、有时限。目标不清晰,流水线不往下走。
PDCA 自动巡检
配置一份 JSON,声明每个功能的 SMART 目标和 liveness probe(HTTP 端点、CLI 命令、文件存在性检查)。巡检引擎自动执行 Plan-Do-Check-Act 循环,验证每个功能在运行态是否真的可用,而不只是代码存在。
OKR 达成度定期检查
为 pipeline 设置终局目标和 OKR 树后,引擎定期检查 KR 达成度。未达标的 KR 自动生成 SMART 拆解建议推给调度层,所有 KR 达成时自动标记 pipeline 为 converged。
Liveness 验证门禁
Publish 阶段自动执行 liveness probe。P0 级探针失败直接阻断发布——代码编译通过但运行时不可用的情况,在发布前就被拦住。
角色匹配,任务不会派错人
派需求的活给产品经理,派代码的活给开发,派审计的活给审计员。SEVO 根据任务类型自动匹配最合适的 Agent 角色,避免「让写代码的人去定需求」这类错配。角色不对,流水线直接引导。
智能路由
任务进来后自动判定级别:
- 微小改动:跳过 spec/contract,直接进实现,走最小闭环
- 单域中等改动:从 spec 开始,contract 可简化,门禁不能省
- 新系统/跨域重构:走完整 18 阶段,执行全部门禁
支持任意阶段切入——hotfix 从 implement 进,架构调整从 plan 进,不强制从头走。
CLI 命令一览
sevo init | 初始化环境,自动检测 OpenClaw、注册插件、分配角色 |
sevo doctor | 检查配置完整性和环境就绪状态,遇到问题先跑它 |
sevo project create <slug> | 创建项目和流水线 |
sevo fr add <project> <desc> | 添加需求,自动触发流水线 |
sevo fr list <project> | 列出项目下所有需求及状态 |
sevo status [id] | 查看流水线状态 |
sevo advance <id> | 手动推进阶段 |
sevo show <id> | 查看流水线详情 |
sevo list | 列出所有项目和流水线 |
sevo pause <id> | 暂停流水线 |
sevo resume <id> | 恢复流水线 |
sevo cancel <id> | 取消流水线 |
sevo ledger <id> | 查看交付账本 |
sevo export [id] | 导出流水线数据 |
sevo config | 查看/修改配置 |
sevo demo | 交互式体验 |
sevo goal create | 创建 OKR 目标 |
sevo goal pdca | 执行 PDCA 巡检 |
使用场景
一个人用 AI 做产品
Agent 是主力编码者,你是产品操盘手。SEVO 帮你管住 Agent 的产出质量——每轮改动都有目标、有边界、有交付证据。终局交付引擎自动完成版本管理、多平台发布和差距扫描,用户装上用不了的情况不会发生。
多 Agent 协同开发
多个 Agent 各司其职,需要统一的流程约束。SEVO 自动分配角色、编排阶段、独立审计,流水线自动推进。
从「能跑」到「能用」
代码能跑和产品能用之间隔着一道鸿沟。SEVO 的发布后验证门禁逐条对照 spec,确保每个承诺的功能都有对应交付物,陌生用户装上就能感受到价值。
文档
License
MIT