平台工程:搭建多层反馈基础设施
🚧 本节正在开发中。
多 Agent 并行开发对反馈基础设施的要求,和单 Agent 开发有质的区别。单个 Agent 执行时,你在场,反馈可以通过你的判断补位。多个 Agent 同时运行时,反馈必须是自动化的、分层的、机器可读的。
反馈速度决定了问题被发现的时机和修复成本。毫秒级的反馈(linter、类型检查)在 Agent 写代码的过程中就能拦截格式和类型错误。秒级的反馈(单元测试、CI)在提交后几秒内报告逻辑错误。分钟级的反馈(集成测试、端到端测试)验证多个模块的协作。小时到天级的反馈(可观测性、性能 benchmark)捕捉运行时行为和长期趋势。每一层的信号都必须是机器可读的,Agent 才能自主响应反馈并修正,而不是等人来看日志再给指令。环境可复现性是所有这些反馈层可靠运行的前提:同样的代码在同样的环境里必须产出同样的信号。
Harness Engineering Playbook · AgentsZone Community