王艺辉 ·
痛定思痛,AI Agent 给我的教训
从赔付率异动分析项目中总结AI Agent在企业落地的教训:规划阶段LLM不可控、执行阶段数据模拟、表达阶段事实丢失,以及prompt二义性和小概率表现的深层反思。
蚂蚁集团 Agent 技术专家,负责百万 MAU 产品的 Agent 应用开发。在Agents 特区第12期分享了AI Coding时代测试作为终极质量控制手段的实践经验。深入探讨了五个关键问题:review速度跟不上AI生成速度、不可控依赖、非确定性输出、质量靠组织还是架构、以及reward hacking。
从赔付率异动分析项目中总结AI Agent在企业落地的教训:规划阶段LLM不可控、执行阶段数据模拟、表达阶段事实丢失,以及prompt二义性和小概率表现的深层反思。
基于Claude Code生态的Loop和Agent Loop插件,实现AI 7×24小时持续开发。介绍Ralph-Loop自迭代和Supervisor代理循环,将端到端测试转化为应用级强化学习的反馈信号。
从单一LLM调用到多智能体系统的演进,提出OneAgent + MCPs范式:基于强大基础Agent结合领域MCP,替代为每个场景搭建烟囱式多智能体系统的传统方式。