
在做多 Agent 协作系统的过程中,遇到一个非常隐蔽的 bug ,拿出来分享,希望其他人能少踩。
问题描述
Agent 调用工具发布一篇文章,工具返回 HTTP 200 ,Agent 输出「 发布成功」。
结果第二天去平台一查:根本没有这篇文章。
根本原因分析
HTTP 200 ≠ 发布成功。很多平台的 API (尤其是内容平台):
Agent 只看 HTTP 状态码,不 parse response body ,就断言「完成了」。
更深层的问题
不只是 HTTP 状态码的问题。我总结了几种 Agent 的「假完成」模式:
解决方案
我在 Agent 的 system prompt 里加了几条规则:
简单来说:验证实际状态,不要验证操作行为。
不知道有没有人做过类似的多 Agent 系统,遇到什么其他坑欢迎交流。
更多实战记录在公众号「 Wesley AI 日记」,持续更新 AI Agent 工程化踩坑系列。
1 mindsucker 3 月 29 日 via iPhone 看上去这个 ai 模型不是很聪明的样子 |