规模化暴露的问题
单个代理的故事大家听腻了,这篇的价值在「百」这个数量级:上百个代理并行干活时,新问题层层冒出来。成本曲线比预想陡得多,失败重试在规模下烧钱如流水;代理之间的工作需要协调和去重,否则一半算力花在重复劳动上;结果的聚合和仲裁成了新瓶颈,一百份「我做完了」的报告里混着多少谎报,需要专门的核验层。作者的记录诚实,翻车和收获都没省略。
对后来者的参考价值
多代理是眼下最热的方向之一,但公开的经验多是演示级的,这种带成本数字和失败案例的工程实录稀缺。能抄走的结论包括:核验机制要先于规模建设,没有可靠的「验收员」,代理军团只是噪音放大器;任务的可并行性要提前评估,强依赖链条上堆代理是浪费;预算护栏必须硬编码,代理不会自己心疼钱。一句被多次引用的总结:管理一百个代理像管理一百个过分自信的实习生,管理学比提示词工程有用。
via: Hacker News