Claude 会记混谁说了什么，这个毛病不小

AI资讯编辑部2个月前

一篇较真的吐槽：作者发现 Claude 在长对话里会把发言张冠李戴，把用户说的当成自己说的，反之亦然。小毛病，大隐患。

毛病的具体表现

作者给出了可复现的例子：对话拉长之后，模型开始混淆消息的归属，「你刚才说过」的内容其实是它自己说的，用户明确否定过的方案被当成用户的主意端回来。在闲聊里这只是别扭，在正经场景里就是事故：会议纪要里发言人张冠李戴、客服记录里诉求归属错乱、多人协作的上下文里责任错位。归属（attribution）是语言理解的基本功，这门课不及格的影响面比看起来大。

为什么会这样，怎么防

技术上的解释不复杂：对话在模型眼里是一长串文本，角色标记只是文本的一部分，注意力机制并不保证「谁说的」这个信息在长距离上不丢。上下文越长、参与者越多，混淆概率越高，而且所有模型都有这毛病，程度有别。实用的防御：关键信息别依赖模型的记忆归属，重要决策让它复述确认，长对话定期重置并显式总结，多人场景在内容里写明发言人而不是依赖角色字段。在归属可靠性有根本改进之前，这些笨办法就是必要成本。

via: Hacker News