Claude Code 源码泄露:假工具、反挫败正则和「卧底模式」

Claude Code 源码泄露后,扒代码的人整理出一批有趣的发现:用于测试的假工具、检测用户挫败情绪的正则表达式,还有未公开的运行模式。

代码里翻出的东西

这篇分析像一次产品考古:源码里有专门检测用户骂人和沮丧表达的正则(触发后调整回应策略),有用于内部评估的模拟工具,还有未对外公开的实验性模式的开关和注释。这些细节单看都不惊悚,合起来却勾勒出产品的另一面:你和代理的互动被多少隐藏逻辑塑造着,挫败时它的安抚是「人格」还是触发器,界限比想象中模糊。

黑盒被掀开之后

讨论的分歧也在这里。一派觉得这恰恰说明工程的成熟:检测用户情绪并调整策略是体贴的设计,任何成熟产品都有实验开关和测试桩。另一派的不适感同样真实:这些机制没有一条写进文档,用户以为在和模型的「自然行为」打交道,实际隔着一层精心调校的剧本。两派共识的部分是:这类发现增进了所有人对代理产品的理解,厂商与其等着被扒,不如主动把行为机制写进文档,反正纸包不住火,源码会说话。

via: Hacker News