Claude Opus 4.8 更新

AI资讯编辑部2周前

Anthropic 发布 Claude Opus 4.8，社区的注意力照例集中在编程和代理任务的实测表现，以及这次升级换来的真实差距。

版本更新的看法

Opus 系列现在是 Anthropic 的旗舰线，4.8 延续了它一贯的迭代节奏：重点打磨编程、长任务执行和工具调用这些开发者最买账的能力。官方基准照例全面领先，但社区早就学会了对厂商跑分打折扣，HN 讨论里更受重视的是第一批用户拿自己真实项目跑出来的体感：哪些场景明显变强，哪些地方退步了，价格和速度有没有变化。

要不要升级

对已经在用 Claude 的团队，这类小数点版本的合理做法是抽样回归：拿一批存档的真实任务在新旧版本各跑一遍，对比成功率和成本再决定切换。模型升级偶尔伴随行为漂移，提示词的最优写法可能变化，自动化流程里尤其要防。对观望者来说，版本号竞赛本身信息量有限，与其追新闻，不如固定一套自己的评测题，每逢大版本跑一次。

via: Hacker News