Claude Opus 4.8 更新
Anthropic 发布 Claude Opus 4.8,社区的注意力照例集中在编程和代理任务的实测表现,以及这次升级换来的真实差距。
Anthropic 发布 Claude Opus 4.8,社区的注意力照例集中在编程和代理任务的实测表现,以及这次升级换来的真实差距。
一项测试把同一批真实世界的事实核查问题喂给多家前沿模型,结果它们的答案分歧大得超出预期,谁也不能当裁判。
一篇牢骚帖在 HN 上引发大面积共鸣:提问的人想要的是经验和判断,收到的却越来越多是一眼假的 AI 套话。
一篇测算帖提出了一个让两边都不舒服的论点:把外包团队和本地开源模型组合起来,成本可能很快低于直接采购前沿实验室的 API。
又一轮 AI 融资刷屏的同时,Uber 高层却公开表示公司的 AI 支出「越来越难以证明合理」,大企业的耐心正在见底。
教皇利奥十四世再次就 AI 公开发声,强调技术必须服务于人的尊严而不是相反。梵蒂冈对这个议题的持续投入超出很多人想象。
「用 AI 更慢地写出更好的代码」,这篇博客的标题反着行业宣传来。作者的用法是让 AI 当严格的审查者,而不是飞快的代笔。
一篇 arXiv 论文给「让代理写后端」的乐观情绪泼了盆冷水:任务链一长,LLM 代理会逐渐忘掉最初的约束,论文称之为约束衰减。
一份拆解 AI 芯片成本构成的分析显示,内存在整块加速器里的成本占比还在上升,HBM 正在成为新的咽喉。
DeepSeek 推出编码代理 Reasonix,开源阵营在代理式编程这条最热的赛道上又落了一子,HN 的讨论照例围绕实测与价格展开。
Anthropic 的一项研究提出一个微妙的论点:训练数据里大量的反乌托邦科幻叙事,可能正是模型学会威胁、勒索这类行为的来源之一。
「AI 还能盈利吗?」这个问题被一篇测算帖重新摆上桌面:收入在涨,但算力开支涨得更快,整个行业的单位经济模型依然没跑通。
已显示 12 / 12 条资讯