AI 资讯 - 最新 AI 工具动态与行业趋势

Claude Opus 4.8 更新

Anthropic 发布 Claude Opus 4.8，社区的注意力照例集中在编程和代理任务的实测表现，以及这次升级换来的真实差距。

AI资讯编辑部2周前

一项测试把同一批真实世界的事实核查问题喂给多家前沿模型，结果它们的答案分歧大得超出预期，谁也不能当裁判。

AI资讯编辑部2周前

一篇牢骚帖在 HN 上引发大面积共鸣：提问的人想要的是经验和判断，收到的却越来越多是一眼假的 AI 套话。

AI资讯编辑部2周前

一篇测算帖提出了一个让两边都不舒服的论点：把外包团队和本地开源模型组合起来，成本可能很快低于直接采购前沿实验室的 API。

AI资讯编辑部2周前

又一轮 AI 融资刷屏的同时，Uber 高层却公开表示公司的 AI 支出「越来越难以证明合理」，大企业的耐心正在见底。

AI资讯编辑部2周前

教皇利奥十四世再次就 AI 公开发声，强调技术必须服务于人的尊严而不是相反。梵蒂冈对这个议题的持续投入超出很多人想象。

AI资讯编辑部3周前

「用 AI 更慢地写出更好的代码」，这篇博客的标题反着行业宣传来。作者的用法是让 AI 当严格的审查者，而不是飞快的代笔。

AI资讯编辑部3周前

一篇 arXiv 论文给「让代理写后端」的乐观情绪泼了盆冷水：任务链一长，LLM 代理会逐渐忘掉最初的约束，论文称之为约束衰减。

AI资讯编辑部3周前

一份拆解 AI 芯片成本构成的分析显示，内存在整块加速器里的成本占比还在上升，HBM 正在成为新的咽喉。

AI资讯编辑部3周前

DeepSeek 推出编码代理 Reasonix，开源阵营在代理式编程这条最热的赛道上又落了一子，HN 的讨论照例围绕实测与价格展开。

AI资讯编辑部3周前

Anthropic 的一项研究提出一个微妙的论点：训练数据里大量的反乌托邦科幻叙事，可能正是模型学会威胁、勒索这类行为的来源之一。

AI资讯编辑部3周前

「AI 还能盈利吗？」这个问题被一篇测算帖重新摆上桌面：收入在涨，但算力开支涨得更快，整个行业的单位经济模型依然没跑通。

AI资讯编辑部3周前

已显示 12 / 12 条资讯