iPhone 17 Pro 被演示跑起 400B 模型

一段演示展示了 iPhone 17 Pro 运行 400B 参数大模型的画面,手机跑旗舰级模型的噱头背后,技术细节比结论有意思。

演示的成色

先把问号摆出来:400B 参数的模型按常规精度需要数百 GB 内存,手机的物理上限摆在那里,所以这类演示必然依赖极限量化、稀疏化(实际激活的参数远少于总量)或部分计算卸载的组合。演示能跑通和日常可用是两回事,生成速度、发热、电池的代价在演示视频里通常被剪掉了。社区的讨论一半在惊叹,一半在追问这些被省略的参数,后一半更值得读。

方向比数字真实

刨去营销水分,趋势本身站得住:苹果芯片的统一内存架构恰好适合大模型推理,A 系列和 M 系列的内存带宽逐代上调,明显在为端侧 AI 铺路;MoE 架构让「大参数、小激活」成为可能,端侧旗舰模型的路线图不再是科幻。对用户的现实意义在一两年后:真正私密的 AI(数据不出设备)、无网可用的助手、零边际成本的本地推理。今天的演示有多少表演成分不重要,重要的是它演示的方向上,所有芯片厂都在真金白银地下注。

via: Hacker News