CERN 把微型 AI 模型塞进 FPGA,实时筛选对撞数据

CERN 的工程师把超紧凑的 AI 模型部署到 FPGA 上,用于 LHC 对撞数据的实时筛选,推理延迟以纳秒计。这是「小模型」的极致秀场。

技术挑战有多变态

LHC 的数据量是物理意义上的洪水:每秒数千万次对撞,绝大部分必须在硬件层面当场丢弃,只留下可能有趣的事件。筛选决策的时间预算是纳秒到微秒级,GPU 都嫌慢,只能用 FPGA。把神经网络塞进这种约束里,意味着极限量化、剪枝、定制电路,模型小到以千字节计,却要做出不能错的取舍,扔掉的数据永远找不回来。这和大模型军备竞赛是同一个学科的两个极端。

极端工程的外溢价值

这类工作的意义不限于粒子物理。CERN 团队开发的模型压缩和硬件部署工具链(如 hls4ml)是开源的,同样的技术正流向任何「延迟就是一切」的场景:电网保护、自动驾驶的传感器前端、高频信号处理。它也是对行业叙事的一个温和反驳:AI 的前沿不只在万亿参数那头,把智能压进一粒芯片、一纳秒窗口,同样是前沿。读惯了算力竞赛新闻的人,看看这种「极限节俭」的工程美学,会觉得清爽。

via: Hacker News