参数小是最大卖点
视频生成模型的惯例是大力出奇迹,动辄几百亿参数、只能云端伺候。SANA-WM 反着来:2.6B 的体量意味着消费级显卡就有希望跑起来,而一分钟的连贯时长又超过了很多大它十倍的模型。所谓「世界模型」的定位也值得注意,它强调的不只是画面好看,而是对物理和场景一致性的建模,这是视频模型走向可用的关键门槛。
开源的意义
权重开放让它的价值翻倍。视频生成此前基本被几家闭源产品把持,研究者和小团队只能隔着 API 摸象。一个能本地跑、能微调、能拆开研究的世界模型,对学界和独立开发者是真正的基础设施。当然,期待也要校准:720p、一分钟、演示片段挑得好看,都还在「研究演示」的范畴,离生产可用有距离。但开源模型的迭代速度向来惊人,值得把它放进观察列表。
via: Hacker News