Genmo

更具创造性!使用文本指令编辑图像和视频

热度AI音视频免费额度
暂无预览图

AI 视频生成的牌桌上,2024 年 10 月发生了一件改变格局的事:当 Runway、Pika、Sora 们都把模型锁在自家服务器里按秒收费时,一家叫 Genmo 的公司把自己的视频生成模型 Mochi 1 整个开源了——百亿参数级的权重、Apache 2.0 许可、可商用,直接放上 Hugging Face。这一手在 AI 视频圈的意义,类似当年 Stable Diffusion 之于图像生成:视频生成第一次有了一个能打的开源底座

所以今天谈 Genmo,真正的主角不是它的网页产品,而是 Mochi 这条开源路线——它让"自己部署一个视频生成模型"从幻想变成了显卡够好就能做的事。

Genmo 是什么

Genmo(genmo.ai)是一家专注 AI 视频生成的公司,由伯克利背景的研究团队创立。两条产品线:

Mochi 模型(开源):自研的视频生成模型,Mochi 1 以约 100 亿参数的 AsymmDiT 架构开源,主打动作流畅度与提示词遵循度——AI 视频最经典的两大翻车点(人物动作鬼畜、画面不听指挥),正是它训练优化的靶心。

Genmo 平台(在线):官方托管的网页入口,无需自备硬件即可调用 Mochi 生成视频,配合早期积累的"对话式创作"交互——文字生成、文字迭代修改、图像转视频的渐进式工作流。

核心功能

文本生成视频

输入英文提示词,生成数秒的视频片段。Mochi 1 的两个相对强项:

运动质量:角色和物体的动作连贯自然,肢体崩坏、帧间跳变这些早期 AI 视频的恐怖谷元素被显著抑制——这是它在开源发布时拿来对标商业模型的主打指标。

提示词遵循:画面内容对文字描述的服从度高,"说什么画什么"的可控性,对需要精确产出的创作者比"随机惊艳"更有价值。

对话式迭代创作

Genmo 早期产品形态的遗产,也是它名字里"更具创造性"的来源:生成之后不满意,继续用自然语言改——"天空换成日落""镜头慢慢推近""整体改成水彩风"——渐进逼近想要的画面,比一次性赌一条完美提示词更符合创作直觉。

图像转视频

静态图作为起点赋予运动,配合先图后视频的两段式工作流:图像阶段把构图风格敲定,再让它动起来——比直接文生视频的控制粒度更细。

开源部署(技术用户)

Mochi 1 权重公开,有足够显存的用户可本地部署,社区也快速跟进了量化版本与 ComfyUI 集成——意味着无限生成、隐私可控、可微调定制,这是一切闭源服务给不了的三件套,也是 Mochi 在开发者社区声量的来源。

与同类工具的对比

vs Runway/Pika:闭源商业阵营的头部,产品完成度、视频质量上限、工具链(编辑、口型、特效)全面成熟;Genmo 平台的产品化程度不及,但 Mochi 的开源属性是它们没有的维度。要开箱即用的生产力选商业产品,要自主可控选 Mochi。

vs 可灵/即梦(国产):国产视频模型的质量进步迅猛、国内访问无障碍,中文用户的现实主力;Genmo 的意义仍在开源——国产平台同样是闭源服务。

vs Sora:OpenAI 的标杆之作,质量天花板但获取门槛高;Genmo 是"现在就能用、还能自己部署"的务实选项。

vs 开源同行(HunyuanVideo、LTX-Video、Wan 等):Mochi 开闸之后,开源视频模型迅速热闹起来,腾讯混元视频等后来者在部分指标上已经反超——开源赛道的迭代速度残酷而精彩,Mochi 的历史地位(率先把高质量视频模型开源)和当前竞争力需要分开评估,自部署选型建议横向比较最新的社区评测。

谁适合关注 Genmo

技术开发者与研究者:Mochi 的开源权重是研究视频生成、做定制微调、搭自有视频管线的优质底料——这是 Genmo 最核心的受众。

需要私有化视频生成的团队:数据不能出门、生成量大到 API 计费肉疼的场景,自部署开源模型是唯一解,Mochi 是候选清单上的常客。

AI 视频的尝鲜创作者:在线平台免费额度可体验,对话式迭代的交互对探索型创作友好。

关注开源 AI 生态的观察者:视频生成的"SD 时刻"是否到来、开源能否复刻图像领域的逆袭——Genmo/Mochi 这条线是这个命题的关键观察样本。

局限性

视频时长短(数秒级),长内容需拼接;复杂场景(多主体交互、精细手部)仍是包括它在内所有视频模型的共同难关。

与第一梯队商业模型的质量差距客观存在,商业交付级的画面要求下,Runway/可灵仍是更稳的选择。

本地部署的显存门槛不低(原版需要高端显卡,量化版有所缓解),"开源"不等于"人人能跑";在线平台国内访问需要网络条件。

价格

在线平台提供免费生成额度,付费解锁更多次数与更快队列;Mochi 模型本体开源免费,Apache 2.0 可商用,部署成本即硬件成本。具体以官网与模型仓库为准。

Genmo 的故事价值大于它某个版本的跑分:它证明了视频生成模型可以走开源路线,并实际按下了这个赛道开源竞赛的发令枪。如果你是开发者,Mochi 值得进你的技术雷达;如果你只是想生成视频,把它当作商业工具之外"留一手自主权"的选项——AI 视频的未来格局里,开源这条线,大概率会越来越重要。