我的作品我做了一个免费 AI 视频生成器：Gemini Omni，用 Google 最新的全模态模型

geminiomni(Ethan) · June 05, 2026 · Last by Huaxiluo replied at June 08, 2026 · 173 hits

分享一个自己做的小产品，欢迎大家试用和提意见。

做这个的原因

我一直在用各种 AI 视频工具，但发现大多数要么太贵，要么生成效果很割裂——视频是视频，音频是音频，得自己后期合成。Google 去年发布的 Gemini 全模态模型其实已经支持文字、图片、视频、音频一起输入输出，但没有一个好用的免费前端。

所以我就自己做了一个。

全模态 API 的 token 计费很复杂：视频帧数、音频时长、图片分辨率都分开计费，做预估很麻烦，最后用了分段计费的方式让用户大致知道会花多少
对话式编辑的上下文管理：每一轮编辑都要把之前的生成结果作为参考传回去，上下文窗口压力很大，目前限制了最多 5 轮连续编辑
免费用户的水印：用 FFmpeg 在 Vercel Edge Function 上实时打水印，但 Edge Function 有 4MB 响应限制，视频不能直接返回，得用 R2 中转

目前还比较早期，欢迎大家试用，有 bug 或者功能建议直接回复我。

Huaxiluo #2 June 08, 2026

有兴趣沟通一下吗

You need to Sign in before reply, if you don't have an account, please Sign up first.