昨晚刷到一个同行朋友圈,配图是一张 Veo 3.1 生成的短视频截图,文案只有四个字:
“成本崩了。”
我私聊问他怎么回事。他发来一张橘子 AI 的账单截图:一天生成 87 个视频,总花费 34.8 元。
34.8 元。87 个谷歌 Veo 3.1 生成的视频。平均每个 4 毛钱。
我沉默了很久。
不是因为他省钱省得离谱,而是我突然意识到:AI 创作的战争,已经悄悄换了战场。
以前大家拼的是谁提示词写得好,谁抽卡运气好,谁能熬得住漫长的渲染等待。
现在大家拼的是——谁能用更少的钱,生成更多的东西,然后活得更久。
而橘子 AI(www.juziaigc.com)正在让这场战争,变得有点 “不公平”。
一、 Banana 2:当你以为 AI 生图已经卷到头的时候 说实话,去年年底我已经对 AI 生图有点 “审美疲劳” 了。
各家模型你追我赶,指标越来越高,但生成的东西越来越像——网红脸、糖水片、光影糊成一团。你给我看十张图,我分不清哪张是 Midjourney,哪张是 DALL·E,哪张是某国产大模型。
直到看到 Nano Banana 2 的生成结果。
它不是更 “像” 了,而是更 “懂” 了 怎么解释这种 “懂”?
举个例子。我让它生成 “一个老裁缝在昏暗的阁楼里,对着光缝补一件旧旗袍,窗外是老上海的弄堂”。
以前的模型会怎么做?大概率是一个老人 + 一件旗袍 + 一扇窗 + 胡乱堆砌的弄堂背景。每个元素都对,但放在一起就是不对劲——光线从四面八方来,透视关系错乱,人物和背景像 P 上去的。
Banana 2 怎么做?
它知道 “昏暗的阁楼” 意味着主光源应该是窗外的自然光,所以人物的侧脸被照亮,背景隐在暗处。它知道 “对着光缝补” 意味着手应该在光线下,针脚应该被强调。它知道老上海的弄堂是什么样的,所以窗外不是随便画几条线,而是有晒衣杆、有斑驳的墙面、有远处模糊的行人。
这不是 “生成”,这是在理解的基础上创作。
更绝的是文字处理。我让它生成一张 90 年代录像厅手写海报的样子,上面写满片名和场次——出来的结果,字体有手写的拙劣感,字间距不一,墨迹有深有浅,甚至有些地方因为写太快而连笔。这种细节,以前的模型根本做不到。
在橘子 AI,生成这样一张懂光影、懂透视、懂写字、懂年代感的图,价格是 0.065 元。
六分五。不够买一个包子,不够坐一趟公交,但能买一张让设计师挑不出毛病的 4K 精图。
角色一致性:漫画创作者的救星 做连载漫画的朋友应该懂这个痛:让同一个角色在不同画面里长得一样,简直是玄学。
换件衣服就变脸,换个角度就崩盘,稍微侧个身就像换了个人。Banana 2 支持最多 5 个角色保持特征高度一致——不只是脸,连气质、神态、习惯性小动作都能延续。
有朋友用它做日更条漫,主角是一个戴圆框眼镜的宅男和他的猫。现在更新了 60 多话,读者愣是没发现是 AI 画的。问他秘诀,他说:“哪有什么秘诀,就是生成成本低,反复抽卡抽到满意为止。以前抽一张卡一块钱,肉疼。现在抽一张 6 分 5,抽 100 张才 6 块 5,随便抽。”
二、 Veo 3.1 Fast:视频创作的 “快” 和 “省” 如果说 Banana 2 解决的是 “怎么画得好”,那 Veo 3.1 解决的是 “怎么动得顺”。
让照片活过来 Veo 3.1 Fast 最让我震撼的功能是:上传一张真人照片,它能让照片里的人动起来。
不是那种僵硬的、像木偶戏一样的动,而是连微表情、眼神流转、嘴角牵动都自然的动。我试了上传一张外公年轻时的黑白照片,输入 “对着镜头笑一下,然后缓缓转过头看向远方”。十几秒后,照片里的外公眨了眨眼,嘴角慢慢扬起,然后转头望向左侧——那个瞬间,我鼻子有点酸。
技术能做到这一步,已经不是 “工具” 了,是某种意义上的 “记忆复活”。
首尾帧控制:让镜头有逻辑 做视频的人都知道,最难的不是单帧好看,而是多帧之间有逻辑。
Veo 3.1 支持首尾帧控制:你给一张开始图、一张结束图,它能自动脑补中间发生了什么、镜头怎么走、人物怎么动。
比如你给一张 “空杯子放在桌上”,再给一张 “杯子被喝了一半”,它会自动生成一只手拿起杯子、喝水、放下的过程。中间的倒影、水面的晃动、手部肌肉的变化,都合理得可怕。
配合多参考图功能,能让同一个角色在多镜头切换中保持绝对一致——这对做剧情类短视频的人来说,简直是生产力核弹。
原生音频:氛围感不用后期配 以前的 AI 视频,画面出来了,还得自己找音效、配 BGM、调同步。Veo 3.1 在生成视频的同时,直接合成与画面同步的音频。
生成一个雨夜的场景,出来的视频自带淅淅沥沥的雨声、远处隐约的雷鸣、甚至窗户被风吹动的嘎吱声。生成一个菜市场,有吆喝声、讨价还价声、塑料袋窸窸窣窣的声音、远处油锅滋滋作响的声音。
这种 “原生氛围感”,后期配是配不出来的。
在橘子 AI,生成这样一个带原生音频、带复杂运镜、带多角色一致性的视频,价格是 0.4 元/次。
三、 橘子 AI 的 “成本账”:为什么创作者在悄悄转移阵地? 前面说的都是模型有多强,但我知道你们最关心的是:这玩意儿到底多少钱?
来,上硬菜。
Banana 2 生图
官方及其他平台:约 1 元/张
橘子 AI:最低 0.065 元/张
差价:15 倍
Veo 3.1 Fast 生视频
官方:0.4 美元/秒 ≈ 2.8 元/秒(8 秒视频 22.4 元)
橘子 AI:0.4 元/次(一次可生成 8 秒左右)
差价:56 倍
这是什么概念?
假设你是一个日更的短视频创作者,每天需要 30 条素材。
在其他平台:每天成本≈ 30×20 = 600 元
在橘子 AI:每天成本≈ 30×0.4 = 12 元
一个月下来,成本差距接近 1.8 万元。
这不是 “省点钱” 的问题。这是同样的预算,你能产出 50 倍的内容的问题。
更狠的是:新注册送 10000 积分。
Banana 2 生图几十积分一次,Veo 3.1 生视频几百积分一次。这 1 万积分,够你跑完所有模型的完整流程,零成本验证你到底需不需要这些工具。
还有一个细节很多人没注意到:生成失败,积分全额退还。
用过 AI 生成的都知道,模型偶尔会抽风、服务器偶尔会卡顿、生成偶尔会失败。在大多数平台,失败了就是失败了,积分不退。橘子 AI 这个 “兜底” 机制,意味着你可以放心大胆去试那些疯狂的想法——反正失败了也不亏。
四、 谁在闷声发大财? 我观察了一圈,现在用橘子 AI 用得最狠的是这几类人:
AI 短剧创作者:以前做一集 3 分钟的短剧,成本几百上千。现在用 Veo 3.1,成本压到十几二十块。有人一天更新 3 集,全平台铺量,一个月涨粉百万。
电商卖家:商品主图、详情页、宣传视频——以前外包给设计公司,一套图几千块。现在自己用 Banana 2 生成,一天出几十套,哪个点击率高用哪个。
漫画/条漫作者:日更不再是梦。多角色一致性 + 低成本批量生成,有人三个月画了别人三年的量。
自媒体博主:封面图、配图、短视频素材。以前为了找不侵权的图翻遍全网,现在想要什么风格直接生成,几分钟搞定。
这些人有一个共同点:不声张,不炫耀,悄悄用。
因为当你的成本是同行 1/10 甚至 1/50 的时候,你不会到处嚷嚷。你会默默把省下来的钱,投到内容上、投到流量上、投到扩大规模上。
等同行反应过来,你已经跑出去很远了。
五、 最后说几句心里话 AI 工具每天都在变强,这已经不是新闻。
真正的新闻是:谁能让你用最便宜的价格,用上最强的工具。
橘子 AI 现在做的就是这件事。
谷歌的 Banana 2 和 Veo 3.1 确实强,但如果价格下不来,它只是大公司和氪金玩家的玩具。橘子 AI 把价格打下来之后,它才真正变成创作者的生产资料。
0.065 元一张图,0.4 元一个视频。
这不是薅羊毛的价格,这是生产资料民主化的价格。
我知道有些人会想:现在这么便宜,肯定是暂时的,先等等看,等价格稳定了再说。
但你有没有想过:等价格 “稳定” 的时候,就是它涨起来的时候。
趁现在,趁还有 1 万积分可以领,趁成本还是地板价——
去看看这两个模型到底有多强,去算算你的创作成本能降到多低。
反正门槛是零。
剩下的,你自己决定。