Veo 3对标OpenAI的Sora,具备生成视频的同时同步嵌入音效的能力。
谷歌表示,Veo 3不仅可以基于文本和图像提示生成高质量的视频,还能为人物对白、鸟鸣或街头交通等场景配上相应的音效,实现更逼真的视听体验。
谷歌DeepMind产品副总裁Eli Collins表示:“从文字和图像提示,到真实世界物理效果与精准的唇形同步,Veo 3的表现都非常出色。”
目前,该模型主要面向美国地区的Gemini Ultra订阅用户,每月收费249.99美元。
除了Veo 3外,谷歌还发布了多个与生成式AI相关的新产品,包括升级版图像生成模型Imagen 4、电影制作辅助工具Flow。
此外,谷歌还宣布对原来的Veo 2进行更新,并新增支持通过文字提示对视频中物体进行增删的功能。
2024年,谷歌因Imagen 3模型生成带有历史错误的图像内容而遭遇广泛批评,随后被迫重新发布该工具。
遏制深度伪造:谷歌推出 SynthID Detector“AI 打假工具”
谷歌创意利器 Canvas 升级 Gemini 2.5:降低开发门槛,AI 多样化呈现文本内容
AI 拍“大片”:谷歌发布电影创作应用 Flow,脚本、分镜、镜头控制都能做
谷歌最强文生图 AI 模型 Imagen 4 亮相:比上一代快 10 倍,文字效果更好
谷歌最强视频生成 AI 模型 Veo3 亮相:制作背景音、人物对话都不在话下
17173全新怀旧频道已上线!推荐怀旧网游,重温老玩家故事。点此进入怀旧频道