Veo 3.1 AI 视频生成器功能亮点
原生 48kHz 同步音频
Veo 3.1 在与视频同一次生成中产生三类音频:与角色口型同步的对白语音、与画面动作帧级对齐的音效,以及与场景氛围匹配的环境音。音频以 48kHz 立体声输出——专业广播级品质——视听延迟约 10ms,完全符合广播容差标准,无需后期音频合成。
首尾帧精确控制与多张参考图引导
指定视频的精确起始帧和结束帧,并提供最多 3 张参考图引导主体外观、场景构图或视觉风格。Veo 3.1 在指定帧之间生成流畅运动,同时遵守参考图约束,赋予创作者对每个生成片段起点和终点的导演级精准控制。
视频延展:最长 148 秒
对已生成的 Veo 片段每次延展 7 秒,最多延展 20 次,从单次生成出发可构建长达约 148 秒的连续序列。每次延展无缝延续前一段的视觉和音频叙事,保持光线、角色和场景的一致性,无需重新提示词从头生成。