Veo 3.1 Pro

Gerador de vídeo IA Veo 3.1

Veo 3.1 é o principal modelo de vídeo de IA do Google DeepMind, gerando clipes 4K de 8 segundos com áudio de 48kHz sincronizado nativamente – diálogos, efeitos sonoros e paisagens sonoras ambientais – produzidos simultaneamente com o vídeo por meio de um processo de difusão conjunta. Especifique os quadros iniciais e finais, guie o conteúdo com até 3 imagens de referência e estenda os clipes em até 148 segundos no total.

Áudio sincronizado de 48kHz: diálogos, efeitos sonoros e paisagens sonoras ambientais geradas em conjunto com vídeoSaída de até 4K em 16:9 ou 9:16, durações de 4s/6s/8s a 24fpsControle de quadro inicial e final e até 3 imagens de referência por geraçãoExtensão de vídeo de até 20 iterações para sequências de até 148 segundos no total

Veo 3.1 Pro

Google DeepMind, lançado em outubro de 2025. Escolha Veo 3.1 Pro para qualidade máxima e saída 4K; use Veo 3.1 Fast para geração mais rápida e menor custo em fluxos de trabalho com muitas iterações.

Visualização cinematográfica do Veo 3.1

Gere vídeo 4K com diálogos sincronizados, efeitos sonoros e áudio ambiente a partir de um único prompt de texto.

Reproduzir vídeo de modelo
Visualização cinematográfica do Veo 3.1

Veo 3.1 Pro

Visualização cinematográfica do Veo 3.1

Gere vídeo 4K com diálogos sincronizados, efeitos sonoros e áudio ambiente a partir de um único prompt de texto.

Visualização cinematográfica do Veo 3.1 1
Visualização cinematográfica do Veo 3.1 2

Recursos do gerador de vídeo Veo 3.1 AI

Áudio sincronizado nativo de 48kHz

O Veo 3.1 gera três trilhas de áudio na mesma passagem do vídeo: diálogo e fala sincronizados com os movimentos dos lábios dos personagens, efeitos sonoros combinados com a ação na tela quadro a quadro e paisagens sonoras ambientais apropriadas ao ambiente da cena. O áudio é executado em estéreo de 48 kHz – qualidade de transmissão profissional – com latência audiovisual de aproximadamente 10 ms, dentro dos padrões de tolerância de transmissão.

Geração específica de quadro com imagens de referência

Defina o ponto visual inicial e o quadro final exatos de um clipe e forneça até três imagens de referência para orientar a aparência do assunto, a composição da cena ou o estilo visual. O Veo 3.1 interpola o movimento coerente entre quadros especificados, respeitando as restrições de referência, proporcionando precisão de direção no início e no final de cada clipe gerado.

Extensão de vídeo de até 148 segundos

Estenda um clipe Veo gerado anteriormente em 7 segundos por extensão, até 20 iterações, para um total de até 148 segundos de vídeo contínuo de uma única geração original. Cada extensão continua a narrativa visual e de áudio perfeitamente, mantendo a iluminação, os personagens, a consistência da cena e o áudio ambiente do segmento anterior.

Como criar um vídeo Veo 3.1 AI

01

Escreva um prompt descrevendo a cena, a ação do assunto, o movimento da câmera, a iluminação e qualquer diálogo entre aspas

02

Opcionalmente, carregue um quadro inicial, um quadro final ou até três imagens de referência para ancorar a identidade visual e a composição da cena

03

Escolha a proporção (16:9 ou 9:16), a duração (4s, 6s ou 8s) e o nível de qualidade (Pro para 4K, Rápido para velocidade)

04

Habilite o áudio nativo para gerar diálogos, efeitos sonoros e paisagens sonoras ambientais automaticamente junto com o vídeo

05

Estenda um clipe concluído em 7 segundos por vez, em até 20 iterações, para criar sequências narrativas mais longas sem precisar solicitar novamente

Melhores casos de uso do Veo 3.1

Melhores casos de uso do Veo 3.1

01

Publicidade cinematográfica: produza anúncios de produtos em 4K com diálogos sincronizados, música ambiente e movimentos realistas em uma geração

02

Pré-produção de curta-metragem: gere cenas com qualidade de storyboard com movimento de câmera e áudio nativo para avaliar antes da produção ao vivo

03

Conteúdo de podcast e palestrante: crie clipes de locutores com fala sincronizada para clipes de mídia social e vídeos explicativos

04

Conteúdo de natureza e viagens: gere cenas externas fotorrealistas com áudio ambiente em camadas — vento, água, vida selvagem — para trabalhos documentais

05

Rascunhos de vídeos educacionais: produza sequências visuais narradas onde um apresentador explica um conceito com áudio correspondente na tela

06

Série de campanhas de marca: use imagens de referência e extensão de vídeo para produzir narrativas de marca consistentes e multissegmentadas em 4K

Dicas de solicitação do Veo 3.1

Coloque o diálogo entre aspas e nomeie o personagem que fala para direcionar o mecanismo de sincronização labial para o assunto correto
Descreva explicitamente o ambiente de áudio - reverberação interna, vento externo, ruído da multidão ou guia de andamento da música para geração de ambiente
Use quadros iniciais e finais para controle preciso sobre transições de cena e posição do assunto no clipe
Execute Veo 3.1 Fast para testes rápidos de composição e direção de áudio e, em seguida, mude para Pro para a renderização final em 4K
Especifique o movimento da câmera em linguagem simples: "push-in lento", "órbita para a esquerda" ou "dolly track forward" produzem resultados confiáveis

Como usar o Veo 3.1

Escreva um prompt de cena detalhado com iluminação, movimento de câmera, sinais sonoros e diálogo para maximizar a geração conjunta de áudio e vídeo
Faça upload de imagens de referência para definir a aparência do personagem, o estilo visual da marca ou a composição ambiental que deve permanecer consistente
Use a geração específica de quadro para unir dois estados visuais conhecidos — um produto antes e depois ou uma transição dramática de cena
Encadeie chamadas de extensão de vídeo para criar sequências de vários segmentos, com cada extensão continuando a narrativa áudio e visual naturalmente
Use Veo 3.1 Fast para iteração na direção do prompt e conceito de áudio e, em seguida, use Pro para a versão final publicada

Perguntas frequentes sobre o Veo 3.1

Como o Veo 3.1 gera áudio nativo?

O Veo 3.1 usa um processo de difusão conjunta que gera áudio e vídeo simultaneamente, em vez de em estágios separados. Ele cria três camadas de áudio: diálogo sincronizado com os movimentos dos lábios dos personagens, efeitos sonoros sincronizados com as ações na tela e paisagens sonoras ambientais. O áudio é executado em estéreo de 48kHz com latência de aproximadamente 10ms em relação à trilha visual – bem dentro da tolerância de transmissão profissional.

Posso adicionar diálogos aos vídeos do Veo 3.1?

Sim. Especifique o diálogo diretamente no seu prompt, colocando o texto falado entre aspas e nomeando o personagem falado. O Veo 3.1 gera a fala correspondente sincronizada com os movimentos labiais do personagem. Ele suporta vários alto-falantes e lida com conversas naturais em um único clipe.

O que é extensão de vídeo e quantas vezes posso usá-la?

A extensão de vídeo adiciona 7 segundos a um clipe Veo gerado anteriormente, continuando tanto a narrativa visual quanto o ambiente de áudio de onde o original terminou. Você pode estender um clipe até 20 vezes, construindo uma sequência de aproximadamente 148 segundos. A extensão está disponível para saída 720p e o vídeo deve ser um clipe gerado pelo Veo.

Qual é a diferença entre Veo 3.1 Pro e Veo 3.1 Fast?

Veo 3.1 Pro oferece qualidade de saída máxima com suporte total a 4K e a mais alta aderência imediata, adequada para trabalhos criativos em estágio final. Veo 3.1 Fast gera com menor latência e menor custo, tornando-o prático para iteração rápida – testando sinais de áudio, composição e direção de cena antes de se comprometer com uma renderização Pro.

Quantas imagens de referência posso usar com o Veo 3.1?

O Veo 3.1 aceita até 3 imagens de referência por geração para orientar o conteúdo. As imagens de referência podem especificar a aparência do personagem, a identidade visual do produto, o design do ambiente ou as restrições de composição. Eles trabalham em conjunto com o prompt de texto para ancorar a saída a requisitos visuais específicos.

Quais resoluções e durações o Veo 3.1 suporta?

Veo 3.1 gera vídeo 720p, 1080p ou 4K a 24fps. As durações de clipe suportadas são 4 segundos, 6 segundos e 8 segundos por geração. As proporções incluem paisagem 16:9 e retrato 9:16. A opção 4K está disponível para Veo 3.1 Pro e não está disponível para a variante Lite.