Gerador de vídeo Wan 2.7 AI

Wan 2.7

Gerador de vídeo Wan 2.7 AI

Wan 2.7 é o modelo de vídeo Tongyi Wanxiang do Alibaba com Thinking Mode – uma camada de raciocínio de cadeia de pensamento integrada que planeja a composição, o posicionamento do assunto e a lógica de movimento antes de gerar um único pixel. Ele suporta quatro modos de geração: texto para vídeo, imagem para vídeo com controle de primeiro e último quadro-chave, referência para vídeo para consistência de assunto e edição de vídeo baseada em instruções – tudo em até 1080p com áudio nativo.

Modo de pensamento: o raciocínio em cadeia de pensamento planeja a composição, o posicionamento do assunto e a lógica do movimento antes do início da geraçãoQuatro modos de geração em um modelo: T2V, I2V com controle de quadro-chave, R2V para consistência de assunto e Edição de vídeoControle de quadro-chave do primeiro e do último quadro — defina o início e o fim visual exato de cada transiçãoSuporte multi-referência: até 9 imagens de referência e referências de vídeo para identidade consistente de personagens e objetos

Wan 2.7

Lançado em abril de 2026 pelo Tongyi Lab do Alibaba. O Modo de pensamento pré-processa seu prompt por meio de raciocínio em cadeia de pensamento para composições mais coerentes. Use T2V para prompts, I2V para controle de quadro-chave, R2V para consistência de assunto e Edição de vídeo para modificação baseada em instruções.

Visualização do modo de pensamento Wan 2.7

Wan 2.7 raciocina através de seu prompt antes de gerar - produzindo composições mais precisas com cenas complexas de vários elementos.

Wan 2.7

Visualização do modo de pensamento Wan 2.7

Wan 2.7 raciocina através de seu prompt antes de gerar - produzindo composições mais precisas com cenas complexas de vários elementos.

Visualização do modo de pensamento Wan 2.7 2

Recursos do gerador de vídeo Wan 2.7 AI

Raciocínio do Modo de Pensamento

O Modo de Pensamento do Wan 2.7 executa uma camada de raciocínio em cadeia de pensamento antes do início da geração. O modelo analisa seu prompt, planeja o posicionamento do assunto, a direção do movimento, a composição da câmera e as dicas de áudio e, em seguida, verifica se o plano é coerente antes de gerar qualquer quadro de vídeo. Isso produz composições significativamente mais precisas, menos artefatos espaciais e uma adesão mais forte a solicitações complexas de vários assuntos que os modelos mais simples distorcem.

Quatro modos de geração unificados

Wan 2.7 cobre texto para vídeo para geração pura orientada por prompt com Thinking Mode, imagem para vídeo com controle de primeiro e último quadro-chave para transições de cena precisas, referência para vídeo (R2V) para assunto de referência múltipla e consistência de objeto e edição de vídeo para modificação baseada em instruções de clipes existentes. Todos os quatro modos compartilham a mesma infraestrutura Wan 2.7 API e sistema de crédito unificado.

Controle do primeiro e do último quadro-chave

Carregue uma imagem de quadro inicial, uma imagem de quadro final ou ambas para definir com precisão os limites visuais de um clipe gerado. Wan 2.7 interpola o movimento coerente entre os quadros especificados, produzindo uma transição controlada que respeita a composição, a cor e as posições do assunto em ambas as imagens. Isso o torna ideal para revelações de produtos, transformações de ambiente e cortes cena a cena.

Consistência do assunto da referência ao vídeo

Carregue referências de imagem ou vídeo como entradas para o modo R2V. Wan 2.7 extrai a aparência do personagem, a cor das roupas, a textura do material e a identidade do objeto das referências e as aplica de forma consistente em todo o vídeo gerado. São suportadas referências de imagem e de vídeo, permitindo consistência de personagens e produtos em diferentes cenas e ângulos de câmera.

Edição de vídeo baseada em instruções

O modo Edição de vídeo aceita um vídeo de origem existente e uma instrução em linguagem natural descrevendo a alteração de destino. Wan 2.7 aplica edições locais – transferência de estilo, alterações de cores, substituição de objetos, modificação de fundo – preservando a estrutura de movimento original e a consistência temporal. Adicione até 5 imagens de referência para especificar a aparência visual desejada para a saída editada.

Como usar Wan 2.7

Selecione o modo de geração: T2V para prompts, I2V para controle de quadro-chave, R2V para consistência de referência ou Edição de vídeo para modificação

Escreva um prompt detalhado - o Modo de Pensamento irá raciocinar sobre ele antes da geração, portanto, prompts complexos de vários elementos funcionam particularmente bem

Para I2V, carregue uma imagem do primeiro quadro, uma imagem do último quadro ou ambas para definir os pontos visuais exatos de início e fim do clipe

Para R2V, carregue imagens e vídeos de referência para estabelecer uma aparência consistente do assunto e do objeto em todo o vídeo gerado

Defina a resolução (720p ou 1080p), proporção (16:9, 9:16 ou 1:1), duração e taxa de quadros antes de enviar

Selecione o modo de geração: T2V para prompts, I2V para controle de quadro-chave, R2V para consistência de referência ou Edição de vídeo para modificação

Escreva um prompt detalhado - o Modo de Pensamento irá raciocinar sobre ele antes da geração, portanto, prompts complexos de vários elementos funcionam particularmente bem

Para I2V, carregue uma imagem do primeiro quadro, uma imagem do último quadro ou ambas para definir os pontos visuais exatos de início e fim do clipe

Para R2V, carregue imagens e vídeos de referência para estabelecer uma aparência consistente do assunto e do objeto em todo o vídeo gerado

Defina a resolução (720p ou 1080p), proporção (16:9, 9:16 ou 1:1), duração e taxa de quadros antes de enviar

Melhores casos de uso de Wan 2.7

Transições e revelações de cena: use o primeiro e o último quadro I2V para produzir revelação precisa de produto ou sequências de transformação de ambiente

Série de conteúdo consistente com personagens: use R2V com imagens de referência para gerar vários clipes apresentando a mesma pessoa, avatar ou produto

Localização e reformulação de vídeo: use a Edição de vídeo para aplicar novas roupas, planos de fundo ou paletas de cores às filmagens de campanha existentes

Cenas narrativas complexas: use o Modo de Pensamento para lidar com solicitações de vários assuntos e múltiplas câmeras que exigem forte coerência espacial

Clipes curtos audiovisuais: fornecem um arquivo de áudio para gerar movimento com correspondência de batida ou sincronização labial para videoclipes ou conteúdo de alto-falante

Vídeos de catálogo de produtos: use o controle de quadro-chave para produzir sequências consistentes de início e revelação para cada produto em um catálogo

Dicas de solicitação do Wan 2.7

Escreva prompts detalhados de vários elementos - o Modo de pensamento é otimizado para instruções complexas que confundiriam modelos mais simples de geração direta

Use o controle do primeiro e do último quadro para definir transições de cena com precisão, especialmente para revelações de produtos ou transformações de ambiente

Fornece imagens de referência no modo R2V para cada assunto distinto – mais ângulos de referência fornecem ao modelo melhor material para manter a consistência

Para o modo Edição de vídeo, descreva o estado final desejado do vídeo em vez da operação de alteração – descrições positivas produzem resultados mais limpos

Especifique detalhes do ambiente de áudio em prompts T2V quando a geração de áudio estiver habilitada – som ambiente, dicas de diálogo e tipo de música influenciam a saída

Como usar Wan 2.7

Use o modo T2V com um prompt detalhado e deixe o Thinking Mode lidar com o planejamento da composição para cenas complexas com vários assuntos ou múltiplas ações

Defina o primeiro e o último quadro-chave no modo I2V para gerar uma transição visual precisa entre dois estados definidos – produto antes e depois, mudança de ambiente

Carregue imagens de referência de personagens ou produtos no modo R2V para manter a aparência consistente em segmentos de vídeo gerados e ângulos de câmera

Use o modo Edição de vídeo para fazer upload de um clipe existente e modificar roupas, plano de fundo, graduação de cores ou estilo com instruções de texto e imagens de referência opcionais

Forneça arquivos de entrada de áudio em formato WAV ou MP3 para gerar sincronização labial ou movimento com correspondência de batida nos modos T2V e I2V

Perguntas frequentes sobre Wan 2.7

O que é o modo de pensamento em Wan 2.7?

O Modo de Pensamento é uma camada de raciocínio de cadeia de pensamento incorporada ao Wan 2.7. Antes de gerar qualquer quadro, o modelo analisa seu prompt, planeja a composição, determina o posicionamento do assunto e a direção do movimento, verifica a coerência espacial e então inicia a geração. Isso produz resultados significativamente melhores em prompts complexos com vários assuntos, layouts de cena complexos ou instruções detalhadas da câmera em comparação com modelos gerados diretamente a partir de texto sem um estágio de planejamento.

Qual é a diferença entre os modos I2V e R2V em Wan 2.7?

Imagem para vídeo (I2V) usa imagens de quadro-chave – especificamente o primeiro quadro, o último quadro ou ambos – para definir os estados visuais inicial e final do clipe. A referência ao vídeo (R2V) usa imagens e vídeos de referência para estabelecer aparência consistente do sujeito, roupas e identidade do objeto ao longo do clipe, independentemente do ângulo da câmera ou das mudanças de cena. I2V controla os limites da cena; R2V controla a consistência do assunto.

Como funciona a edição de vídeo no Wan 2.7?

O modo de edição de vídeo aceita um videoclipe existente e instruções em linguagem natural. Wan 2.7 aplica a edição preservando a estrutura do movimento e a consistência temporal. As edições podem ser locais (alterando um atributo específico, como cor da roupa ou detalhe do produto) ou globais (alterando a iluminação geral da cena ou o estilo visual). Até 5 imagens de referência podem ser fornecidas para especificar a aparência visual desejada para a saída editada.

O Wan 2.7 suporta geração de áudio?

Sim. Wan 2.7 suporta geração de áudio nativo, incluindo sincronização labial para conteúdo falado e paisagens sonoras ambientais. Você também pode fornecer arquivos de entrada de áudio em formato WAV ou MP3 (3 a 30 segundos, até 15 MB) para gerar movimento com correspondência de batida ou geração direta de sincronização labial. As entradas de áudio são suportadas nos modos T2V e I2V.

Qual resolução e duração o Wan 2.7 suporta?

Wan 2.7 gera vídeo 720p ou 1080p a 16fps ou 24fps. Os modos T2V e I2V suportam clipes de até 15 segundos; Os modos R2V e edição de vídeo suportam clipes de até 10 segundos. As proporções incluem 16:9, 9:16 e 1:1. A variante T2V-14B oferece qualidade máxima; O T2V-1.3B Turbo oferece geração mais rápida com menor custo de crédito.

Como o Wan 2.7 se compara ao HappyHorse 1.0?

Wan 2.7 traz raciocínio do Modo de Pensamento para instruções de composição complexas, controle de quadro-chave para transições de cena precisas e quatro modos de geração de um modelo. HappyHorse 1.0 concentra-se na geração conjunta de áudio e vídeo em uma única passagem com sincronização labial nativa em 7 idiomas e um modo de edição de vídeo suportado por até 5 imagens de referência. Ambos os modelos estão disponíveis no Lovimg e atendem a diferentes fluxos de trabalho de produção.