Wan 2.7 AI-Videogenerator

Wan 2.7

Wan 2.7 KI-Videogenerator

Wan 2.7 ist Alibabas Tongyi Wanxiang-Videomodell mit Denkmodus – einer integrierten Gedankenkette, die vor der Erzeugung eines einzelnen Pixels Komposition, Motivplatzierung und Bewegungslogik plant. Es unterstützt vier Generierungsmodi: Text-zu-Video, Bild-zu-Video mit Steuerung des ersten und letzten Keyframes, Referenz-zu-Video für Konsistenz des Motivs und anleitungsbasierte Videobearbeitung – alles mit bis zu 1080p und nativem Audio.

Denkmodus: Das Gedankenkettendenken plant Komposition, Subjektplatzierung und Bewegungslogik, bevor die Generierung beginntVier Generierungsmodi in einem Modell: T2V, I2V mit Keyframe-Steuerung, R2V für Motivkonsistenz und VideobearbeitungKeyframe-Steuerung des ersten und letzten Frames – definieren Sie den genauen visuellen Anfang und das Ende jedes ÜbergangsUnterstützung mehrerer Referenzen: bis zu 9 Referenzbilder und Videoreferenzen für eine konsistente Charakter- und Objektidentität

Wan 2.7

Veröffentlicht im April 2026 vom Tongyi Lab von Alibaba. Der Denkmodus verarbeitet Ihre Eingabeaufforderung durch Gedankenkettenbegründung vor, um kohärentere Kompositionen zu erhalten. Verwenden Sie T2V für Eingabeaufforderungen, I2V für die Keyframe-Steuerung, R2V für Themenkonsistenz und Video Edit für anweisungenbasierte Änderungen.

Vorschau des Denkmodus Wan 2.7

Wan 2.7 begründet Ihre Eingabeaufforderung vor der Generierung – wodurch präzisere Kompositionen mit komplexen Szenen mit mehreren Elementen entstehen.

Wan 2.7

Vorschau des Denkmodus Wan 2.7

Wan 2.7 begründet Ihre Eingabeaufforderung vor der Generierung – wodurch präzisere Kompositionen mit komplexen Szenen mit mehreren Elementen entstehen.

Funktionen des KI-Videogenerators Wan 2.7

Argumentation im Denkmodus

Der Denkmodus von Wan 2.7 führt vor Beginn der Generierung eine Gedankenkette aus. Das Modell analysiert Ihre Eingabeaufforderung, plant die Platzierung des Motivs, die Bewegungsrichtung, die Kamerakomposition und Audiohinweise und überprüft dann, ob der Plan kohärent ist, bevor Videobilder generiert werden. Dies führt zu deutlich genaueren Kompositionen, weniger räumlichen Artefakten und einer stärkeren Einhaltung komplexer Mehrsubjekt-Eingabeaufforderungen, die durch einfachere Modelle verzerrt werden.

Vier einheitliche Generierungsmodi

Wan 2.7 umfasst Text-zu-Video für eine rein promptgesteuerte Generierung mit Denkmodus, Bild-zu-Video mit Steuerung des ersten und letzten Keyframes für präzise Szenenübergänge, Referenz-zu-Video (R2V) für die Konsistenz von Subjekten und Objekten mit mehreren Referenzen sowie Videobearbeitung für die anweisungsbasierte Änderung bestehender Clips. Alle vier Modi nutzen dieselbe Wan 2.7 API Infrastruktur und ein einheitliches Kreditsystem.

Steuerung des ersten und letzten Keyframes

Laden Sie ein Startbild, ein Endbild oder beides hoch, um die visuellen Grenzen eines generierten Clips genau zu definieren. Wan 2.7 interpoliert kohärente Bewegungen zwischen den angegebenen Bildern und erzeugt so einen kontrollierten Übergang, der die Komposition, Farbe und Motivpositionen in beiden Bildern berücksichtigt. Dies macht es ideal für Produktpräsentationen, Umgebungsumwandlungen und Szene-zu-Szene-Schnitte.

Konsistenz zwischen Referenz und Videothema

Laden Sie Bild- oder Videoreferenzen als Eingaben in den R2V-Modus hoch. Wan 2.7 extrahiert das Erscheinungsbild des Charakters, die Kleidungsfarbe, die Materialbeschaffenheit und die Objektidentität aus den Referenzen und wendet sie konsistent im gesamten generierten Video an. Es werden sowohl Bildreferenzen als auch Videoreferenzen unterstützt, was die Konsistenz von Charakter und Produkt über verschiedene Szenen und Kamerawinkel hinweg ermöglicht.

Anleitungsbasierte Videobearbeitung

Der Videobearbeitungsmodus akzeptiert ein vorhandenes Quellvideo und eine Anweisung in natürlicher Sprache, die die Zieländerung beschreibt. Wan 2.7 wendet lokale Bearbeitungen an – Stilübertragung, Farbänderungen, Objektersetzung, Hintergrundmodifikation – und behält dabei die ursprüngliche Bewegungsstruktur und zeitliche Konsistenz bei. Fügen Sie bis zu 5 Referenzbilder hinzu, um das gewünschte visuelle Erscheinungsbild für die bearbeitete Ausgabe festzulegen.

So verwenden Sie Wan 2.7

Wählen Sie den Generierungsmodus: T2V für Eingabeaufforderungen, I2V für die Keyframe-Steuerung, R2V für Referenzkonsistenz oder Videobearbeitung für Änderungen

Schreiben Sie eine detaillierte Eingabeaufforderung – Thinking Mode wird diese vor der Generierung durchdenken, sodass komplexe Eingabeaufforderungen mit mehreren Elementen besonders gut funktionieren

Laden Sie für I2V ein erstes Bild, ein letztes Bild oder beides hoch, um die genauen visuellen Start- und Endpunkte des Clips festzulegen

Laden Sie für R2V Referenzbilder und Videos hoch, um im gesamten generierten Video ein einheitliches Erscheinungsbild von Subjekt und Objekt zu gewährleisten

Stellen Sie vor dem Absenden die Auflösung (720p oder 1080p), das Seitenverhältnis (16:9, 9:16 oder 1:1), die Dauer und die Bildrate ein

Wählen Sie den Generierungsmodus: T2V für Eingabeaufforderungen, I2V für die Keyframe-Steuerung, R2V für Referenzkonsistenz oder Videobearbeitung für Änderungen

Laden Sie für I2V ein erstes Bild, ein letztes Bild oder beides hoch, um die genauen visuellen Start- und Endpunkte des Clips festzulegen

Laden Sie für R2V Referenzbilder und Videos hoch, um im gesamten generierten Video ein einheitliches Erscheinungsbild von Subjekt und Objekt zu gewährleisten

Stellen Sie vor dem Absenden die Auflösung (720p oder 1080p), das Seitenverhältnis (16:9, 9:16 oder 1:1), die Dauer und die Bildrate ein

Beste Wan 2.7-Anwendungsfälle

Szenenübergänge und Enthüllungen: Verwenden Sie I2V für das erste und letzte Bild, um präzise Produktenthüllungs- oder Umgebungstransformationssequenzen zu erzeugen

Charakterkonsistente Inhaltsserien: Verwenden Sie R2V mit Referenzbildern, um mehrere Clips mit derselben Person, demselben Avatar oder demselben Produkt zu erstellen

Videolokalisierung und Neugestaltung: Verwenden Sie Video Edit, um neue Kleidung, Hintergründe oder Farbpaletten auf vorhandenes Kampagnenmaterial anzuwenden

Komplexe Erzählszenen: Verwenden Sie den Denkmodus, um Aufforderungen mit mehreren Themen und mehreren Kameras zu verarbeiten, die eine starke räumliche Kohärenz erfordern

Audiovisuelle Kurzclips: Stellen Sie eine Audiodatei bereit, um Beat-angepasste Bewegungen oder Lippensynchronisation für Musikvideos oder Sprecherinhalte zu ermöglichen

Produktkatalogvideos: Verwenden Sie die Keyframe-Steuerung, um konsistente Start- und Enthüllungssequenzen für jedes Produkt in einem Katalog zu erstellen

Tipps zur Eingabeaufforderung Wan 2.7

Schreiben Sie detaillierte Eingabeaufforderungen mit mehreren Elementen – Der Denkmodus ist für komplexe Anweisungen optimiert, die einfachere Modelle mit direkter Generierung verwirren würden

Verwenden Sie die Steuerung des ersten und letzten Bildes, um Szenenübergänge präzise zu definieren, insbesondere für Produktpräsentationen oder Umgebungstransformationen

Stellen Sie im R2V-Modus Referenzbilder für jedes einzelne Motiv bereit – mehr Referenzwinkel geben dem Modell besseres Material und sorgen so für Konsistenz

Beschreiben Sie im Videobearbeitungsmodus den gewünschten Endzustand des Videos und nicht den Änderungsvorgang – positive Beschreibungen führen zu klareren Ergebnissen

Geben Sie Details zur Audioumgebung in T2V-Eingabeaufforderungen an, wenn die Audioerzeugung aktiviert ist – Umgebungsgeräusche, Dialoghinweise und Musiktyp beeinflussen die Ausgabe

So verwenden Sie Wan 2.7

Verwenden Sie den T2V-Modus mit einer detaillierten Eingabeaufforderung und überlassen Sie die Kompositionsplanung für komplexe Szenen mit mehreren Themen oder mehreren Aktionen dem Thinking-Modus

Legen Sie den ersten und letzten Keyframe im I2V-Modus fest, um einen präzisen visuellen Übergang zwischen zwei definierten Zuständen zu erzeugen – Produkt vorher und nachher, Umgebungsänderung

Laden Sie Charakter- oder Produktreferenzbilder im R2V-Modus hoch, um ein einheitliches Erscheinungsbild über alle generierten Videosegmente und Kamerawinkel hinweg zu gewährleisten

Verwenden Sie den Videobearbeitungsmodus, um einen vorhandenen Clip hochzuladen und Kleidung, Hintergrund, Farbabstufung oder Stil mit einer Textanweisung und optionalen Referenzbildern zu ändern

Stellen Sie Audioeingabedateien im WAV- oder MP3-Format bereit, um lippensynchrone oder beatangepasste Bewegungen im T2V- und I2V-Modus zu steuern

Wan 2.7 FAQ

Was ist der Denkmodus in Wan 2.7?

Der Denkmodus ist eine in Wan 2.7 integrierte Gedankenkette. Bevor Frames generiert werden, analysiert das Modell Ihre Eingabeaufforderung, plant die Komposition, bestimmt die Platzierung des Motivs und die Bewegungsrichtung, überprüft die räumliche Kohärenz und beginnt dann mit der Generierung. Dies führt zu deutlich besseren Ergebnissen bei komplexen Eingabeaufforderungen mit mehreren Themen, komplizierten Szenenlayouts oder detaillierten Kameraanweisungen im Vergleich zu Modellen, die ohne Planungsphase direkt aus Text generiert werden.

Was ist der Unterschied zwischen den I2V- und R2V-Modi in Wan 2.7?

Image-to-Video (I2V) verwendet Keyframe-Bilder – insbesondere das erste Bild, das letzte Bild oder beide –, um den visuellen Start- und Endstatus des Clips zu definieren. Referenz-zu-Video (R2V) verwendet Referenzbilder und -videos, um im gesamten Clip ein einheitliches Erscheinungsbild, Kleidung und Objektidentität des Motivs zu gewährleisten, unabhängig von Kamerawinkel oder Szenenwechseln. I2V steuert Szenengrenzen; R2V steuert die Betreffkonsistenz.

Wie funktioniert die Videobearbeitung in Wan 2.7?

Der Videobearbeitungsmodus akzeptiert einen vorhandenen Videoclip und eine Anleitung in natürlicher Sprache. Wan 2.7 wendet die Bearbeitung an und behält dabei die Bewegungsstruktur und die zeitliche Konsistenz bei. Änderungen können lokal (Änderung eines bestimmten Attributs wie Kleidungsfarbe oder Produktdetails) oder global (Änderung der gesamten Szenenbeleuchtung oder des visuellen Stils) erfolgen. Es können bis zu 5 Referenzbilder bereitgestellt werden, um das gewünschte visuelle Erscheinungsbild für die bearbeitete Ausgabe festzulegen.

Unterstützt Wan 2.7 die Audiogenerierung?

Ja. Wan 2.7 unterstützt die native Audioerzeugung einschließlich Lippensynchronisation für gesprochene Inhalte und Umgebungsgeräusche. Sie können auch Audioeingabedateien im WAV- oder MP3-Format (3–30 Sekunden, bis zu 15 MB) bereitstellen, um beatangepasste Bewegungen oder die direkte Lippensynchronisation zu ermöglichen. Audioeingänge werden in den Modi T2V und I2V unterstützt.

Welche Auflösung und Dauer unterstützt Wan 2.7?

Wan 2.7 generiert 720p- oder 1080p-Videos mit 16 Bildern pro Sekunde oder 24 Bildern pro Sekunde. Die Modi T2V und I2V unterstützen Clips mit einer Länge von bis zu 15 Sekunden. Die Modi R2V und Videobearbeitung unterstützen Clips mit einer Länge von bis zu 10 Sekunden. Zu den Seitenverhältnissen gehören 16:9, 9:16 und 1:1. Die T2V-14B-Variante liefert maximale Qualität; T2V-1.3B Turbo bietet eine schnellere Erzeugung bei geringeren Kreditkosten.

Wie schneidet Wan 2.7 im Vergleich zu HappyHorse 1.0 ab?

Wan 2.7 bietet Denkmodus-Argumentation für komplexe Kompositionsaufforderungen, Keyframe-Steuerung für präzise Szenenübergänge und vier Generierungsmodi aus einem Modell. HappyHorse 1.0 konzentriert sich auf die gemeinsame Audio-Video-Erzeugung in einem einzigen Durchgang mit nativer Lippensynchronisation in 7 Sprachen und einem Videobearbeitungsmodus, der von bis zu 5 Referenzbildern unterstützt wird. Beide Modelle sind auf Lovimg verfügbar und bedienen unterschiedliche Produktionsabläufe.