Fonctionnalités du générateur vidéo AI HappyHorse 1.0
Architecture conjointe audio-vidéo
HappyHorse 1.0 exécute un transformateur d'auto-attention unifié à 40 couches qui traite simultanément les jetons texte, image, vidéo et audio en une seule passe. Il n'y a pas de modules d'attention croisée ni d'étape de post-traitement Foley distincte. L'audio est planifié avec le mouvement dès le départ : la synchronisation labiale, le son ambiant et l'action visuelle sont cohérents par conception, et ne sont pas assemblés une fois la génération terminée.
Mode d'édition vidéo avec images de référence
Téléchargez un clip vidéo existant et rédigez une instruction textuelle pour le modifier. HappyHorse 1.0 prend en charge les modifications locales (changement de vêtements, de couleur ou d'attributs spécifiques) et les modifications globales telles que la transformation de style ou d'arrière-plan, tout en préservant le mouvement et la structure temporelle du clip d'origine. Ajoutez jusqu'à 5 images de référence pour spécifier l'apparence cible exacte de la sortie modifiée.
Synchronisation labiale multilingue en 7 langues
La synchronisation labiale native est générée parallèlement à la vidéo en anglais, mandarin, cantonais, japonais, coréen, allemand et français, le tout dans la même architecture en un seul passage. Les personnages parlent avec des mouvements de bouche synchronisés sans superposition de voix séparée ni étape d'alignement de post-production. HappyHorse 1.0 génère également des sons Foley et de l'audio ambiant de manière native dans la même passe de génération.
Cohérence du sujet de la référence à la vidéo
Téléchargez des images ou des vidéos de référence pour établir une apparence cohérente des personnages, une identité de produit ou un style visuel dans les clips générés. HappyHorse 1.0 lit les ressources de référence et applique leurs qualités visuelles (structure du visage, vêtements, texture du matériau) à la vidéo générée tout en appliquant un mouvement naturel et le comportement de la caméra à partir de l'invite de texte.
Sortie multiformat pour toutes les plateformes
Le HappyHorse 1.0 produit des vidéos en 720p ou 1080p dans cinq formats d'image : 16:9, 9:16, 1:1, 4:3 et 3:4, couvrant toute la gamme des plateformes sociales, de streaming et de médias traditionnels. Toutes les sorties bénéficient de tous les droits commerciaux. Le modèle est accessible via le partenariat officiel fal.ai API avec la prise en charge des SDK Python et JavaScript.