Die Einführung von Sora von OpenAI öffnete die Türen für KI-gestützte Videogenerierungs-Apps, die kurze Clips aus Textaufforderungen erstellen können. Nun ist auch Google in den Kampf eingestiegen und hat diese Woche auf seiner jährlichen I/O Developer Conference seine eigene Videogenerierungs-KI-App namens Veo angekündigt.
Wie viele andere neu angekündigte KI-Tools ist der neue Videogenerator jedoch noch nicht für die öffentliche Nutzung verfügbar. Google plant, Künstlern und Kreativen die Möglichkeit zu geben, das Tool in Crowdsourcing-Übungen auszuprobieren, um es so zu verbessern. Hier erfahren Sie, was wir sonst noch über Google Veo erfahren haben.
Was kann Veo?
Google Veo kann 1080p-Videos mit einer Länge von über einer Minute erstellen und diese auch anhand schriftlicher Anweisungen bearbeiten. Es kann sicherstellen, dass die Frames visuell konsistent sind, und Benutzer können eine einzelne Eingabeaufforderung oder eine Reihe von Eingabeaufforderungen verwenden, die eine Erzählung erstellen. Das Tool kann filmische Effekte wie Luftaufnahmen einbinden und hochdetaillierte Szenen erstellen.
Beim Erstellen von Videos mit Veo können Sie Realismus, Surrealismus und sogar Animationen erzielen. Darüber hinaus können Sie Filmbefehle verwenden und Begriffe wie „Luftaufnahme“ und „Zeitraffer“ verstehen. Im Vergleich zu früheren KI-Videogeneratoren, die Google angekündigt hat, bietet Veo mehr Kontrolle und liefert Videos in besserer Qualität.
Veo unterstützt auch maskierte Bearbeitung, mit der Sie Anpassungen an bestimmten Abschnitten des Videos vornehmen können. Sie können dies tun, indem Sie einen Maskenbereich in die Eingabeaufforderung einfügen. Außerdem können Bilder zusammen mit Textaufforderungen verwendet werden, um Videos zu generieren.
In einem solchen Fall wird das bereitgestellte Bild als Referenz verwendet und ein Video im gleichen Stil generiert, wie das folgende Video, das mit einem Bild von Alpakas in Strickpullovern und der Eingabeaufforderung generiert wurde Alpacas dancing to the beat
.
Wie funktioniert Veo?
Video-KI-Modelle müssen die Eingabeaufforderung, die ihnen bereitgestellt wird, richtig verstehen und diese Informationen mit verfügbaren Referenzen kombinieren. Veo wurde so konzipiert, dass es natürliche Sprache und Bilder außergewöhnlich gut versteht, wodurch es Videos präzise erstellen kann, auch solche mit vielen Details.
Aus diesem Grund Timelapse of a common sunflower opening, dark background
kann Ihnen ein schnelles „Like“ ein Video von sehr hoher Qualität liefern.
Laut Google verbessert Veo andere zuvor vom Unternehmen angekündigte Tools zur Videogenerierung wie Lumiere, VideoPoet, WALT usw. durch die Verwendung komprimierter latenter Videonutzungen. Im Gegensatz zu diesen Tools wird Veo anhand detaillierter Videountertitel trainiert, was der KI hilft, die Eingabeaufforderungen besser zu verstehen.
Google gibt an, dass der Videogenerator auf Latent-Diffusion-Transformatoren basiert, die Konsistenz gewährleisten und verhindern, dass Charaktere und Objekte zwischen Szenen flimmern und springen. Außerdem verwendet er Latents, komprimierte Darstellungen von Videos, die ihn effizienter machen und zur Leistungssteigerung beitragen. Dank dieser Technologie kann Veo in kürzerer Zeit qualitativ hochwertige Videos erstellen.
Mit Veo erstellte Videos werden mit Googles SynthID als Wasserzeichen versehen. Damit wird Googles KI-generierter Inhalt identifiziert, ähnlich wie Sora von OpenAI es mit dem Standard der Coalition for Content Provenance and Authenticity (C2PA) macht.
Darüber hinaus gibt es Gedächtnisprüfungsprozesse und Sicherheitsfilter, um Voreingenommenheit, Urheberrechts- und Datenschutzrisiken zu reduzieren. Trotz dieser Technologien und Prozesse muss Veo noch verbessert werden, da Hintergründe immer noch dazu neigen, sich zu verschieben und sehr detaillierte Bereiche nicht sehr gut zusammengefügt zu sein scheinen. Aus diesem Grund erlaubt Google nur wenigen Entwicklern, es zu testen.
Wie können Sie Veo verwenden?
Wie oben erwähnt, ist Veo derzeit nicht für die öffentliche Nutzung verfügbar und Google erlaubt nur einigen ausgewählten Entwicklern, das Tool auszuprobieren. Sie können es mit VideoFX ausprobieren, einem weiteren experimentellen Tool, das in Google Labs verfügbar ist, wo alle derzeit getesteten Produkte von Google vorhanden sind.
Wenn Sie ein Entwickler sind und Veo ausprobieren möchten,
- Besuchen Sie die Google Labs-Website, um sich auf die Warteliste setzen zu lassen.
- Geben Sie Ihre Daten ein und senden Sie sie ab.
- Warten Sie, bis Google Ihren Beitrag überprüft hat. Wenn er für geeignet befunden wird, dürfen Sie Veo ausprobieren.
Google Veo ist der neueste in einer langen Reihe von KI-gestützten Videogeneratoren, die von Google angekündigt wurden, und scheint der bisher leistungsstärkste zu sein. Sie können damit nicht nur Videos mit verschiedenen Stilen und Effekten erstellen, sondern auch erstellte Videos problemlos bearbeiten.
Wir haben erklärt, wie Entwickler sich auf die Warteliste setzen lassen und das Tool selbst ausprobieren können, aber es gibt keine Informationen darüber, ob Veo öffentlich eingeführt wird. Google hat lediglich angedeutet, dass einige der Funktionen des Tools in YouTube-Shorts enthalten sein könnten, also darf man sich darauf freuen.
Schreibe einen Kommentar