Wird die KI auch Hollywood ersetzen?
In letzter Zeit sind beeindruckende Video-Memes aufgetaucht, die mit Hilfe von künstlicher Intelligenz (KI) erstellt wurden. Ein Beispiel ist eine Harry-Potter-Version eines Balenciaga-Werbespots sowie verstörende Aufnahmen von Will Smith, wie er Spaghetti isst. Diese Videos verdeutlichen, wie schnell sich die Fähigkeit der KI entwickelt, Videos zu erstellen, und wie problematisch einige Anwendungen der Technologie sein können.
Diese Videos erinnern an den Zeitpunkt im vergangenen Jahr, als KI-Bildbearbeitungstools weit verbreitet wurden. Programme wie Craiyon (früher bekannt als DALL-E Mini) ermöglichten es jedem, erkennbare, aber oft grobe und surreale Bilder zu erzeugen, wie beispielsweise Überwachungsaufnahmen von Babys, die eine Tankstelle überfallen, Gerichtsskizzen von Darth Vader oder Elon Musk, der Crayons isst. Craiyon war ein Open-Source-Klon des damals sorgfältig eingeschränkten DALL-E 2 Bildgenerators von OpenAI, dem Unternehmen hinter ChatGPT. Das Tool war das erste, das die Fähigkeit der KI zeigte, eine Textvorlage in scheinbar echte Fotos und von Menschen gezeichnete Illustrationen umzuwandeln. Seitdem ist DALL-E für jeden zugänglich, und Programme wie Midjourney und Dream Studio haben ähnliche Tools entwickelt und verfeinert, sodass komplexe und realistische Bilder mit wenigen Klicks auf einer Tastatur relativ leicht hergestellt werden können.
Durch das Feintuning der Algorithmusparameter und der Erhöhung der Trainingsdaten sowie des Einsatzes von mehr GPUs sind diese Bildgeneratoren unglaublich gut darin geworden, Realität zu fälschen. Der breite Zugang zu dieser Technologie und deren Raffinesse zwingt uns, unser Verständnis von Online-Bildern zu überdenken, wie im vergangenen Monat deutlich wurde, als virale KI-generierte Bilder vermeintlich die Verhaftung von Donald Trump zeigten. Dies führte dazu, dass Midjourney ankündigte, dass es keine kostenlose Testversion mehr anbieten würde – eine Maßnahme, die einige geizige Schurken abschrecken könnte, aber das eigentliche Problem unberührt lässt.
Algorithmen haben immer noch Schwierigkeiten, überzeugende Videos aus einer Vorlage zu generieren. Das Erstellen vieler Einzelbilder ist rechenintensiv, und wie die heutigen zitternden und ruckelnden Videos zeigen, ist es für Algorithmen schwierig, genügend Kohärenz zwischen den Einzelbildern aufrechtzuerhalten, um ein sinnvolles Video zu produzieren.
Allerdings werden KI-Tools immer geschickter im Bereich der Videobearbeitung. Das Balenciaga-Meme sowie Versionen, die sich auf Friends und Breaking Bad beziehen, wurden durch die Kombination mehrerer KI-Tools erstellt, zuerst zur Erzeugung von Standbildern und dann zur Hinzufügung einfacher Animations-Effekte. Das Endergebnis ist dennoch beeindruckend. Runway ML, ein Startup, das KI-Tools für professionelle Bild- und Videobearbeit entwickelt, hat diese Woche eine neue, effizientere Technik zur Anwendung von stilistischen Veränderungen an Videos eingeführt.
Unterschiedliche maschinelle Lerntechniken eröffnen neue Möglichkeiten. Ein Unternehmen namens Luma AI nutzt beispielsweise eine Technik namens neuronale Strahlungsfelder, um 2D-Fotografien in detaillierte 3D-Szenen umzuwandeln. Lade ein paar Schnappschüsse in die App des Unternehmens, und du hast eine vollständig interaktive 3D-Szene zum Spielen.
Diese Clips deuten darauf hin, dass wir an einem Wendepunkt für KI-Videoproduktionen stehen. Wie bei der KI-Bildgenerierung könnte eine wachsende Flut von Memes von signifikanten Verbesserungen in der Qualität und Kontrollierbarkeit von KI-Videos begleitet werden, die die Technologie an vielen Orten etablieren. KI könnte für einige Filmemacher zur Muse werden. Runways Tools wurden von den visuellen Effektkünstlern in Hollywood genutzt, darunter auch Namen von Oscar Gewinnern.
Aber es reicht schon ein Blick darauf, wie fortschrittlich die Bilder von Midjourney und Dream Studio inzwischen sind, um zu erahnen, wohin die KI-Videoentwicklung führt und wie schwierig es sein kann, echte Clips von gefälschten zu unterscheiden. Natürlich können Menschen bereits Videos mit bestehender Technologie manipulieren, aber es ist immer noch relativ teuer und schwierig zu bewerkstelligen.
Die schnellen Fortschritte in der generativen KI könnten sich in einer Zeit als gefährlich erweisen, in der Social Media militarisiert wurde und Deepfakes das Spielzeug von Propagandisten sind.
Zurzeit ist der Instinkt, Video-Clips zu vertrauen, größtenteils zuverlässig, aber es könnte nicht mehr lange dauern, bis das von uns gesehene Filmmaterial weniger solide und wahrheitsgemäß ist als früher. In Zukunft kann dann jeder mit einer guten Idee einen komplexen Film generieren und somit sich und seine Visionen ausdrücken.
Das wird zahlreiche Branchen verändern und völlig neu ordnen. Das eröffnet soviele Möglichkeiten wie bei der Entstehung des Internets.