Es gibt zahlreiche KI-basierte Text-zu-Video-Tools. Die Technologie ist zwar beeindruckend, doch das Endergebnis wirkt immer etwas merkwürdig. Es dauert eine Weile, das Problem zu identifizieren, aber letztendlich läuft es auf eines hinaus: den Uncanny-Valley-Effekt.
Sie können zwar einige KI-gestützte Tools zum Erstellen visueller Effekte in Ihren Videoprojekten verwenden, es ist jedoch nicht empfehlenswert, KI allein zum Erstellen von Videomaterial zu verwenden, da dies zu seltsam aussieht.
Das größte Problem mit KI-Text-zu-Video-Tools
Die KI-Videoproduktion hat dank der Fortschritte im Deep Learning in kurzer Zeit enorme Fortschritte gemacht. 2023, als die KI-Videoproduktion explosionsartig anstieg, erinnern Sie sich vielleicht an diesen Clip von Will Smith beim Spaghettiessen, der viral ging. Obwohl diese Technologie damals bahnbrechend war, lässt sich nicht leugnen, wie unnatürlich und unansehnlich sie aussah.
Im Jahr 2024 werden diese KI-Videotools immer besser und erzeugen flüssigere Bilder und realistischere Bewegungen. Sehen Sie sich den Unterschied zwischen Videos an, die 2023 mit Runway Gen-2 erstellt wurden, und Videos, die OpenAI 2024 zur Demonstration der Sora-KI veröffentlichte. Sora ist noch nicht öffentlich verfügbar, aber die Qualität ist vielversprechend:
Trotz der Verbesserungen sind die Ergebnisse noch nicht eindeutig. Erstens ist Sora noch nicht verfügbar, sodass wir weiterhin auf weniger ausgefeilte Generatoren angewiesen sind, die gruselige Ergebnisse wie Will Smiths Spaghetti-Video produzieren können.
Sehen Sie sich einfach das mit PixVerse erstellte Video mit der Aufforderung „Eine Person geht an einem sonnigen Tag durch einen Park, lächelt und winkt in die Kamera. Vögel fliegen über ihr und Bäume wiegen sich sanft im Wind.“ an .
Die ersten zwei Sekunden sehen gut aus, bis die Finger, Haare und das Gesicht der Person langsam verschwinden! Auch wenn fortschrittlichere Tools wie Sora auf den Markt kommen und uns präzisere und schönere Videos liefern, haben KI-generierte Menschen und Landschaften immer noch etwas Beunruhigendes an sich.
Während ältere Modelle oft Videos produzierten, in denen die KI deutlich zum Ausdruck kam, etwa Bilder im Claymation-Stil, wirken die Verbesserungen durch neuere Tools fast zu perfekt.
Unnatürlich, unangenehm und leblos. Genau das ist der Uncanny-Valley-Effekt – menschlich, aber nicht ganz.
Egal wie gut diese Tools sind, der Uncanny-Valley-Effekt bleibt bestehen. Sofern Sie nicht einen abstrakten, surrealen Stil anstreben, der aussieht, als hätten Sie ihn nur in Ihren Träumen gesehen, sollten Sie sich bei Ihren Videoprojekten nicht auf KI-Text-zu-Video-Tools verlassen.