| Thema: |
|
||
| Autor: | Blanko | ||
| Datum: | 23.05.25 10:30 | ||
| Antwort auf: | KI Teil 2 - Menschheit am Ende? von Rocco | ||
sorry für den KLickbait Titel - aber kommt schon hin. Disclaimer: das IST alles nach wie vor SEHR beeindruckend! V.a. wenn man überlegt, dass das Thema Text to Video ausgehend vom Sora Announcement damals gerademal 15 Monate her ist. (Und wirklich nutzbar ist Sora ja erst seit 6 Monaten - dazwischen kamen halt ein paar andere Player auf den Markt bzw. ins Rampenlicht wie Kling oder Runway). Also: Meckern auf sehr hohem Niveau, das auch keine lange Halbwertszeit haben wird :) Zum "Entlarven": Wenn man sich mal andere Versuche mit Veo3 anschaut als die offiziellen Demovideos bzw. welche, wo Leute versuchen möglichst perfekte Szenen zu generieren, sinkt der Wow-Moment recht schnell deutlich ab, weil klar wird, dass wir schon noch ein Stückchen zu gehen haben bis das perfekte Videos produziert. Schönes Beispiel: [https://youtu.be/KMMtbj3-1bM?si=AmAHYV8wNIWLRi5S] Da ist dann auch alles dabei, was man halt so von KI-Videos kennt: crazy eyes, schiefe Gesichter, unlogische Physik und vor allem "Nutzung des Raumes", wenn Charakter ins/aus dem Bild laufen, völlig wilde Untertitel + (quasi Veo3 exklusiv) unlogische Geräusche/Sound/Sprache etc. Das produziert teilweise doch recht drastische Logikfehler. Mir ist schon klar, dass man das ggf. mit besseren Regieanweisungen verbessern kann - in dem o.g. Beispiel geht es ja explizit darum, die KI einfach mal den Witz selber interpretieren zu lassen. Aber es ist halt auch nicht so, dass man jetzt mit Veo3 schon ohne weiteres perfekte Einzelszenen mit Sound produziert. Wie ja weiter unten schon bei dem Messe-Video diskutiert wurde sind selbst simple Talking Heads noch nicht perfekt - sobald die Szene dann komplexer wird, sinkt die Qualität nochmal stark ab. |
|||
| < antworten > | |||