Chinas erstes Sora-Level Text-to-Video-Großmodell Vidu enthüllt

german.china.org.cn |

28.04.2024

Chinas erstes Text-zu-Video-Großmodell auf Sora-Niveau, Vidu, wurde am Samstag auf dem Zhongguancun-Forum 2024 in Beijing vorgestellt und verschärft den weltweiten Wettbewerb um künstliche Intelligenz.

Vidu, das von der chinesischen KI-Firma Shengshu Technology und der Tsinghua-Universität entwickelt wurde, erklärte gegenüber China Daily, dass das Modell mit nur einem Klick ein hochauflösendes Video von 16 Sekunden Länge und 1080p-Auflösung erstellen könne. Nach Angaben des Unternehmens handelt es sich um Chinas erstes großes Videomodell mit langer Dauer, außergewöhnlicher Konsistenz und dynamischen Fähigkeiten, das dem Niveau von Sora sehr nahe kommt.

Sora ist ein generatives KI-Modell, das Anfang des Jahres von OpenAI in den USA entwickelt wurde. Mit seiner Fähigkeit, aus Textanweisungen realistische und fantasievolle Szenen zu erstellen, hat das Modell die Technikwelt im Sturm erobert. Im Vergleich zu Sora ist Vidu in der Lage, chinesische Elemente wie den Panda und den Drachen zu verstehen und zu erzeugen.

Das Unternehmen fügte hinzu, dass die Kernarchitektur des großen Modells bereits im September 2022 in Betrieb genommen worden sei - also sogar früher als die Einführung der Architektur von Sora.

Zur Startseite

Diesen Artikel Drucken 丨 Merken 丨 Senden 丨 Feedback

Beitrag
Ihr Name		Anonym

Chinas erstes Sora-Level Text-to-Video-Großmodell Vidu enthüllt

Ihr Kommentar