ChatGPT-4o ist unglaublich gut, es wird mit Ihnen „im Videochat“ lachen und singen.

ChatGPT-4o ist unglaublich gut, es wird mit Ihnen „im Videochat“ lachen und singen.

Wenn Sie gespannt auf das neueste Spring-Update von OpenAI für ChatGPT gewartet und gehofft haben, dass das Unternehmen GPT-5 herausbringt, werden Sie in dieser Hinsicht enttäuscht sein. Aber was OpenAI stattdessen veröffentlicht hat, würde das mehr als wettmachen.

Das Unternehmen hat kürzlich sein neuestes Flaggschiffmodell – GPT-4o – vorgestellt, ein Meisterwerk menschlicher Innovation. Das „o“ in GPT-4o steht für „omni“ und ist eine treffende Anspielung auf die neuesten allgegenwärtigen Fähigkeiten von ChatGPT. Während es im Bereich Intelligenz und Argumentation gegenüber dem GPT-4-Modell keine großen Verbesserungen gibt, zeichnet sich das neue Modell durch drastische Verbesserungen in Bezug auf Geschwindigkeit und Multimodalität aus.

Was bedeutet das? GPT-4o hat die Fähigkeiten in den Bereichen Text, Sprache und Bild verbessert. Es kann Bilder besser verstehen und diskutieren. Aber das Aufregendste an dem Update ist die Fähigkeit, in Echtzeit über Audio und Video mit Ihnen zu kommunizieren und uns in die Zukunft der Mensch-Maschine-Interaktion zu führen. Die meisten von uns haben sich diese Science-Fiction-artige Interaktion mit einer KI erst in ferner Zukunft vorgestellt. Aber sie ist da und sie ist aufregend.

Mira Murati, CTO von OpenAI, stellte zusammen mit zwei Forschungsleitern die neuen Funktionen von GPT-40 vor.

Das Stimmmodell hat eine unglaubliche Persönlichkeit und Tonalität, die Sie (für eine Weile) vergessen lassen kann, dass Sie mit einer KI interagieren. Es ist unheimlich aufregend. Die Antworten sind viel natürlicher und es lacht sogar und tut so, als würde es erröten wie ein Mensch.

Die Demo zeigte auch die Bandbreite der Emotionen auf, die ChatGPT auf ausdrücklichen Wunsch zeigen kann: Beim Erzählen einer Geschichte verlieh ChatGPT seiner Stimme mehr Emotionen und Dramatik, wechselte zu einem Roboterklang und sang sogar, als wäre es in einem Musical – und all das geschah nahtlos.

Viele Benutzer sagen, die Stimme erinnere sie an Scarlett Johanssons KI aus dem Film „Her“, aber es ist vor allem die gleiche Stimme, die ChatGPT in der Vergangenheit hatte. Der ganze Unterschied kommt von den Änderungen in der Tonalität und einigen gut platzierten Lachern.

In Kombination mit den Fähigkeiten, den Inhalt auf dem Bildschirm zu sehen und darauf zu reagieren, ist es geradezu überwältigend. Mit seinen neuen Sehfähigkeiten konnte ChatGPT nicht nur Dinge wie lineare Gleichungen verstehen, sondern auch die Umgebung sowie die Emotionen auf dem Gesicht einer Person, die ihm mithilfe der Kamera gezeigt wurden, ziemlich gut interpretieren. Sie können jetzt sogar Schere-Stein-Papier spielen und ChatGPT bitten, der Schiedsrichter zu sein, oder die Vorbereitung auf das Vorstellungsgespräch mit ChatGPT noch einen Schritt weiter bringen, indem Sie es bitten, Ihr Outfit zu kritisieren, und es wird keine schlechten Entscheidungen, die Sie treffen, beschönigen.

Insgesamt ist der Effekt bemerkenswert und vermittelt einem fast das Gefühl, man würde bei einem Videoanruf mit einer echten Person interagieren (sofern die andere Person ihre Kamera immer ausgeschaltet hat).

https://www.youtube.com/watch?v=DQacCB9tDaw

Auch das Sprachmodell ist insgesamt besser als das derzeit verfügbare. Der Dialog fließt mehr wie ein natürliches Gespräch, bei dem man ihn mittendrin unterbrechen kann. Das Modell kann mehrere Stimmen und Hintergrundgeräusche sowie den Tonfall der Stimme verstehen und unterscheiden.

Auf technischer Ebene liegt es daran, dass GPT-4o alles nativ kann, wofür bisher drei verschiedene Modelle nötig waren: Transkription, Intelligenz und Text-to-Speech. Diese Verbesserungen bieten dem Benutzer ein intensiveres, kollaborativeres Erlebnis anstelle der Latenzen der vorherigen Modelle.

Während der Zugriff auf GPT-4o in der Web-App bereits für kostenlose und Plus-Benutzer eingeführt wird, wird der neue Sprachmodus mit GPT-4o in den kommenden Wochen nur für ChatGPT Plus-Benutzer in der Alpha-Version eingeführt. Außerdem wird eine neue ChatGPT-App für macOS veröffentlicht, deren Zugriff schrittweise eingeführt wird, beginnend für ChatGPT Plus-Benutzer.

Obwohl die Demo ziemlich beeindruckend war, müssen wir abwarten, ob die Anwendung in der Praxis genauso reibungslos funktioniert, wenn das Modell schließlich veröffentlicht wird.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert