Vor nicht allzu langer Zeit wollte das KI-Unternehmen OpenAI eine neue und natürlicher klingende Stimme im Rahmen des eigenen Advanced Voice Modes („erweiterter Sprachmodus“) im eigenen Chatbot ChatGPT veröffentlichen. Das Problem: Die künstlich generierte Stimme mit dem Namen „Sky“ klang sehr deutlich nach Scarlett Johansson, was gerichtliche Schritte der amerikanisch-dänischen Schauspielerin nach sich zog.
Dieser riesige Faux-Pas veranlasste OpenAI daher im Mai dieses Jahres dazu, die KI-Stimme aus dem Programm zu nehmen und „Sky“ erst einmal auf Eis zu legen. Nun gibt es allerdings Neuigkeiten zum KI-Modell GPT-4o und ChatGPT, in dem die Stimme verwendet werden soll: Wie OpenAI bei Twitter/X nun mitteilt, hat man mit der Verteilung des Advanced Voice Modes begonnen.
„Wir beginnen damit, den erweiterten Sprachmodus für eine kleine Gruppe von ChatGPT Plus-Nutzern einzuführen. Der erweiterte Sprachmodus bietet natürlichere Unterhaltungen in Echtzeit, erlaubt es dir, jederzeit zu unterbrechen, und erkennt und reagiert auf deine Emotionen.“
Laut OpenAI sollen Nutzer und Nutzerinnen in dieser Alpha-Phase eine E-Mail mit Anweisungen und eine Nachricht in ihrer mobilen App erhalten. Man werde fortlaufend weitere Personen hinzufügen und plane, dass alle Plus-User im Herbst Zugang haben werden.
Auch zur Sicherheit des Advanced Voice Modes informiert OpenAI bei Twitter/X:
„Seit wir den fortschrittlichen Sprachmodus zum ersten Mal vorgeführt haben, arbeiten wir daran, die Sicherheit und Qualität von Telefongesprächen zu verbessern, während wir uns darauf vorbereiten, diese zukunftsweisende Technologie Millionen von Menschen zugänglich zu machen.
Wir haben die Sprachfähigkeiten von GPT-4o mit über 100 externen Red Teamern in 45 Sprachen getestet. Um die Privatsphäre der Menschen zu schützen, haben wir das Modell darauf trainiert, nur in den vier voreingestellten Stimmen zu sprechen, und wir haben Systeme entwickelt, um Ausgaben zu blockieren, die von diesen Stimmen abweichen. Wir haben auch Schutzmaßnahmen implementiert, um Anfragen nach gewalttätigen oder urheberrechtlich geschützten Inhalten zu blockieren.“
Die Erkenntnisse aus der Alpha-Phase sollen OpenAI helfen, „das Advanced Voice-Erlebnis für alle sicherer und angenehmer zu gestalten“. Zudem plane man, Anfang August einen detaillierten Bericht über die Fähigkeiten, Einschränkungen und Sicherheitsbewertungen von GPT-4o zu veröffentlichen. Wer die „Sky“-Stimme selbst nutzen möchte, benötigt das Plus-Abo von ChatGPT, das zu Preisen ab 20 USD (ca. 18 Euro) im Monat erhältlich ist.