OpenAI udostępnia plik Ha– Inspirująca funkcja asystenta głosowego, która potrafi odczytać wyraz Twojej twarzy i przetłumaczyć język mówiony w czasie rzeczywistym — i, miejmy nadzieję, robi to wszystko bez zdradzania tego, co lubisz w filmie.
Podczas poniedziałkowej demonstracji na żywo inżynierowie OpenAI i CTO Mira Murati zebrali się przy telefonie, aby zademonstrować nowe możliwości. Zachęcali asystenta do większej ekspresji podczas komponowania bajki na dobranoc, a następnie nagle poprosili go, aby przełączył się na głos robota, a na koniec poprosili go, aby zakończył opowieść głosem śpiewającym. Później poprosili asystenta, aby spojrzał na to, co widziała kamera telefonu i sprawił, aby reagował na to, co pojawiało się na ekranie. Asystent mógł także przerywać w trakcie mówienia i odpowiadać bez ciągłego podpowiedzi, pełniąc rolę tłumacza.
Reakcja wokalna asystentki była uderzająco podobna do postaci granej w filmie przez Scarlett Johansson. HaGdzie mężczyzna nawiązuje relację z zaawansowanym asystentem sztucznej inteligencji. Po wydarzeniu powiedział tajemniczo Sam Altman, dyrektor generalny OpenAI opublikować Tylko jedno słowo na X: „ona”. On też wyraziłem Który Ha To jego ulubiony film. Film porusza tematy samotności i relacji między człowiekiem a sztuczną inteligencją. Wydaje się mało prawdopodobne, aby reżyser Spike Jonze zamierzył, aby świat dokładnie odtworzył poczucie robotycznej izolacji.
W wywiadzie prasowym z krawędźMoratti powiedział, że asystent nie został zaprojektowany tak, aby brzmiał jak Johansson, i podkreślił, że OpenAI ma takie głosy od jakiegoś czasu. „Pewna osoba z widowni zadała mi dokładnie to samo pytanie, a potem odpowiedziała: «Och, może powodem, dla którego nie rozpoznaję tego w ChatGPT, jest to, że dźwięk ma wiele charakteru i tonu»” – powiedział Moratti.
Funkcje te stanowią znaczące ulepszenie w stosunku do istniejącego trybu głosowego ChatGPT, w którym można rozmawiać z użytkownikiem, ale z bardzo ograniczoną interakcją; Bieżącej wersji nie można na przykład przerwać ani zareagować na to, co widzi kamera. Nowe możliwości zostaną udostępnione w ograniczonej wersji „alfa” w „nadchodzących tygodniach” i będą dostępne dla abonentów ChatGPT Plus w pierwszej kolejności po rozpoczęciu szerszego wdrożenia.
Nowy asystent głosowy depcze po piętach Bloomberga raport Który twierdzi, że OpenAI zbliża się do porozumienia z Apple w sprawie umieszczenia ChatGPT na iPhonie. (Zapytany na konferencji prasowej Moratti odpowiedział: „Nie rozmawialiśmy o żadnym partnerstwie”). Asystent głosowy iPhone'a, Siri, nie jest zaufany, więc HaWygląda na to, że asystent inspirowany iPhonem, który faktycznie będzie w stanie odpowiedzieć na Twoje pytania, zamiast „przeszukiwać Internet”, jest właśnie w tym kierunku.
„Nowy tryb audio (i wideo) to najlepszy interfejs komputerowy, jakiego kiedykolwiek używałem. Przypomina mi to sztuczną inteligencję z filmów; wciąż trochę mnie zaskakuje, że to prawda” – powiedział Altman w wywiadzie. Post na blogu Zaraz po transmisji na żywo. „Osiągnięcie czasu reakcji i ekspresji na poziomie ludzkim okazuje się dużą zmianą”.