W ramach przełomowego posunięcia OpenAI udostępniło rozmowy głosowe za pomocą ChatGPT wszystkim użytkownikom, niezależnie od ich statusu subskrypcji. Ta znacząca aktualizacja stanowi poważny krok w demokratyzacji sztucznej inteligencji, umożliwiając użytkownikom interakcję z ChatGPT poprzez płynne interakcje głosowe w aplikacji mobilnej.
OpenAI wprowadza pięć różnych głosów do rozmów głosowych ChatGPT
OpenAI początkowo wprowadziło funkcję głosową we wrześniu, ograniczając ją do abonentów Plus i Enterprise. Jednak w niedawnymogłoszenieGreg Brockman, współzałożyciel OpenAI, oświadczył, że funkcja jest teraz dostępna dla wszystkich. Użytkownicy mogą po prostu pobrać najnowszą wersję aplikacji ChatGPT na Androida lub iOS i odblokować funkcję czatu głosowego, poszerzając zasięg rozmów obsługiwanych przez sztuczną inteligencję.
- Oto najlepsze aplikacje ChatGPT na iPhone'a i iPada
Aby spersonalizować konwersację, użytkownicy mogą wybierać spośród pięciu różnych głosów, każdy starannie opracowany we współpracy z profesjonalnymi aktorami głosowymi. Głosy o imionach Jennifer, Ember, Cove, Sky i Breeze dodają ludzkiego charakteru interakcjom AI, czyniąc je bardziej wciągającymi i naturalnymi.

Jak działa czat głosowy na ChatGPT?
Inicjowanie rozmów głosowych jest tak proste, jak dotknięcie ikony słuchawek w aplikacji ChatGPT. To natychmiast otwiera dynamiczny i naturalny dialog z chatbotem, umożliwiając użytkownikom rozmowę z AI w znajomy i intuicyjny sposób. Chociaż aplikacja automatycznie wykrywa język, określenie preferowanego języka w ustawieniach aplikacji zapewnia dokładniejsze wykrywanie języka, poprawiając ogólne wrażenia.
Przeczytaj także:Google udostępnia funkcję automatycznego ponownego uruchamiania, aby zwiększyć bezpieczeństwo systemu Android
Funkcja głosowa jest obsługiwana przez zaawansowany model zamiany tekstu na mowę, który może generować dźwięk przypominający ludzki na podstawie tekstu i kilku sekund próbki mowy. System rozpoznawania mowy OpenAI o otwartym kodzie źródłowym, Whisper, odgrywa kluczową rolę w transkrypcji wypowiadanych słów na tekst, umożliwiając płynne rozmowy. Co ważne, transkrypcje głosu są przechowywane w historii użytkownika, zapewniając spersonalizowane i spójne wrażenia podczas wszystkich sesji.
Najnowsze wyzwania stojące przed OpenAI
To znaczące ulepszenie stanowi kamień milowy na drodze OpenAI do demokratyzacji sztucznej inteligencji. Pomimo wyzwań, takich jak zmiany kierownictwa i poważna globalna awaria 21 listopada, OpenAI nadal angażuje się w przejrzystość i ciągłe doskonalenie. Firma zobowiązała się do szczegółowej analizy przestoju i wdraża środki zapobiegające przyszłym zakłóceniom, demonstrując swoje zaangażowanie w zapewnianie wszystkim niezawodnej i dostępnej sztucznej inteligencji.
Przeczytaj więcej:
- Apple zintegruje generatywną sztuczną inteligencję w iOS 18, ruch pozornie inspirowany ChatGPT
