ChatGPT od OpenAI získává významný upgrade v oblasti hlasového rozhraní. Funkce „Advanced Voice“, která umožňuje mluvit s umělou inteligencí nahlas, je nyní realističtější, než kdy dřív. Nová aktualizace přináší plynulejší intonaci, přirozený rytmus řeči a výraznější emocionální nádech – včetně empatie nebo sarkasmu.
Vylepšený Voice Mode v ChatGPT
Přirozený projev, který zní jako skutečný člověk. Nově aktualizovaný hlasový režim přináší výrazné zlepšení v oblasti syntetické řeči. Podle OpenAI jsou hlasy nyní citlivější na kontext, lépe artikulují emoce a působí přirozeněji díky plynulému rytmu, přestávkám a akcentům. To znamená, že konverzace s umělou inteligencí působí více jako rozhovor s člověkem než s robotem. Hlasové výstupy mají nyní jemnější intonaci a realističtější kadenci, což ocení nejen běžní uživatelé, ale i ti, kteří ChatGPT používají pro výuku jazyků, trénink řečových dovedností nebo překlady.
Plynulé překlady v reálném čase
Kromě vylepšení kvality projevu získal hlasový režim novou schopnost překladu konverzací mezi jazyky. Uživatelé nyní mohou požádat ChatGPT, aby fungoval jako simultánní tlumočník – překlad bude probíhat nepřetržitě, dokud neřeknete, že chcete zastavit nebo přepnout jazyk. Tato funkce má velký potenciál v prostředí cestování, obchodních jednání nebo jazykové výuky a přibližuje ChatGPT ještě více nástrojům živého tlumočení.
Pro koho je funkce dostupná?
Novinky jsou dostupné všem platícím uživatelům ChatGPT napříč zeměmi a platformami. Pokud jste předplatitelem ChatGPT Plus nebo využíváte verze s přístupem k nejnovějším modelům, můžete si vylepšený hlasový režim vyzkoušet okamžitě.
OpenAI však upozorňuje, že i přes celkové zlepšení může občas dojít k drobným výkyvům v kvalitě zvuku, například k nečekaným změnám výšky hlasu nebo intonace. Aktualizace navíc zatím neřeší některé známé chyby, jako je výskyt nechtěných zvuků, nesrozumitelných frází či pozadí s hudbou.
Tento krok potvrzuje ambici OpenAI vytvořit co nejpřirozenější rozhraní mezi člověkem a umělou inteligencí. S tím, jak se technologie přibližují lidské řeči nejen po zvukové stránce, ale i po obsahové, se možnosti jejich využití rozšiřují – od zákaznické podpory přes asistenční služby až po kreativní práci.
Zdroj: techcrunch.com
