
Zdroj: Samaa
Konkurence mezi AI chatboty se rozšiřuje o další oblast, a to konkrétně o vizuální. Společnost xAI oznámila spuštění nové funkce Grok Vision, která umožňuje chatbotu Grok rozpoznávat objekty a texty v reálném světě prostřednictvím kamery vašeho telefonu. Tato novinka přibližuje Grok možnostem, které uživatelé znají například z ChatGPT nebo Google Gemini.
Grok Vision je tedy
Funkce Grok Vision umožňuje uživatelům nasměrovat kameru telefonu na jakýkoli předmět – od produktů přes cedule až po dokumenty – a okamžitě se zeptat: „Na co se právě dívám?“
Chatbot následně využije kamerový vstup k analýze objektů, textu nebo prostředí a poskytne odpověď v reálném čase. Tato schopnost je aktuálně dostupná výhradně v aplikaci Grok pro iOS, přičemž verze pro Android na svou aktualizaci teprve čeká.
Reálné vidění, vícejazyčný hlas i rychlé vyhledávání. Současně s Grok Vision přichází i další novinky v rámci hlasového režimu:
- Multijazyčný hlasový výstup – Grok teď mluví španělsky, francouzsky, turecky, japonsky i hindsky
- Okamžité vyhledávání – chatbot umí vyhledávat v reálném čase během konverzace
- Uživatelé systému Android mohou nové funkce využívat, pokud mají aktivní prémiový tarif SuperGrok za 30 dolarů měsíčně.
Chatbot Grok od xAI, společnosti vedené Elonem Muskem, v posledních týdnech získává jednu funkci za druhou. Po nedávném zavedení paměťového systému, který umožňuje botovi pamatovat si předchozí konverzace, přibyl i kreativní nástroj pro tvorbu dokumentů a aplikací.
Díky Grok Vision se chatbot dostává blíž k reálnému porozumění světu, který vidíme kolem sebe. A i když je zatím funkce dostupná jen na iPhonech, dává jasný signál, že vizuální AI bude brzy standardem – nejen experimentem.
Zdroj: techcrunch.com

Komentáře