Každý rok Google pořádá vývojářskou konferenci, která se v posledních letech soustřeďuje hlavně na software a služby. Jako obvykle se dočkáme oficiálního oznámení Androidu 15, tedy hlavních novinek. Tento systém ale je již k dispozici v rámci beta programu, takže si již nyní můžete přečíst v naší minisérii o těch objevených novinkách. Některé ani Google nějak moc nezmíní na dnešní konferenci.

Gemini Éra

Jak se dalo očekávat, Google začal konferenci samotnou umělou inteligencí a podobnými mechanismy. Připomněl, kde to vše začalo a jaké byly postupné kroky. Samozřejmě se soustředil na jeho nejnovější produkt Gemini, tedy nový AI model, který si nachází cestu do mnoha služeb a aplikací. Ostatně použil označení Gemini Éra.

Samotný systém Gemini používá přes 1,5 milionu vývojářů pro nejrůznější úkoly, a to i kontrolu kódu. Co se týče uživatelů, tak dle Googlu používá tento systém 2 miliardy uživatelů. Gemini hodně napomáhá i samotnému vyhledávání, zejména v pochopení samotných dotazů v Google Vyhledávání.

AI Overviews ve vyhledávání se rozšíří v následujících měsících i mimo USA. V podstatě se jedná o sumarizaci založenou na hledaném dotazu. Funkce ale zamíří i do Google Fotek. Už nebude nutné hledat nějakou fotku s poznávací značkou. Jednoduše položíte dotaz, jaká je vaše SPZ a Fotky jednoduše zobrazí fotku vašeho auta. Funkce se jmenuje Ask Photos a bude sloužit i pro posílenou sumarizaci obrázků.

Hlavním oznámením ale je dostupnost Gemini 1.5 Pro pro všechny vývojáře. Navíc došlo na rozšíření tokenů pro vývojáře na 2 miliony. Gemini ale také zamíří do služeb jako Gmail, kde nejvíce poslouží pro pokročilé vyhledávání, seskupování a sumarizaci. Google se více zaměřuje na integraci do Worskspace služeb.

Zajímavou funkcí je Audio overview v NotebookLM, kam jednoduše nahrajete všechny možné soubory a dokumenty. Následně AI vytvoří audio výstup na dané téma, ale kromě toho se může uživatel zapojit přímo a třeba pokládat otázky. V podstatě se lze zapojit a zjišťovat informace. Dá se říci, že si takto budete moci vytvořit soukromého učitele, který navíc i reaguje.

Nejen noví Agenti

Poměrně zajímavou novinkou jsou Agenti. Jde v podstatě o systém, který poslouží jako osobní asistent, který bude sloužit uživateli, bude si pamatovat věci, informace a události, přičemž bude moci i plánovat. Dá se říci, že Agenti jsou tím, čím se měl kdysi stát Google Asistent. Agenti jsou vytvořeni tak, aby všechny informace byly soukromé a jen pro uživatele. Vypadá to, že Google takto nebude dostávat soukromé informace.

Došlo na představení Gemini 1.5 Flash, tedy verze designované na rychlost, efektivitu a nízkou latenci. Jakoby se tato novinka hodila nejvíce na mobily, ale bude záležet spíše na vývojářích.

Google ukázal i projekt Astra, tedy systém, který umí přes kameru rozpoznávat okolí a popisovat, co je v okolí, přičemž umí reagovat na otázky a také na ně odpovídat. Poradí si i se zvýrazněním. Systém je postaven na mnoha technikách a také agentech. Takovou funkci si dokáže představit v rámci přístupnosti, třeba může napomoci uživatelům se zrakovým postižením nebo znevýhodněním.

Jde ale jen o projekt a zatím není k dispozici. Spíše jde o demonstraci toho, co je již nyní možné a na čem Google pracuje. Dle vyjádření bude první verze pro uživatele k dispozici na konci tohoto roku.

Společnost také zdůraznila, že se pracovalo na vylepšení modelů pro generování videí, obrázků a hudby. Nejde ale jen o vygenerování lepšího obrázku, větší roli hraje samotné pochopení toho, co uživatel chce. V případě hudby to spíše vypadá na nabídnutí funkcí pro samotné tvůrce nejen na Youtube, aby mohli nabídnout něco nového ve svých videí. Současně tak Google vlastně nebude muset řešit licenční poplatky. U videí se nabídne realističtější výsledek ve Full HD, přičemž se nabídnout nejrůznější efekty a možnosti. A výsledky vypadají zajímavě.

Google nakonec představil trochu hardwaru. Konkrétně představil Trillium, 6. generaci TPU, a také jsme se dočkali i nových procesorů pro zákazníky cloudových služeb. Vše se zaměřením na AI. Nejde ale jen o více výkonu, nabídne se i lepší efektivita. Jeho systémy jsou navíc více chlazeny kapalinou.

Vylepšené vyhledávání

Google sice začne nabízet AI sumarizaci, ale zaměřil se i na samotné dotazy a jejich komplexnost. Bude možné položit komplikovaný dotaz ve vyhledávání, přičemž systém si rozebere dotaz na menší a zpracuje je do jednoho výsledku. To vše se má dít v reálném čase. Možnosti vylepšeného systému ukázal na plánování.

Google ale myslel i na situace, kdy ani nevíte, co přesně chcete hledat. V takovém případě stačí napsat, že potřebujete vyřešit nějak rodinnou oslavu a Google Vyhledávání se pokusí nabídnout celou variaci možností, která může napomoci.

Podstatnější novinkou je možnost zeptat se pomocí videa. Dá se tedy říci, že se Google dostal od služby Lens k možnosti nasdílet video a následně položit otázku.

Novinky ve vyhledávání rozhodně napomohou, ale také se mohou těšit uživatelé Workspace služeb. Dojde k rozšíření dostupnosti postranního panelu s Gemini a také rozšíření o další jazyky. Například v aplikaci Gmail napomůže Gemini v sumarizaci delší e-mailové konverzace, ale také bude možné zadávat další dotazy a požadavky, přičemž systém projde ostatní obsah, aby nabídl vhodná data. Kromě toho se nabídne i automatizace, aby uživatelé nemuseli pokaždé dělat jeden a ten samý úkol pokaždé.

Aby byla práce v týmu jednodušší, tak Google vytvořil AI spolupracovníka, tedy službu, která má i svůj Google účet. Ten pak funguje jako asistent pro celý tým, třeba na konkrétním projektu. Sleduje vše a zpracovává všechna data v projektu, přičemž může i vytvářet a nabízet řešení.

Nejen aplikace Gemini

Není tajemstvím, že Google odložil Asistenta a soustředil se na Gemini, tedy nástupce, který má i vlastní aplikaci. Ta nahrazuje na mobilu původního asistenta. Dostane možnost používat kameru a reagovat na obraz i vaše dotazy. Současně by měl znít reálněji a více simulovat skutečnou osobu. Dokonce si budete moci vytvořit několik verzí, které se budou soustřeďovat na konkrétní témata. Novinka se jmenuje Gems.

Samozřejmě nás nejvíce zajímá, jestli je konečně podporovaná čeština, ale přímou odpověď zatím nemáme. Google jen uvedl, že je podpora zajištěna pro 35+ jazyků. Zatím si asi budeme muset počkat, zase.

Co se týče Androidu jako takového, tak v podstatě došlo jen k připomenutí Circle to Search. Google Asistent bude nahrazen Gemini v tomto roce, a to v celé míře. Mezitím Gemini dostává možnosti jako řešení matematických rovnic, ale také schopnost přesunout vygenerovaný obrázek do konkrétní aplikace. Bonusem navíc je, že si je Gemini vědomo obsahu, takže může více napomáhat s komplexnějšími úkoly.

Například vám dojde do e-mailu PDF a jednoduše ho nasdílíte do Gemini. To si projde obsah a následně se můžete ptát na otázky. To vše se provádí na zařízení, takže není nutné odesílat data na servery.

Google dokonce pracuje na zapojení Gemini Nano do bezpečnosti. Například bude moci identifikovat podezřelé chování nebo činnost. Google ukázal, že systém varoval před podezřelým hovorem od podvodníka. Vše se ale zpracovává přímo na mobilu a nikam se nic neodesílá.

Zajímavost: Google nechal Gemini počítat, kolikrát byla vyslovena zkratka AI. Více než 121x. A Gemini dál pokračovalo v počítání během úvodní keynote konference pro vývojáře.

Budoucnost pěkná, ale dočkáme se?

Všechny tyto novinky vypadají zajímavě a mohl bych říci, že se Google zaměřuje na vylepšení používání služeb a aplikací, včetně mobilních telefonů. Umím si představit, jak postiženým nebo nějak znevýhodněným lidem zjednoduší tyto novinky život. Současně ale mám na mysli i situaci, kdy nám Google přislíbil dostupnost Asistenta, ale nikdy jsme se nedočkali.

Zde bude hlavně hrát roli snaha přinést AI technologie do více jazyků. Google se pochlubil s mnoha funkcemi, ale možná by stálo za to nabídnout AI, které překoná jazykovou bariéru a nabídne všechny jeho služby v mnoha jazycích.

Zdroj: Konference



