OpenAI představuje model ChatGPT Images 2.0: AI s logickým uvažováním, který tvoří dokonalé obrázky

OpenAI představuje model ChatGPT Images 2.0: AI s logickým uvažováním, který tvoří dokonalé obrázky

Zdroj: REUTERS / Dado Ruvic

Přesně rok po vydání první verze přichází OpenAI s výrazným upgradem svého modelu pro generování obrázků. Nový ChatGPT Images 2.0 už není obyčejný nástroj pro generování obrázků na základě jednoduchých zadání. Vývojáři mu vštípili schopnost logického uvažování a syntézy informací přímo z webu, což z něj dělá nástroj schopný vytvářet vizuály na profesionální úrovni.

Přichází pokročilý generátor obrázků ChatGPT Images 2.0

Zatímco předchozí modely pro generování obrázků často bojovaly s nepřesností nebo špatným pochopením souvislostí v rámci zadání, Images 2.0 přistupuje k úkolům analyticky. Pokud mu zadáte vytvoření grafiky k aktuálnímu tématu, model si nejdříve vyhledá potřebná data, ty zpracuje a následně promítne do výsledného obrazu. Tato automatizace celého procesu od analýzy až po finální export má ambici výrazně změnit způsob, jakým vzniká vizuální obsah pro články nebo prezentace.

Nový model Images 2.0 chce nahradit specializované grafické editory

OpenAI se netají tím, že s novou verzí míří přímo proti zavedeným aplikacím pro úpravu fotografií a grafiky. ChatGPT Images 2.0 totiž zvládá úkony, které byly dříve doménou manuální práce v editorech. Model dokáže s vysokou přesností odstraňovat pozadí, měnit poměry stran bez deformace objektů a generovat až osm různých variant obrázku současně, a to v rozlišení 2K.

Právě rychlost a paralelizace vytváření jsou klíčové pro uživatele, kteří potřebují rychle vyzkoušet více vizuálních podob. Schopnost pracovat v tak vysokém rozlišení navíc znamená, že výstupy jsou použitelné i mimo displej mobilních telefonů, například pro tisk nebo pro webový designu, kde jsou vysoká kvalita a detaol nesmírně důležité.

openai

Zdroj: OpenAI

Jednou z největších slabin generativní AI byla doposud práce s textem uvnitř obrázků a tvorba logických schémat. Images 2.0 v této disciplíně podle prvních testů exceluje. Model vykazuje výrazně lepší věrnost při tvorbě infografiky a diagramů, a to i v širším spektru různých cizích jazyků. Odstraňuje se tak častý problém, kdy text v obrázcích nebo grafech nedával smysl či obsahoval nesmyslné znaky.

Kromě lepšího vykreslování písma se model naučil mnohem precizněji následovat komplexní pokyny v zadání – promptech. Pokud uživatel vyžaduje zachování specifických detailů napříč různými verzemi obrázku, Images 2.0 si tyto prvky zapamatuje a drží vizuální kontinuitu.

Základní verze Images 2.0 je nyní dostupná pro všechny uživatele ChatGPT. Pokud však chcete využít plný potenciál režimu „Images with thinking“, tedy generování s aktivním zapojením logického uvažování, budete potřebovat jeden z placených tarifů Plus, Pro, Business nebo Enterprise.

Zdroje: gsmarena.com, openai.com

Zahoďte powerbanky: Otestovali jsme Poco X8 Pro Max, energetické monstrum za 13k 🫨

💡ANKETA: Měníte si ve svém telefonu výchozí webový prohlížeč?

Nahrávání ... Nahrávání ...

Profilovka

Senior Editor jehož vášní jsou AI, mobilní technologie a vše kolem IT. Ve volném čase rád sportuje, čte, nebo se toulá přírodou. Ač uživatel Apple platformy, dobře si rozumí i s Androidem.

Komentáře

Dotekománie.cz

Přidat komentář

Pro komentování se musíte přihlásit

Tmavý režim