Přesně rok po vydání první verze přichází OpenAI s výrazným upgradem svého modelu pro generování obrázků. Nový ChatGPT Images 2.0 už není obyčejný nástroj pro generování obrázků na základě jednoduchých zadání. Vývojáři mu vštípili schopnost logického uvažování a syntézy informací přímo z webu, což z něj dělá nástroj schopný vytvářet vizuály na profesionální úrovni.
Přichází pokročilý generátor obrázků ChatGPT Images 2.0
Zatímco předchozí modely pro generování obrázků často bojovaly s nepřesností nebo špatným pochopením souvislostí v rámci zadání, Images 2.0 přistupuje k úkolům analyticky. Pokud mu zadáte vytvoření grafiky k aktuálnímu tématu, model si nejdříve vyhledá potřebná data, ty zpracuje a následně promítne do výsledného obrazu. Tato automatizace celého procesu od analýzy až po finální export má ambici výrazně změnit způsob, jakým vzniká vizuální obsah pro články nebo prezentace.
Nový model Images 2.0 chce nahradit specializované grafické editory
OpenAI se netají tím, že s novou verzí míří přímo proti zavedeným aplikacím pro úpravu fotografií a grafiky. ChatGPT Images 2.0 totiž zvládá úkony, které byly dříve doménou manuální práce v editorech. Model dokáže s vysokou přesností odstraňovat pozadí, měnit poměry stran bez deformace objektů a generovat až osm různých variant obrázku současně, a to v rozlišení 2K.
Právě rychlost a paralelizace vytváření jsou klíčové pro uživatele, kteří potřebují rychle vyzkoušet více vizuálních podob. Schopnost pracovat v tak vysokém rozlišení navíc znamená, že výstupy jsou použitelné i mimo displej mobilních telefonů, například pro tisk nebo pro webový designu, kde jsou vysoká kvalita a detaol nesmírně důležité.
Jednou z největších slabin generativní AI byla doposud práce s textem uvnitř obrázků a tvorba logických schémat. Images 2.0 v této disciplíně podle prvních testů exceluje. Model vykazuje výrazně lepší věrnost při tvorbě infografiky a diagramů, a to i v širším spektru různých cizích jazyků. Odstraňuje se tak častý problém, kdy text v obrázcích nebo grafech nedával smysl či obsahoval nesmyslné znaky.
Kromě lepšího vykreslování písma se model naučil mnohem precizněji následovat komplexní pokyny v zadání – promptech. Pokud uživatel vyžaduje zachování specifických detailů napříč různými verzemi obrázku, Images 2.0 si tyto prvky zapamatuje a drží vizuální kontinuitu.
Základní verze Images 2.0 je nyní dostupná pro všechny uživatele ChatGPT. Pokud však chcete využít plný potenciál režimu „Images with thinking“, tedy generování s aktivním zapojením logického uvažování, budete potřebovat jeden z placených tarifů Plus, Pro, Business nebo Enterprise.
Zdroje: gsmarena.com, openai.com
