Google rozšiřuje možnosti Veo 3: vertikální formát, Full HD výstup, nižší ceny a integrace s Gemini API

Google zásadně vylepšuje svůj pokročilý model pro generování videa Veo 3. Nově podporuje vertikální video ve formátu 9:16, rozlišení 1 080p, nabízí snížené ceny za využití a je připraven na produkční nasazení přes rozhraní Gemini API.

Veo 3 přichází se zásadními vylepšeními

S rostoucím důrazem na mobilní formáty a sociální sítě Google přidal do modelu Veo 3 i jeho rychlé varianty Veo 3 Fast podporu vertikálního videa v poměru stran 9:16. To umožňuje vývojářům a tvůrcům generovat obsah optimalizovaný pro TikTok, Instagram Reels a další platformy nabízející vertikální formát videí. Zároveň je nyní možné produkovat videa ve vysokém rozlišení 1 080p, stačí při generování nastavit příslušný parametr rozlišení. Díky tomu model poskytuje výsledky s vyšší kvalitou obrazu, než tomu bylo dosud.

Před několika dny Google výrazně snížil ceny za využívání modelu Veo 3. Standardní verze nyní stojí 0,40 USD za sekundu videa, což je téměř poloviční částka oproti původním 0,75 USD. Ještě dostupnější je varianta Veo 3 Fast, jejíž cena klesla z 0,40 USD na 0,15 USD za sekundu. Tyto změny dělají z Veo atraktivní volbu pro vývojáře, startupy i jednotlivé tvůrce, kteří hledají výkonný a flexibilní nástroj pro generování videí pomocí umělé inteligence.

Zdroj: Fonearena

Google oficiálně oznámil, že Veo 3 i Veo 3 Fast jsou nyní plně stabilní pro škálované produkční nasazení prostřednictvím Gemini API. To znamená, že vývojáři mohou Veo integrovat do svých vlastních aplikací a služeb s jistotou, že systém zvládne i větší objemy požadavků a běh v reálném čase. Google zároveň připomněl, že veškerá videa generovaná modelem Veo nadále nesou digitální vodoznak SynthID, který slouží k ověření pravosti a zajištěn transparentnosti multimediálního obsahu.

Zdroj: Fonearena

Součástí novinek je i představení ukázkové aplikace MediaSim, která běží v prostředí AI Studia. Tato aplikace využívá SDK nástroje tldraw a kombinuje obrazové, zvukové a textové vstupy v interaktivním rozhraní. Uživatelé mohou v reálném čase upravovat obsah na plátně Canvas, využívat multimodální porozumění modelu Gemini a generovat složitá multimediální prostředí, která propojují obraz, zvuk i text v jediném kreativním procesu.

Model Veo 3 si rychle našel cestu do reálného světa aplikací. Platforma Invisible Studio, zaměřená na krátká videa pro sociální sítě, nasadila Veo 3 jako hlavní nástroj pro rychlou tvorbu vizuálně detailních výstupů. Během osmi týdnů se stal nejpoužívanějším videomodelem v jejich systému. Platforma Saga, která slouží filmařům a tvůrcům animací, zase propojuje Veo 3 s obrazovým modelem Imagen 4 a umožňuje plynulý přechod od scénáře až po vizualizaci scén. Třetím příkladem je Mosaic – editor využívající agenty pro generování videa na základě obrazových vstupů. Mosaic umí vytvořit souvislé sekvence o délce až 64 sekund, včetně synchronizovaného zvuku, a přidává nástroje pro úpravu časové osy přímo v prostředí editoru.

Veo 3 Video Generation Python Example 650x397x

Zdroj: Fonearena

Pro všechny, kdo chtějí začít s generováním videí přes Veo, je k dispozici AI Studio s úvodní aplikací a přehledně zpracovaným návodem „Veo Cookbook“. K dispozici je rovněž ukázkový Python skript pro práci s rozhraním google-genai, který vývojářům umožňuje jednoduše navrhnout a spustit generování vlastního obsahu.

Zdroj: fonearena.com

WhatsApp konečně skryje vaše číslo! 🔒 Starlink má problém 🛰️ 50W bezdrátové nabíjení ⚡

Nahrávání ...

Jakub Sobotka

Senior Editor jehož vášní jsou AI, mobilní technologie a vše kolem IT. Ve volném čase rád sportuje, čte, nebo se toulá přírodou. Ač uživatel Apple platformy, dobře si rozumí i s Androidem.