Češi vyvinuli AI přepisovač zvukové stopy na text. Funguje lokálně i přes cloud, 7 hodin zvládne přepsat za 40 minut

Češi vyvinuli AI přepisovač zvukové stopy na text. Funguje lokálně i přes cloud, 7 hodin zvládne přepsat za 40 minut
2024-05-06T09:40:40+02:00
• 6. 5. 2024
1

Současné přepisy audiostopy na text fungují na principu cloudových služeb. To znamená, že pro konverzi mluveného slova na textovou podobu je potřeba poslat původní audio nebo video soubor do cloudu. Zde se pak využívá úložiště a výpočetní výkon třetích stran. Za tuto službu zadavatel obvykle platí na základě délky zdrojového audiovizuálního materiálu. Existují však také instituce, které mají buď extrémně citlivá data, nebo potřebují často převádět velké objemy mluveného slova do textu. Mezi tyto instituce mohou patřit soudy, státní a městské úřady, nemocnice, call centra nebo mediální domy jako televizní a rozhlasové stanice.

„Při vývoji Venlan AI Transriber PIXLA jsme se zaměřili na specifickou cílovou skupinu uživatelů a jim jsme přizpůsobili nejen celkové řešení, jehož součástí je i hardwarová „piksla“, ale i proces učení transkripce, které časově zabralo největší část vývoje,“ popisuje svůj AI produkt Vladislav Janeček, jednatel společnosti Venlan.

AI Transriber PIXLA 02 1024x1017x

Ventlan

Fyzické zařízení i cloudové řešení

PIXLA zvládne přepsat text z audiovizuálních souborů s mluveným slovem ve více než 30 jazycích, včetně všech jazyků EU. Využívá pokročilé AI nástroje, které rozpoznávají nejen slova a hlásky, ale také kontext, což vede k přirozeně znějícímu textu, který je velmi podobný originálu a minimalizuje chyby, jako jsou přeřeknutí nebo odkašlání.

Venlan AI Transriber PIXLA je on-premise řešení založené na hardwarovém zařízení pro interní zabezpečené sítě. Jeho ovládání je jednoduché, stačí přetáhnout zvukový soubor do aplikace, která ho zkopíruje do zabezpečeného úložiště PIXLY, převede zvuk na text a poté soubor smaže. Uživatelé získají čistý text a .srt soubor s titulky, přičemž nejasné části textu jsou zvýrazněny. Případně je možné využít cloudové služby. Přepis sedmihodinového záznamu skrze PIXLA trvá pouze 40 minut.

pxla AI 2432x1320x

Aplikace je dostupná pro Windows, macOS a Linux a lze ji integrovat do firemního systému nebo spisové služby pomocí restAPI. Výsledky jsou okamžitě k dispozici a testování ukázalo, že převod sedmihodinového záznamu s několika účastníky trvá méně než hodinu. Nově PIXLA umožňuje převod hlasu na text v reálném čase, což může být využito pro diktování lékařských zpráv nebo titulkování na konferencích. Dostupná bude i v Obchodě Play.

Zdroj: tisková zpráva

Stiknutím klávesy J se přesunete na starší článek, klávesa K vás přesune na novější.

💡 Získejte Dotekománie Premium a využijte web naplno.

reklama
reklama

Karel Čapka

Absolvent mediálních studií a žurnalistiky. Zajímám se o moderní technologie, sociální sítě a mám rád focení. Vždy si najdu chvilku na čtení a baví mě učit se novým věcem. Zajímají mě moderní dějiny, politika, geografie, Formule 1 a vlastně ode všeho něco.

Komentáře

Michal SEMIRAD

8. 5. 2024, 21:37

Dobrý večer, existuje i software s opačnou funkci? Děkuji Michal197@post.cz

Reklama

PanzerGlass S24 MP Mraz 2
PanzerGlass S24 MP Mraz 1

Dotekománie.cz

Přidat komentář

Pro komentování se musíte přihlásit

Tmavý režim

Vyzkoušejte

Dotekománie Premium

Vychutnejte si web bez bannerové reklamy a získejte předběžný přístup k článkům. Podpoříte i Dotekománii.

Vyzkoušet

Odběr novinek

To podstatné ze světa mobilů a technologií jednou týdně do vašeho e-mailu. 📱
A nepropásnete soutěže!

Odebírat