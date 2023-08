Zdroj: petapixel (se souhlasem)

Společnost Meta, který je vlastníkem sociálních platforem Facebook, Instagram a WhatsApp spouští nový model převodu řeči na text a překladu textu. Nový model dokáže pracovat s téměř stovkou jazyků.

Meta vylepšuje model překladu a rozpoznávání řeči a textu

Nový model nese název SeamlessM4T, zkratka pro Massively Multilingual and Multimodal Machine Translation. Jak společnost Meta uvádí, tento model dokáže převádět řeč na text a text na text. Model dokáže rozpoznat téměř 100 vstupních jazyků a dokáže je převést na 35 výstupních jazyků. Tento model je k dispozici pro Creative Commons CC-BY-NC 4.0 licenci, je tedy k dispozici pro využití pro další testování a vývoj.

„Vytvoření univerzálního překladače jazyka, jako je fiktivní Babel Fish ve Stopařově průvodci po Galaxii, je náročné, protože existující systémy převodu řeči na řeč a řeči na text pokrývají pouze malý zlomek světových jazyků,“ sdělila společnost Meta. Meta uvádí, že SeamlessM4T představuje významný průlom, protože tento systém dokáže vykonávat celý překladatelský proces sám narozdíl od jiných modelů, které ji provádějí na dílčích systémech.

SeamlessM4T dokáže například rozpoznat to, když mluvící mluví více jazyky. Meta na demonstrativním videu ukazuje, jak model dokáže rozpoznávat mezi jazyky hindštinou, telugštinou a angličtinou. To je něco, co většina současných softwarových řešení pro rozpoznání řeči pomocí AI, nedokáže. SeamlessM4T staví na předchozích modelech, které Meta používá. Loni Meta spustila model pro strojový překlad textu na text No Language Left Behind, který podporuje 200 jazyků.

Meta rovněž vyvinula datovou sadu SpeechMatrix pro vícejazyčný překlad řeči na řeč a pro rozpoznávání řeči. Uvedla také svůj univerzální překladač řeči a dokázala převést Hokkien, což je široce využívaný dialekt v Číně, na anglický jazyk. Jazykový překlad je pro společnost Meta klíčový. Společnost zaměstnává velké množství zaměstnanců, kteří moderují obsah na Facebooku a Instagramu, a nové modely založené na AI mohou významně zefektivnit práci nejen těchto týmů.

V rámci SeamlessM4T společnost Meta vyvinula také systém, který dokáže spolehlivě identifikovat citlivá a „toxická“ slova, díky čemuž je společnost schopná identifikovat obsah, který může podněcovat nenávist, násilí, ale také dokáže odhalovat vulgární obsah a podobně. „Filtrovali jsme nevyváženou toxicitu v trénovacích datech. Pokud vstup nebo výstup obsahoval různá množství toxicity, odstranili jsme tuto tréninkovou sekvenci,“ uvádí společnost Meta.

Společnost Meta rovněž uvedla, že model SeamlessM4T dokáže pracovat i s genderovou formu rozpoznávání, kdy je v textu v určitém jazyce, například uveden ženský rod a ten převést do překladu.

Zdroj: theverge.com

