Tento nástroj dokáže na základě jedné minuty záznamu vytvořit kopii jakéhokoliv hlasu

audio
0Zobrazit komentáře

Při pohledu na to, jak se poslední technologie umělé inteligence a techniky obecně posunují kupředu, je velmi jednoduché představit si dobu, ve které nebudeme schopni rozeznat člověka od robota, manuálně řízené auto od zcela autonomního nebo hlas na druhém konci „drátu“ od reálného a uměle vytvořeného.

Většina pokusů a nových objevů slouží jak ku prospěchu, tak k možnému zneužití k ne úplně správným účelům. Takovým příkladem může být i nově vypuštěný nástroj Lyrebird od stejnojmenné firmy v Kanadě. Lyrebird na základě jedné minuty libovolného záznamu, který nahrajete, dokáže maximálně napodobit zabarvení hlasu a jeho intonaci, stejně jako různé emoce – vztek, stres nebo projevení sympatií.

teslapickup

Přečtěte si takéTesla chce již letos oficiálně představit nákladní automobil a později i pick-upTesla chce již letos oficiálně představit nákladní automobil a později i pick-up

Algoritmicky vytvořená podoba hlasu poté může být využita k namluvení jakéhokoliv textu – a to v reálném čase. API, které je momentálně přístupné v rámci betaverze pro vývojáře, dokáže generovat až 1000 vět za méně než půl vteřiny. Zkopírovat si tak můžete hlas třeba Donalda Trumpa, Baracka Obamy, oblíbeného herce nebo dabéra audioknih.

Z aktuálních informací bohužel není jisté, zda funguje algoritmus i pro cizí jazyky. Cílem firmy je nejen rozvinout technologii a dovést ji k dokonalosti, ale zároveň poukázat na to, že je replikace hlasu na velmi pokročilé úrovni možná a že je mnohdy používána k nepatričným účelům. V dlouhodobém měřítku by měl být nástroj zároveň schopen rozpoznat, zda je hlas, který momentálně poslouchá, tím reálným a nebo je lehce upraveným přes podobnou technologii.

Foto: Pexels

Diskuze (0)

Novinka

Anonym