Vývojáři Samsungu vynalezli umělou inteligenci, která rozpohybovala obraz Mony Lisy

Umělá inteligence ušla v posledních letech velký kus cesty a technologičtí nadšenci z celého světa se předhánějí v tom, kdo právě tuto technologii využije k zajímavějšímu účelu. Trendem posledních měsíců jsou takzvaná deep fake videa, schopná produkovat realistické videomontáže žijících i již nežijících lidí.

Díky deep fake technologii se tak například provozovatelům muzea Salvadora Dalího ve městě St. Petersburg na Floridě podařilo přivést tohoto populárního umělce znovu částečně k životu a jeho virtuální repliku použít pro svoji nejnovější expozici. David Beckham zase díky technologiím dokázal v kampani proti malárii hovořit několika jazyky.

S ještě pokročilejším řešením nyní přišli inženýři korejského giganta Samsung, kteří ve svém moskevském centru umělé inteligence vytvořili vlastní algoritmus pro práci s deep fake technologií.

mona-lisa-living-portrait

Na rozdíl od standardních deep fake videí, která známe a která fungují na principu analyzování obličeje konkrétního člověka, jehož se následně umělá inteligence snaží zreplikovat, je novinka od Samsungu schopna pracovat i se statickými obrázky a fotkami. Ty jsou následně pomocí kombinace algoritmu, který předtím zanalyzoval stovky videí mluvících lidí, a rozpoznávací technologie GAN od výrobce grafických čipů Nvidia rozpohybovány.

Zatímco pro funkčnost klasického deep fake videa je ideálně potřeba, aby byl k replikované osobě k dispozici nějaký video záznam, s novinkou od Samsungu lze tímto způsobem rozpohybovat i osobnosti, které žily v období, kdy video ještě k dispozici nebylo. Samsung pak názornou demonstraci předvedl na známém obrazu Mony Lisy, kterému se inženýrům poměrně věrohodně podařilo vdechnout život.

tomas-jizdny

Přečtěte si takéTomáš Jízdný kupuje pražskou střední školu. Do výuky nasadí technologie od Applu i Microsoftu

Oproti technologie muzea Salvadora Dalího na Floridě má novinka od Samsungu samozřejmě jeden menší háček. Zatímco první zmíněná technologie díky dostupnosti videozáznamů zvládá velmi přesně napodobit mimiku a styl mluvy replikované osoby a vytvořit tak v podstatě jeho virtuální kopii, řešení od Samsungu vychází z analýzy velkého množství náhodně mluvících lidí, jejichž pohyby a mimika jsou následně do obrazu aplikovány.

Díky neexistenci videozáznamů tak v tomto případě nikdo nemůže vědět, jak moc je mluvící virtuální kopie přesná. Na videu níže, kteří inženýři Samsungu zveřejnili v rámci své práce, se nicméně můžete podívat, jak dokázali rozpohybovat vedle Mony Lisy i třeba Fjodora Michajloviče Dostojevského, Alberta Einsteina či Marylin Monroe.

Zakladatel CzechCrunche, velký fanoušek technologií, cestování a architektury.

CzechCrunch News

Nenechte si utéct zásadní zprávy!

Přihlašte se k pravidelnému odběru novinek ze světa technologií a startupů.