Český Memsource umí vybrat nejlepší nástroj pro překlad textů. Díky své technologii byl oceněn na více než miliardu

Dalibor Frívaldský, technologický ředitel startupu Memsource

Foto: Memsource

Od „jednoduchého“ nástroje na pomoc při překladech dokázal postupným zlepšováním český startup Memsource pokrýt celý trh. Od freelancingových překladatelů přes agentury až po globální firmy typu Uber. Tím však rozvoj neskončil a v posledních letech firma z technologického pohledu stále více spoléhá na umělou inteligenci.

Díky svému globálnímu úspěchu od Tokia po Silicon Valley i patentovaným technologiím dokázala nedávno najít nového partnera, investiční společnost Carlyle. Ta ve firmě získala nadpoloviční podíl a podle zákulisních informací ji ocenila na více než miliardu korun.

Doteď přitom startup Memsource se 110 zaměstnanci nepoutal vůbec žádnou mediální pozornost a schválně se udržoval mimo radar. O specifickém překladatelském trhu, využití technologií umělé inteligence v překladatelství i velkém dealu v rozhovoru pro CzechCrunch hovořil technologický šéf firmy Dalibor Frívaldský.

Když se řeknou překladatelské technologie, představím si překladač jako například Google Translate. Vy ale asi působíte v jiné oblasti, že?
Ano, působíme v oblasti překladatelských technologií, a Google Translate je taková klasika, co si lidé představí, i když nejde o to samé. My překladač jako takový nevyvíjíme, naopak velké dodavatele strojových překladů jako Google, Microsoft, Amazon a tři desítky dalších integrujeme do jednoho nástroje.

Čeho se v rámci vašeho nástroje snažíte dosáhnout?
My se snažíme využít disruptivní potenciál technologií strojových překladů na překladatelském trhu. Tyto technologie jsou totiž pořád daleko od lidí, kteří je chtějí využít v praxi, například kvůli napojování se přes API. V Memsource se snažíme zmenšovat vzdálenost mezi technologiemi a překladateli.

david-2-min

David Čaněk, zakladatel a CEO Memsource

Foto: Memsource

Zmiňuješ, že jednotlivé překladatelské platformy integrujete do jednoho nástroje. To znamená, že když si chce překladatel něco přeložit, do Memsource nahraje text a vy vyberete nejlepší nástroj na překlad daného dokumentu?
Ano, tak funguje jedna z našich funkcionalit využívajících umělou inteligenci, Memsource Translate. Hodnotí kvalitu různých poskytovatelů strojových překladů. Ty se však neustále vyvíjí, každých několik měsíců firmy představují nové verze, a proto se náš systém sám automaticky učí vyhodnocovat, který z poskytovatelů aktuálně nabízí ten nejlepší překlad.

Jakým způsobem se to učí?
Jde o relativně jednoduchý reinforcement learning algoritmus (učící se na základě zpětné vazby – pozn. red.). Pokud ještě danou technologii algoritmus nezná, několikrát si modelově vyzkouší, jak se chová a jaké jsou její výsledky, které srovná s historicky nasbíranými daty od překladatelů. Pak dokáže doporučovat nejlepší nástroj pro překlad a čím více informací má, tím navíc získává sebejistotu, že dokáže vybrat tu optimálnější volbu.

Na co se při hodnocení překladačů algoritmy dívají?
Hodnocení probíhá na základě daného jazykového páru a nově přidáváme hodnocení o doméně daného textu, jestli jde například o právní nebo medicínský text, což dokážeme automaticky detekovat. Jedna část technologie tak hodnotí doménu daného textu a další část pak určí nejvhodnější překladač, protože ty mohou být v různých doménách různě kvalitní.

Co vás vůbec v překladatelské oblasti dovedlo k využívání umělé inteligence?
Několik let zpátky jsme si uvědomili, že od našich zákazníků z řad samostatných freelancerů přes agentury až po globální firmy máme k dispozici data o celém překladatelském procesu. Umělá inteligence začala získávat na popularitě, byla schopna řešit zajímavé problémy a my jsme se zamysleli, jak využít strojové učení, abychom překladatelům dokázali ještě víc zefektivnit práci.

Ve které části překladů jste začali umělou inteligenci využívat?
Úplně první technologie, kterou jsme postavili na umělé inteligenci, je detekce takzvaných nepřeložitelných segmentů. Zjistili jsme, že v některých případech jazykových párů se 10 až 15 procent textu vůbec nepřekládá. Když dokážeme určit, o které části textů jde, hodně tím ulehčíme práci překladatelů. Tuto technologii máme ve Spojených státech dokonce patentovanou, inspirovali jsme se konvulčními sítěmi používanými v oblasti počítačového vidění.

V technologiích se spoléháte na využívání strojových překladů třetích stran, nepřemýšleli jste někdy nad vývojem vlastního řešení?
Do vlastního strojového překladu se zatím nechceme pouštět hlavně kvůli tomu, abychom nezačali konkurovat gigantům a zároveň našim partnerům jako Google, Microsoft či Amazon. Automatizovaný překladač byl před lety první myšlenkou, jak jsme chtěli produktizovat funkcionalitu umělé inteligence. Vyžadovalo by to však mnoho zásahů a změn v aplikaci, byl by to obrovský projekt a hlavně pro nás tehdy byla AI (umělá inteligence) úplně nová a neprobádaná. Bylo by to moc odvážné, možná i příliš riskantní.

„Lidé budou potřební pořád, naše vizí není nahradit je technologiemi, ale pomoct jim s automatizací.“

Tuhle myšlenku jste tedy opustili?
Velké myšlenky jsme se proto rozhodli úplně zahodit a šli opačným přístupem, umělou inteligenci jsme dokázali zaintegrovat do řešení, která už existují. Šlo o rozšíření funkcionality a myslím, že to byl správný krok, protože to bylo jednodušší na uchopení pro nás i pro naše uživatele, kteří se nic nové nemuseli učit.

Jakým způsobem chcete produkt rozvíjet dál?
Náš hlavní cíl je pokračovat v podpoře technologií strojových překladů. Některé z nich například nabízejí generické překlady, které si můžete customizovat sami na vlastních datech, čímž se přizpůsobí vašim zvyklostem. Na to ale potřebujete připravit a očistit data, a právě s tím chceme pomoct našim zákazníkům, protože je to pořád spousta manuální práce. Když se to naučíme, máme v plánu automatizovat co největší část překladatelského procesu, abychom zákazníkům překladatelské technologie přiblížili ještě víc.

Když mluvíš o automatizaci co největší části procesu, je vaše vize to, aby vlastně do překladů už vůbec nevstupovali lidé?
Lidé budou potřební pořád, naší vizí není nahradit je technologiemi, ale pomoct jim s automatizací, na kterou je opravdu hodně prostoru. Lidský faktor je pořád dost potřebný, i když záleží na úrovni požadované kvality překladu. U právních dokumentů potřebujete perfektní kvalitu, kterou strojové překlady nejsou schopny dosáhnout a nelze se na ně spolehnout. Potřebujete lidi, aby text upravili a zkontrolovali.

groupphoto-min

Tým Memsource

Foto: Memsource

Jsou oblasti, kdy už lidský zásah po strojovém překladu není potřebný?
Například velké e-commerce firmy nepotřebují dokonalé překlady popisků produktů, jejich recenzí nebo technické dokumentace. Kvalita překladů je v této oblasti na postačující úrovni. Lidská práce je u překladů tou nejdražší i nejpomalejší položkou.

Proto se v těchto zmiňovaných případech prosazuje přístup, že všechny položky například při lokalizaci do jiného jazyka necháte projít strojovým překladem a až pak na základě dat od uživatelů, na které produkty se nejvíc dívají, investujete čas a pozornost lidských překladatelů, aby zvedli jejich kvalitu. U produktů, které nikoho nezajímají a nikdo se na ně nedívá, investovat čas do lidského překladu nepotřebujete a plně postačí strojový překlad.

Překladatelský software se tak propojuje s dalšími oblastmi?
Ano, jde o kombinování s data science nebo business intelligence nástroji. Ty dokážou ukázat části, které by měly být přeložené plně s pomocí lidí, a části, u kterých stačí jen surový překlad.

Pracujete na takových přepojeních i vy?
Spolupracujeme na tom s některými partnery. Do překladatelského procesu napojujeme Google Analytics a při sledování trafficu na webu vidíme, které překlady by ještě měly projít i zásahem člověka.

Vím, že je to spíš filozofická otázka, ale zeptat se musím. Myslíš si, že se vůbec někdy podaří dosáhnout takové technologické úrovně, že strojové překlady plně nahradí lidskou práci?
Jedna část mě si myslí, že ano, druhá, že ne. Ta, která nesouhlasí, vychází z toho, že se jazyk vyvíjí v čase a tenhle vývoj vychází od lidí. Proto si myslím, že člověk bude do překladů vstupovat pořád.

A která tvoje část si myslí, že ano?
Je možné, že se technologie strojového překladu naučí sledovat data z internetu a díky tomu se budou moct změnám v jazyce přizpůsobovat. V tomhle jsou zajímavé modely například od firmy OpenAI, a právě kvůli těmto pokrokům si moje část myslí, že k tomu může dojít. Netroufám si ale odhadnout, kdy by se to mohlo stát, protože nikdy nevíte, k jakým pokrokům v oblasti umělé inteligence dojde a jak nás překvapí.

screenshot_cloud_project

Nástroj Memsource

Foto: Memsource

Abychom se ale o něco vrátili, vize Memsource zaujala investiční firmu Carlyle se spravovanými aktivy více než 200 miliard dolarů, která u vás koupila nadpoloviční podíl. Proč jste se vůbec rozhodli hledat investora?
Memsource teď v srpnu oslavuje deset let a firma byla doteď vždy zisková, kromě seed investice byl všechen růst poháněný našimi prodeji. Proto jsme začali přemýšlet nad dalším krokem, abychom našli partnera, se kterým se shodneme na vizi a pomůže nám ji naplnit. Ve druhé polovině loňského roku jsme pak začali oslovovat potenciální zájemce. I když by transakce nedopadla, byl to pro nás způsob, jak získat zpětnou vazbu na produkt a jestli je náš plán z byznysového hlediska vůbec zajímavý.

Proč jste se nakonec rozhodli právě pro Carlyle?
Carlyle měl díky svým předchozím aktivitám přehled na překladatelském trhu, navíc jsme sdíleli vizi rozvoje Memsource. Co však bylo nejdůležitější, hodně jsme si navzájem sedli i po lidské stránce.

V čem vám tato investice pomůže, jak se chcete z tržního hlediska rozvíjet dál?
Aktuálně máme zákazníky rozdělené přibližně na třetiny ve Spojených státech, Evropě a celé Asii, jde o firmy jako Uber, Zendesk či Fujifilm až po samostatně působící freelancery. V každém z regionů chceme nadále upevňovat tržní pozici, například v USA ještě donedávna nebyl svět lokalizací tak rozvinutý, což se začíná měnit. Je tam hodně globálních firem, které potřebují technologie, aby jim s lokalizací a překlady pomohly.

amazon-alexa-prize

Přečtěte si takéČeský konverzační robot z ČVUT opět uspěl v prestižní soutěži Amazonu. Za bronz si odnáší přes milion korun

Jak se posilování tržní pozice bude projevovat na byznysových ukazatelích?
Opakující se roční tržby jsme ke konci loňského roku měli na úrovni osmi milionů dolarů, cílem pro letošek je dostat se na hranici jedenácti milionů dolarů (přibližně 250 milionů korun – pozn. red.). Myslím, že k tomu máme našlápnuto celkem dobře.

Teď už nabízíte komplexní řešení i pro globální korporace. Před deseti lety jste ale začínali s výrazně omezenějším produktem, čemu jste se tehdy věnovali?
Začínali jsme s vývojem nástroje tzv. computer-aided translation, ve kterém překladatel dělá svoji práci, ale má k tomu sadu podpůrných funkcionalit. Abych to vysvětlil na příkladu, představte si dokument napsaný ve Wordu. Pokud jej chcete přeložit, otevřete si vedle další okno Wordu a postupně jej překládáte. To však zabere mnoho času, musíte řešit například i formátování, což není úplně efektivní způsob práce.

Pokud v procesu využijete Memsource, nahrajete do něj dokument ve Wordu a systém automaticky text rozseká na věty. Překladatel je v jednoduchém rozhraní přeloží a opět stáhne do Wordu. Výhodou je osvobození od řešení formátování a strukturování dokumentu, lingvista se může soustředit čistě jen na překlad a šetří tím čas. Na tomhle procesu byly postaveny naše základy.

„Rozhodli jsme se rozšířit záběr, abychom dokázali pokrýt celý překladatelský ekosystém.“

Jak náročné bylo prosadit se na trhu s takovým produktem?
Když jsme tenhle nástroj vyvíjeli, byli jsme jedni z prvních fungujících v cloudu. Svět překladů nebyl moc otevřený novinkám, cloudové řešení bylo tehdy sprosté slovo. (smích) Všichni fungovali nebo požadovali řešení na desktop nebo on-premise. Trvalo dlouho, než se trh adaptoval na myšlenku, že firmy nebudou mít všechno u sebe.

Nakonec jste se na trhu uchytili a rozhodli jste se produkt rozšiřovat. Co vás k tomu vedlo?
Uvědomili jsme si, že pokrýváme jen část trhu – překladatele a segment překladatelských agentur. Další část trhu jsou pak samotné firmy, které řeší lokalizaci dokumentů, webů, aplikací a podobně. Rozhodli jsme se rozšířit záběr, abychom dokázali pokrýt celý překladatelský ekosystém.

Šlo tak o transformaci produktu?
Ano, začali jsme transformaci na komplexní řešení „translation management system“, ve kterém mají zákazníci na jednom místě plnou kontrolu a vhled nad všemi daty. Zejména když mají několik různých překladatelů, dává smysl, aby měli jeden nástroj, ze kterého proces centrálně řídí. Díky tomu se nám začalo dařit také v korporátním segmentu a získali jsme zákazníky jako například Uber.

Redaktor CzechCrunche, Slovák píšící česky. Buzzwords: Startupy, technologie, byznys, e-commerce.