Har vi gått i mål nu? – en kort maskinöversättningshistoria

Har vi gått i mål nu? – en kort maskinöversättningshistoria

Sedan något år tillbaka har ett nytt begrepp dykt upp på språkhimlen: neural maskinöversättning. Alla språkteknikforskare är väldigt positiva till detta nya begrepp. Vad är det då för något? Kommer det att ge oss perfekta automatiska och omedelbara översättningar? Har vi gått i mål nu?

Publicerad 2017-02-13

50-talet – regelbaserad maskinöversättnings rötter

Maskinöversättning har funnits sedan mitten av 1950-talet – med andra ord ungefär lika länge som Elvis Presleys musik. Den slags maskinöversättning man då använde var regelbaserad, vilket innebär att datorn försöker identifiera alla språkliga faktorer (till exempel vilket ord som är verb, substantiv, bindeord o.s.v.), för att sedan kunna maskinöversätta och lägga dem i en strukturellt korrekt mall för det språk man översätter till.

Man kan tycka att det låter som ett rimligt angreppssätt men det visade sig vara mycket svårare än man trott. Regelbaserad maskinöversättning gav endast ett hyggligt resultat och under förutsättning att det var rätt språkkombinationer. Ofta blev resultatet helt obegripligt.

Millennieskiftet – statistisk maskinöversättning

Inte förrän vid millennieskiftet tog maskinöversättning nästa stora kliv framåt. Då hade datorerna blivit kraftfulla nog för att kunna hantera och leverera statistisk maskinöversättning.

Lite förenklat är statistisk maskinöversättning när datorn översätter orden och sedan räknar ut den mest sannolika ordning de ska ställas upp i. Den stora skillnaden mellan regelbaserad och statistisk maskinöversättning är att i statistisk maskinöversättning struntar datorn i all form av grammatik. Det låter ganska galet, men det visade sig att om man gav datorn stora textmängder nog att bygga sin statistiska modell på, så fick man ett bättre resultat än regelbaserad maskinöversättning kunde prestera, men långt ifrån perfekt.

Idag – neural maskinöversättning

Det senaste inom maskinöversättning är att datorerna blivit så kraftfulla att man nu experimenterar med neural maskinöversättning. Neural maskinöversättning fungerar efter principer som liknar de för statistisk, men med skillnaden att datorprogrammet, mycket förenklat, inte bara samlar statistik om ord utan om alla samband i texten ner till teckennivå. Datorprogrammet vet inte ens om att den översätter språk, utan gissar vilka bokstäver som bör ligga intill varandra, vilket producerar förvånansvärt bra översättningar. Tekniken hänger samman med utvecklingen av självlärande maskiner och artificiell intelligens. Datorerna som används bearbetar data ungefär på samma sätt som våra hjärnor.

Men var står vi nu?

Är neural maskinöversättning så bra som det påstås? Svaret är att resultatet blir mycket bättre än statistisk maskinöversättning och särskilt mellan de språk som statistisk maskinöversättning fortfarande har problem med. Men felfritt? Nej, långt ifrån. Neural maskinöversättning är fortfarande i sin linda.

Var står Semantix?

På Semantix arbetar vi aktivt med maskinöversättning och tänker hålla oss kvar i spetsen av den tekniska utvecklingen. Neural maskinöversättning kommer att komma på bred front under de närmaste åren och kommer tveklöst att höja ribban för vad vi kan åstadkomma med maskiners hjälp. Semantix kommer att börja arbeta med neural maskinöversättning så snart det blir tillgängligt.

Senaste bloggposter