Passion för maskinöversättning

Passion för maskinöversättning

Europeiska föreningen för maskinöversättning EAMT anordnade i slutet på maj sin 20:e årliga konferens i Prag. På EAMT träffas ett brett spann av intressenter inom maskinöversättning, från forskare och återförsäljare till utvecklare och redaktörer. Cirka 100 personer deltog i konferensen, de flesta av dem forskare och utvecklare. En sak hade dock alla gemensamt, nämligen en passion för maskinöversättning.

Publicerad 2017-08-10

Du sköna nya värld

Detta var första gången jag deltog i konferensen, vilket gav mig tillfälle att komma i kontakt med en helt ny värld: maskinöversättningens akademiska sida. Översättningsbyråernas intresse för maskinöversättning tenderar snarast att vara av kommersiell natur. I mitt arbete är fokuset istället högst konkret (hur inlemmas maskinöversättning i produktionsflödet?), praktiskt (hur ska efterredigering kompenseras och hur tar man betalt av kunder?) och ibland psykologiskt (hur utbildar man användare i efterredigering, och hur övertygar man översättare att maskinöversättning inte behöver vara ett hot?).

Den sista punkten kan vara värd att dröja vid, då detta utgör den största skillnaden mellan den akademiska och den kommersiella världen. Där jag kommer ifrån är det fortfarande många som är rädda för eller motsätter sig maskinöversättning. På konferensen mötte jag istället människor med en passion för maskinöversättning, som aktivt arbetar med det och säkert till och med drömmer om det på nätterna. När jag föreslog för en att utvecklarna att ta en öl efter middagen (detta var trots allt i Prag!) svarade han till exempel: “Ok, men bara en, sen måste jag tillbaka till hotellet och träna igång ett nytt nervsystem”. Ganska imponerande!

Kanske, kanske inte

NMT (Neural maskinöversättning) var helt klart ett av konferensens hetaste ämnen. Vid en lunch var det till exempel två forskare som debatterade NMT. Den ena hävdade att NMT är bättre än SMT (statistisk maskinöversättning) medan den andra, själv en av de främsta experterna på NMT, hävdade motsatsen. Vem hade rätt? “Bättre” för en forskare behöver absolut inte betyda samma sak som “bästa” systemet för mig och mina kunder. Exemplet visar dock tydligt passionen för maskinöversättning bland dem jag träffade. Det vore sannerligen inte fel med mer sådan passion i min egen omgivning!

Ett annan intressant fråga handlade om QE, det vill säga kvalitetsbedömning, eller hur man går till väga för att förutse kvaliteten på maskinöversättningar och därmed undviker att sända skräp på efterredigering. Detta är en fantastisk idé som skulle underlätta efterredigeringen för översättarna mycket. Även här förklarar dock vissa QE vara helt nödvändigt, medan andra samtidigt tycker sig veta att det kan hoppas över helt och hållet. Detsamma gäller för BLEU-värdet (en automatisk mätfaktor som anger kvaliteten på färdig maskinöversättning), vilket vissa anser vara meningslöst inom NMT. Detta är inte något oresonligt påstående. Samtidigt var BLEU det kvalitetsmått som togs upp oftast under konferensen. Under de tre dagarna märkte jag detta om och om igen: inget svar är någonsin det slutgiltiga, och “det beror på” var ofta svaret på många frågor.

Passion och algoritmer

Förutom de många intressanta frågorna var den stora behållningen med konferensen att få möta alla de människor som inom området fått möjlighet att kunna förverkliga sin passion. Forskare och utvecklare verkar oftast inte under samma kommersiella tryck, och har därför gott om tid. Detta ger dem lyxen att kunna utföra alla möjliga experiment för att kontrollera en teori eller ett fenomen. Dagar, veckor eller månader kan gå åt till att testa en språkmodell, optimera algoritmer, eller jämföra alignmentmetoder. Det handlar om morfologi, n-gram, uppmärksamhet, lexikalanalys, och mycket annat. Allt detta är mycket avancerat och djupgående, och extremt teoretiskt. Som en av deltagarna berättade för mig: ”På mitt eget område är jag expert, men tyvärr finns det förmodligen bara fem personer i världen som förstår det jag håller på med”! Detta gör dock inte att man bör avfärda eller skratta åt forskarvärlden (vilket somliga där jag kommer ifrån gärna gör). Mycket bättre vore om vi gav våra öron och framför allt vår respekt åt alla dessa forskare och utvecklare. Det är deras passion och deras algoritmer som skapat maskinöversättningen av idag.

Senaste bloggposter