Een vertaalladder aan mogelijkheden

Geplaatst op 14 augustus 2019 in blog, vertalen

We kunnen er echt niet meer omheen: ook de vertaalwereld gaat mee in de automatiseringsgolf. Lang dachten we dat het nog wel even zou duren voordat vertaalmachines iets behoorlijks zouden produceren. Maar in de afgelopen vijf jaar heeft de techniek grote stappen gezet met Neural Machine Translation, NMT.

Automatiseren waar dat kan

Natuurlijk waren we er al veel eerder van doordrongen dat je geen handwerk moet doen dat te automatiseren is. Waarom zou je een zin die vier keer voorkomt in een tekst vier keer opnieuw vertalen? Of waarom zou je alle vertaalde standaardteksten uit een financieel jaarverslag niet ergens opslaan voor later hergebruik? De hoeveelheid vertaalwerk neemt alleen maar toe, dus die tijdsbesparing was heel welkom. En daar kwam de kostenbesparing nog eens bij. Sneller en goedkoper. Wat wil je nog meer als de kwaliteit ook nog eens op peil blijft? Of zelfs beter wordt?

Slim omgaan met herhalingen

Dit leidde tot de brede invoering van Computer Assisted Translation tools*, professionele software die slim omgaat met herhalingen, matches en kwaliteit tegelijkertijd. Die de vertaler ondersteunt in het handwerk en de kwaliteitsnerds ook nog eens op hun wenken bedient. Zo is het vrijwel onmogelijk een zin over te slaan, worden cijfers automatisch overgenomen, neemt de consistentie in terminologiegebruik toe, kun je ingewikkelde namen snel inkopiëren en blijft de opmaak zonder veel gedoe intact. De software beschikt zelfs over een complete kwaliteitsmodule. Die controleert bijvoorbeeld op de aanwezigheid van dubbele spaties en of je vertaling niet onverwacht langer of korter is dan het origineel.

In de loop van de jaren voegden de bouwers allerlei handige features toe aan deze tools. Een functie die een vertaalsuggestie uit de database plukt voor een stuk of zes woorden midden in een zin. Of een functie die na herkenning van een kleine wijziging in de zin alvast de reparatie voorstelt. En steeds kun je als vertaler zelf beslissen of je accepteert wat de software je voorstelt of niet.

Vertaalmachines in opkomst

Bij het woord vertaalmachine denken de meeste mensen direct aan Google Translate. Logisch, want die optie wordt altijd aangeboden zodra we Google openen. En dat doen we vaak, heel vaak. Maar er zijn meer grote partijen die ziljoenen investeren in de ontwikkeling van neurale vertaalmachines: Microsoft, Amazon, Alibaba, Baidu. DeepL en de EU zijn er kleintjes bij.

Laten we even bij Google Translate blijven. Nog niet zo lang geleden produceerde die vooral klinkklare onzin. Dat kwam omdat de app alleen kon putten uit vertaalde zinnen die Jan en alleman in de Google megadatabase hadden gestopt (Statistical Machine Translation). Maar de concurrenten die ik al noemde stonden niet stil. Er kwamen zelflerende machines (NMT) op de markt die veel betere resultaten opleverden. Google werd gedwongen de boel op de kop te gooien. En daar zijn ze aardig in geslaagd.

Neurale netwerken

De huidige vertaalmachines werken allemaal met een neuraal netwerk**, een ingewikkeld systeem dat enigszins lijkt op de manier waarop ons brein herinneringen opslaat. Hoe het werkt? Een paar voorbeelden maken dat misschien enigszins duidelijk.

Gezichtsherkenning is een zeer complexe taak. Het betekent om te beginnen zoeken naar een oog, neus en mond, maar daarmee ben je er natuurlijk nog lang niet. Extra lagen moeten kijken naar wenkbrauw, neusgat en lip. Die lagen kunnen weer verder verfijnd worden naar kleur, neusvleugel, vorm. Op deze manier splits je ingewikkelde taken op in eenvoudige taken, wordt het abstractieniveau steeds hoger en de kans dat je het juiste gezicht herkent steeds groter.

Nog een voorbeeld. Tijdens het autorijden weeg je voortdurend het belang af van bepaalde impulsen, omdat die leiden tot andere output. Je gaat bij een bord 130 km bijvoorbeeld sneller rijden en langzamer als er een knipperlicht boven de weg hangt. Rood licht betekent stoppen, groen licht doorrijden. Als je de juiste afwegingen maakt met al die parameters, kom je veilig thuis. Doe je dat niet, dan krijg je een ongeluk. Dit is waar zelfrijdende auto’s op zijn gebaseerd.

Vertaalmachines doen iets soortgelijks met taal. Simpel gezegd berekenen ze basis van eerder verzamelde input hoe groot de kans is dat op een bepaalde plek een bepaald woord of bepaalde constructie de juiste keuze is. Hoe meer input, des te groter de kans van slagen. Ze zijn zelflerend.

Het resultaat

We hebben een aantal vertaalmachines aan het werk gezet om hun huidige vaardigheden voor vertalingen Nederlands-Engels te bekijken: Google Translate, DeepL, Microsoft Translate. De conclusie is dat individuele vertaalmachines soms veel op kunnen leveren, maar dat er ook nog heel veel te leren en te verbeteren valt.

Waar zijn ze goed in?

  • Ze produceren een tekst die na post-editing bruikbaar is voor interne doeleinden.
  • Ze zijn razendsnel en goedkoop.
  • Ze zijn veel beter dan een jaar of vijf geleden.

Waar zijn ze niet goed in?

  • Ze zijn nooit foutloos en slaan over wat ze niet begrijpen.
  • Ze zijn niet consistent in terminologiegebruik.
  • Kleinere talen zoals Nederlands en bepaalde vakgebieden leveren een minder goed resultaat op.
  • De machine is nooit creatief en kan niet interpreteren.
  • Het zelflerende vermogen is beperkt (zie voorbeeld verderop).
  • ‘Vertrouwelijk’ kun je bij de cloudversies wel vergeten.

DeepL werkt met een beperkt aantal talen. Google Translate verzamelt gegevens in de cloud. Microsoft scoort niet best op kwaliteit.

Vertaalwerk = maatwerk

Al met al komt het erop neer dat vertaalwerk meer dan ooit maatwerk is. Was er in vroeger jaren slechts één vertaalprocedure, nu is er een complete ladder aan mogelijkheden. Het profiel van de gewenste vertaling bepaalt de procedure, van intern document tot een tekst vol creatieve verbeeldingskracht.

 

* Afkorting: CAT tools. PassworD gebruikt dit soort tools sinds 1999. Voorbeelden zijn SDL Trados, memoQ, Déjà Vu en memsource.

** Over deep learning, convolutional neural network, deep neural networks, zie https://en.wikipedia.org/wiki/Convolutional_neural_network.

 

Meer over de vertaalladder.

 

Gerelateerde artikelen

Machinevertalingen, wat gaat goed en waar gaat het mis

In een vorig blog heb ik het uitgebreid gehad over Neural Machine Translation, afgekort als NMT. De laatste jaren is de techniek achter machine-vertalen met grote sprongen verbeterd. Maar er helemaal op vertrouwen kan echt nog niet. Daarvoor is nog heel veel nodig. De grote jongens als Microsoft, Amazon, Alibaba en Baidu investeren niet voor […]

Lees artikel
Machinevertalingen, wat gaat goed en waar gaat het mis

Een vertaler moet scherp zijn…

… en zijn gereedschap ook! Vertalen is een vak. En zoals bij elk vak, moet je over het juiste (en het beste) gereedschap beschikken. Maar wat zit er nou precies in de toolbox van een vertaler? Allereerst natuurlijk een computer en woordenboeken – tegenwoordig elektronisch en online. Maar er is nog meer. Vertalen gebeurt al […]

Lees artikel
gereedschap vertaler

Financieel vertaalwerk

Financieel vertaalwerk doen wij veel. Heel veel. Denk aan jaarverslagen, factsheets, maandelijkse updates, insights, noem maar op. Is dat niet heel specialistisch werk? Best wel. Zonder de nodige kennis wordt het lastig, maar het is ook een kwestie van het (financiële) nieuws volgen. Een vork en een steel Een thema dat nu veel in het […]

Lees artikel
Financieel vertaalwerk

Age Gate

Als vertalers bouwen we tijdens onze carrière een grote woordenschat op in de taal waaruit we vertalen. Soms komen we bijzondere woorden tegen die ons zo aanspreken dat we ze graag delen, we beginnen met age gate. Age gate Age gate is een eigentijds begrip dat ik tegenkwam in een tekst over websitebeveiliging. Op zich […]

Lees artikel
age gate, het leeftijdspoortje Heineken

 

CLIPS

De nieuwsbrief van PASSWORD

  • antwoorden op veelgestelde vragen
  • interessante ontwikkelingen
  • handige tips
  • en nog veel meer!

Ja, ik wil graag CLIPS ontvangen!