Een vertaalladder aan mogelijkheden

Geplaatst op 14 augustus 2019 in blog, vertalen

We kunnen er echt niet meer omheen: ook de vertaalwereld gaat mee in de automatiseringsgolf. Lang dachten we dat het nog wel even zou duren voordat vertaalmachines iets behoorlijks zouden produceren. Maar in de afgelopen vijf jaar heeft de techniek grote stappen gezet met Neural Machine Translation, NMT.

Automatiseren waar dat kan

Natuurlijk waren we er al veel eerder van doordrongen dat je geen handwerk moet doen dat te automatiseren is. Waarom zou je een zin die vier keer voorkomt in een tekst vier keer opnieuw vertalen? Of waarom zou je alle vertaalde standaardteksten uit een financieel jaarverslag niet ergens opslaan voor later hergebruik? De hoeveelheid vertaalwerk neemt alleen maar toe, dus die tijdsbesparing was heel welkom. En daar kwam de kostenbesparing nog eens bij. Sneller en goedkoper. Wat wil je nog meer als de kwaliteit ook nog eens op peil blijft? Of zelfs beter wordt?

Slim omgaan met herhalingen

Dit leidde tot de brede invoering van Computer Assisted Translation tools*, professionele software die slim omgaat met herhalingen, matches en kwaliteit tegelijkertijd. Die de vertaler ondersteunt in het handwerk en de kwaliteitsnerds ook nog eens op hun wenken bedient. Zo is het vrijwel onmogelijk een zin over te slaan, worden cijfers automatisch overgenomen, neemt de consistentie in terminologiegebruik toe, kun je ingewikkelde namen snel inkopiëren en blijft de opmaak zonder veel gedoe intact. De software beschikt zelfs over een complete kwaliteitsmodule. Die controleert bijvoorbeeld op de aanwezigheid van dubbele spaties en of je vertaling niet onverwacht langer of korter is dan het origineel.

In de loop van de jaren voegden de bouwers allerlei handige features toe aan deze tools. Een functie die een vertaalsuggestie uit de database plukt voor een stuk of zes woorden midden in een zin. Of een functie die na herkenning van een kleine wijziging in de zin alvast de reparatie voorstelt. En steeds kun je als vertaler zelf beslissen of je accepteert wat de software je voorstelt of niet.

Vertaalmachines in opkomst

Bij het woord vertaalmachine denken de meeste mensen direct aan Google Translate. Logisch, want die optie wordt altijd aangeboden zodra we Google openen. En dat doen we vaak, heel vaak. Maar er zijn meer grote partijen die ziljoenen investeren in de ontwikkeling van neurale vertaalmachines: Microsoft, Amazon, Alibaba, Baidu. DeepL en de EU zijn er kleintjes bij.

Laten we even bij Google Translate blijven. Nog niet zo lang geleden produceerde die vooral klinkklare onzin. Dat kwam omdat de app alleen kon putten uit vertaalde zinnen die Jan en alleman in de Google megadatabase hadden gestopt (Statistical Machine Translation). Maar de concurrenten die ik al noemde stonden niet stil. Er kwamen zelflerende machines (NMT) op de markt die veel betere resultaten opleverden. Google werd gedwongen de boel op de kop te gooien. En daar zijn ze aardig in geslaagd.

Neurale netwerken

De huidige vertaalmachines werken allemaal met een neuraal netwerk**, een ingewikkeld systeem dat enigszins lijkt op de manier waarop ons brein herinneringen opslaat. Hoe het werkt? Een paar voorbeelden maken dat misschien enigszins duidelijk.

Gezichtsherkenning is een zeer complexe taak. Het betekent om te beginnen zoeken naar een oog, neus en mond, maar daarmee ben je er natuurlijk nog lang niet. Extra lagen moeten kijken naar wenkbrauw, neusgat en lip. Die lagen kunnen weer verder verfijnd worden naar kleur, neusvleugel, vorm. Op deze manier splits je ingewikkelde taken op in eenvoudige taken, wordt het abstractieniveau steeds hoger en de kans dat je het juiste gezicht herkent steeds groter.

Nog een voorbeeld. Tijdens het autorijden weeg je voortdurend het belang af van bepaalde impulsen, omdat die leiden tot andere output. Je gaat bij een bord 130 km bijvoorbeeld sneller rijden en langzamer als er een knipperlicht boven de weg hangt. Rood licht betekent stoppen, groen licht doorrijden. Als je de juiste afwegingen maakt met al die parameters, kom je veilig thuis. Doe je dat niet, dan krijg je een ongeluk. Dit is waar zelfrijdende auto’s op zijn gebaseerd.

Vertaalmachines doen iets soortgelijks met taal. Simpel gezegd berekenen ze basis van eerder verzamelde input hoe groot de kans is dat op een bepaalde plek een bepaald woord of bepaalde constructie de juiste keuze is. Hoe meer input, des te groter de kans van slagen. Ze zijn zelflerend.

Het resultaat

We hebben een aantal vertaalmachines aan het werk gezet om hun huidige vaardigheden voor vertalingen Nederlands-Engels te bekijken: Google Translate, DeepL, Microsoft Translate. De conclusie is dat individuele vertaalmachines soms veel op kunnen leveren, maar dat er ook nog heel veel te leren en te verbeteren valt.

Waar zijn ze goed in?

  • Ze produceren een tekst die na post-editing bruikbaar is voor interne doeleinden.
  • Ze zijn razendsnel en goedkoop.
  • Ze zijn veel beter dan een jaar of vijf geleden.

Waar zijn ze niet goed in?

  • Ze zijn nooit foutloos en slaan over wat ze niet begrijpen.
  • Ze zijn niet consistent in terminologiegebruik.
  • Kleinere talen zoals Nederlands en bepaalde vakgebieden leveren een minder goed resultaat op.
  • De machine is nooit creatief en kan niet interpreteren.
  • Het zelflerende vermogen is beperkt (zie voorbeeld verderop).
  • ‘Vertrouwelijk’ kun je bij de cloudversies wel vergeten.

DeepL werkt met een beperkt aantal talen. Google Translate verzamelt gegevens in de cloud. Microsoft scoort niet best op kwaliteit.

Vertaalwerk = maatwerk

Al met al komt het erop neer dat vertaalwerk meer dan ooit maatwerk is. Was er in vroeger jaren slechts één vertaalprocedure, nu is er een complete ladder aan mogelijkheden. Het profiel van de gewenste vertaling bepaalt de procedure, van intern document tot een tekst vol creatieve verbeeldingskracht.

 

* Afkorting: CAT tools. PassworD gebruikt dit soort tools sinds 1999. Voorbeelden zijn SDL Trados, memoQ, Déjà Vu en memsource.

** Over deep learning, convolutional neural network, deep neural networks, zie https://en.wikipedia.org/wiki/Convolutional_neural_network.

 

Meer over de vertaalladder.

 

Gerelateerde artikelen

Age Gate

Als vertalers bouwen we tijdens onze carrière een grote woordenschat op in de taal waaruit we vertalen. Soms komen we bijzondere woorden tegen die ons zo aanspreken dat we ze graag delen. Age gate Age gate is een eigentijds begrip dat ik tegenkwam in een tekst over websitebeveiliging. Op zich was het niet moeilijk. Ik […]

Lees artikel
leeftijdspoortje Heineken

Beginnende vertalers moeten meters maken

Een naaf, een koppel, groepsets, crankarmen… enig idee waar deze woorden betrekking op hebben? Ik zie de sportieve mountainbikers onder u denken… makkie! Maar misschien is het niet voor iedereen gelijk duidelijk waar dit over gaat. Ik zal eerlijk bekennen: toen ik deze termen voor het eerst las, ging bij mij ook niet direct een […]

Lees artikel
kopje koffie met de buurvrouw

Ben jij een klantvriendelijke vertaler?

Er spoken een paar vragen door mijn hoofd. Ze hebben met klantvriendelijkheid te maken. Met werkelijk luisteren naar de klant. Met persoonlijk contact en gunnen. Met gelijkwaardigheid en trots. Ik ga ze maar eens gewoon stellen. Vraag 1 – de offerte De eerste is makkelijk. Vraagt een klant je wel eens een offerte op te […]

Lees artikel

Lettervreters en taalpietlutten

‘Ik ben vertaler.’ ‘O, leuk! Wat voor boeken?’ ‘Ik studeer aan de Vertaalacademie.’ ‘Sorry? De Vertélacademie?’ ‘En welke talen vertaal je dan allemaal?’ ‘Nou, Duits en Engels.’ ‘O.’ ‘…’ Geen dag hetzelfde Een greep uit de uitwisselingen die met de regelmaat van de klok plaatsvinden wanneer ik over mijn dagelijkse werkzaamheden vertel. Dikwijls worden mijn […]

Lees artikel
Blog Jenneke

 

CLIPS

De nieuwsbrief van PASSWORD

  • antwoorden op veelgestelde vragen
  • interessante ontwikkelingen
  • handige tips
  • en nog veel meer!

Ja, ik wil graag CLIPS ontvangen!