Computer krijgt geen tien voor taal

Op de campus van de Essex Universiteit in Colchester werd eind jaren tachtig voor het eerst een zin vertaald door een computersysteem. Dertig jaar later kun je automatisch vertalen, veelal gratis, met onder andere programma’s van Google, Microsoft en IBM. En Natural Language Processing (NLP) beperkt zich niet tot vertalen. Er is software die essentiële informatie uit teksten haalt, nieuwsberichten schrijft, gesprekken aangaat met klanten. De programma’s zijn nooit perfect, maar vaak verrassend goed en doorgaans voldoende voor gebruikers.

Taaltrainingen voor professionals in AmsterdamDoordat de rekenkracht van computers en de hoeveelheid data, mede door de komst van het wereldwijde web, enorm toenam, werden in plaats van ingewikkelde taalkundige theorieën krachtige computers en statistiek de basis van NLP-toepassingen. Dit nam een grote vlucht. ‘Je zou kunnen zeggen dat de theorie is ingehaald door de praktijk’, zegt Antal van den Bosch, hoogleraar taaltechnologie aan de Radboud Universiteit en directeur van het Meertens Instituut. ‘Er is een groot gat ontstaan tussen de theoretische taalkunde en machine translation. De laatste tijd zie je weer wat meer toenadering ontstaan tussen de twee vakgebieden’.
Dat heeft te maken met de recente ontwikkeling in de taaltechnologie: het gebruik van neurale netwerken. Algoritmen waarvan de werking losjes is gebaseerd op de werking van het menselijke brein. Neurale netwerken leren ook veel van data en werken statistisch, maar zijn flexibeler in het vinden van verbanden tussen woorden. Met deep learning ontdekken ze zelf complexe taalkundige kennis. Waar vertaalcomputers moeite hebben met relaties die ver uit elkaar liggen – bijvoorbeeld het onderwerp en de persoonsvorm in lange zinnen – kunnen neurale netwerken daar veel beter mee uit de voeten.

De pragmatische en commerciële toepassingen hebben computerlinguïstiek en NLP een enorme impuls gegeven. Er wordt grof geld verdiend in machine translation. Bloomberg is een voorbeeld van een bedrijf dat op grote schaal gebruikt maakt van taaltechnologie. Een op de drie nieuwsberichten van Bloomberg komt (deels) tot stand met behulp van NLP. Dit is mogelijk omdat financieel taalgebruik zelden dubbelzinnig is en er is weinig noodzaak tot creativiteit; precies de zaken waar taalsoftware slecht mee uit de voeten kan.
In de financiële wereld is een groot commercieel belang bij snelle tekst- of spraakverwerking. Een geheel automatisch gemaakt bericht over bijvoorbeeld kwartaalcijfers kan binnen enkele seconden online staan. Een reporter doet daar minuten over. De beurskoers kan in die tijd al procenten zijn gestegen of gedaald.
Bloomberg maakt ook gebruik van neurale netwerken. Maar ondanks de exponentieel toegenomen rekenkracht is soms de servercapaciteit een probleem. Voor geavanceerde taaltechnologie heb je enorme hoeveelheden data nodig. En om daar dan weer algoritmen op los te laten vereist veel van de servers.

Journalisten hoeven zich voorlopig nog geen zorgen te maken over hun werk. Voor de echte interpretatie en diepere analyse van taal zijn mensen nodig. Hoe meer data er (geautomatiseerd) beschikbaar komen, hoe harder menselijke interpretatie en analyse nodig zijn, en hoe belangrijker een geïnspireerde en creatieve weergave. De robot met menselijk taalgevoel is nog ver weg.

Bron: Het Financieele Dagblad, zaterdag 31 augustus 2019.

Een taal leren nog steeds noodzakelijk voor zakendoen in het buitenland

Het automatisch vertalen heeft grenzen (nog verder) vervaagd en daarmee ons leven vergemakkelijkt. Maar, om succesvol zaken te kunnen doen is het belangrijk dat u de taal van uw gesprekspartner leert. Dit om hem of haar aan te kunnen voelen, verbanden te kunnen leggen en elkaar dus echt te kunnen ‘begrijpen’. Neem voor meer informatie over onze taaltrainingen en/of cultuurtrainingen contact met ons op: tel (020) 609 79 70. Of stuur een e-mail naar: info@europeanlanguagecentre.nl.