Terminologie van de taalsectorTaalsector, taalprofessional, taalberoep, taalwerk. Vier eenvoudige termen. Iedereen verstaat wat ermee bedoeld wordt. Maar hoe zeg je taalprofessional in het Frans? Of taalsector in het Engels?

Liesbet Van Oudenhove zocht het uit tijdens haar stage bij De Taalsector. Ze verzamelde de terminologie van de taalsector en ging vervolgens op zoek naar een plek om haar termen te delen én er met de "community of interest" conversatie over te hebben. Want de taalsector leeft en is volop in beweging. Het kan niet anders dan dat ook de terminologie meeswingt. Dit is het verslag van haar avontuur.


Liesbet Van Oudenhove, Gent - Om een beeld te krijgen van de terminologie van de taalsector, neem ik eerst en vooral een kijkje op de website van De Taalsector. In de baseline van De Taalsector “de taalprofessionals aan het woord” vind ik al meteen een interessante term: taalprofessional. Maar wie of wat is dat precies, een taalprofessional? En hoe vertaal je deze term bijvoorbeeld in het Frans?


Taalprofessional, zo leer ik snel, is iedereen die beroepsmatig taalwerk verricht: copywriter, taaldocent, tolk, taaltechnoloog, technisch redacteur, (eind)redacteur, geletterdheidswerker, taalbeleidscoördinator, logopedist, vertaler, dialectoloog, woordenboekmaker, taalcoach, audiobeschrijver en verder nog een hele waaier professionals die met taal- en taalgerelateerd werk de kost verdienen.

Systran, de vertaalmachine die The Language Industry (thelanguageindustry.eu) voor Franse vertalingen uit het Nederlands gebruikt, geeft ‘professionnel de la langue’ als vertaling. Google Translate geeft ‘professionnel langue’. Het is duidelijk: de vertaalmachines hebben het moeilijk met de term taalprofessional.

En hoe zit het met de menselijke vertalers? Om dit te achterhalen doe ik een beroep op verschillende internetfora en Facebookgroepen voor professionele vertalers. Het bericht dat ik er post, vraagt naar een Franse vertaling van ‘taalprofessional’ aan de hand van een tekstje over de Language Industry Awards (LIA’s). Ik post mijn bericht op zes verschillende plaatsen en krijg vier antwoorden, allemaal verschillend. De ene vertaler kiest voor ‘un professionnel de la langue’, de andere zegt ‘professionnel linguistique’. Nog een andere stelt ‘professionnel des langues’ of ‘professionnel en langues’ voor. Conclusie: deze term is niet enkel problematisch voor vertaalmachines, maar ook menselijke vertalers hebben het er moeilijk mee.

Als ‘taalprofessional’ al een probleemterm is in het Frans, hoe zou het dan zijn met taalwerk, taalberoep, taalproduct, taaldienst en andere sleuteltermen uit de taalsector? En in andere talen dan het Frans? Inderdaad, de vertalers schieten alle kanten uit. Dat is op zich niet erg, maar het laat wel zien hoeveel verschillende conceptuele ladingen een term kan dekken. En het probleem is dus groter dan ik dacht. Het blijkt het onderzoeken waard.

Om te beginnen wil ik snel en efficiënt de belangrijkste taalsectorspecifieke termen in het Nederlands verzamelen. Ik doe dat op verschillende manieren: ik zoek manueel termen op op de website van De Taalsector, ik laat sectorspecialist Dries Debackere een mindmap van de taalsector maken, én ik gebruik termextractietools. Dat zijn tools die automatisch termen uit een corpus halen. Dat lijkt me nuttig, want het corpus van De Taalsector telt meer dan een miljoen woorden.

Na een heuse zoektocht vind ik drie termextractietools die me kunnen helpen. De eerste is AntConc, eigenlijk geen echte termextractietool maar een concordantieprogramma. Met AntConc zoek ik termen en collocaties waarin de string ‘taal’ voorkomt. Met deze handige tool zie ik snel waar en hoe deze termen en collocaties voorkomen.
De volgende tool die ik probeer, is TermTreffer, een tool van de Nederlandse Taalunie. Hiermee kunnen termen uit een Nederlandstalig corpus gehaald worden. TermTreffer is een online tool waarvoor je moet registreren. Je inloggegevens moet je via mail aanvragen. Dat is omslachtig. Eenmaal ingelogd gaat het extraheren wel snel. Je laadt je corpus op en je krijgt je termen terug. TermTreffer haalt uit ons corpus van een miljoen woorden maar liefst 22.600 termen (waarvan overigens geen enkel werkwoord). Dat is niet efficiënt.
Een andere tool die ik gebruik, is TExSIS, een tool van Universiteit Gent. Omdat je voor TExSIS niet in een keer een heel corpus van een miljoen woorden kunt opladen, stuur ik het in tien stukken op per e-mail. Een paar dagen later krijg ik de resultaten: een lijst van 50.000 termen.

Aangezien er zoveel termen gevonden worden, vraag ik me af in hoeverre de termextractietools wel betrouwbaar zijn. Ik besluit om zelf een manuele termextractie uit te voeren op een representatief aantal willekeurig gekozen artikels op de website van De Taalsector. Ik vergelijk mijn eigen termenlijst met de lijsten van de genoemde termextractietools. De termen die AntConc vindt, komen voor 16% overeen met mijn manuele termextractie. Bij TermTreffer is dit slechts 7%. TExSIS doet het beter, deze tool vindt ongeveer 50% van mijn manueel geëxtraheerde termen terug, maar geeft tegelijk ook de meeste non-termen.

De taalsector is geen Nederlandstalig onderonsje. De Europese taalsector spreekt 24 officiële talen. Taalsectorspecifieke terminologie is dus ook over de taalgrenzen heen nuttig. Vertalers en vertaalmachines zouden vlot toegang moeten hebben tot een meertalig terminologiebestand. Dat zo’n bestand nuttig zou zijn, laten niet alleen de vertalers en hun reacties op fora en in discussiegroepen zien, maar ook de diverse vertaalmachines die aan de meertalige website van The Language Industry zijn aangekoppeld. Er moet dus ook nagedacht worden over een formaat dat zowel voor de vertaler als voor de machine hanteerbaar is. Dat formaat bestaat. Het heet TBX, maar ik heb het niemand zien gebruiken.

Wat echt zou helpen, is dat we als taalprofessionals onze taalsectorterminologie zouden kunnen beheren en delen op een plaats waar iedere taalprofessional ze mee kan helpen beheren én waar er over de termen gedebatteerd kan worden. Beheren, delen en debatteren op dezelfde plek dus. Om zo’n plek te vinden onderzoek ik enkele webgebaseerde platformen waar terminologie beheerd en gedeeld kan worden.

Zo kom ik terecht bij evoTerm, een betalend terminologiebeheersysteem waar je honderd procent de baas blijft over de inhoud die je er plaatst, anderen toegang kan geven tot jouw aangemaakte termenbanken en waar je zelf kan beslissen of een gebruiker wijzigingen mag doorvoeren. De interface kan ingesteld worden in het Engels, Frans, Duits en Nederlands. Dit lijkt een goed systeem, maar er kan jammer genoeg niet gedebatteerd worden. De debatfunctie is echt belangrijk, want de terminologie van de taalsector is nog jong en onstuimig.

Een ander termbeheersysteem dat ik onder de loep neem, is TermBeheerder, ook een technologie van de Taalunie en ontwikkeld door CrossLang (Gent). Het systeem slaat je termen op (die je overigens nadien nog kunt wijzigen), je kan veel contextuele informatie toevoegen aan je term én – en dat is precies wat ik zoek en wat de taalsector volgens mij nodig heeft - andere gebruikers kunnen er gemakkelijk opmerkingen geven en discussie voeren. Jammer genoeg is deze webgebaseerde tool nog steeds in bèta-versie. Ik heb er wat termen opgeladen, maar niemand kan ermee aan de slag. Ook jammer is dat de interface enkel in het Nederlands is. Als we de interface meertalig zouden kunnen maken, zou TermBeheerder een goede meertalige omgeving kunnen zijn om termen in te verzamelen en te beheren én er conversatie over te voeren. 

Conclusie: er is nog veel werk aan de winkel van de taalsectorspecifieke terminologie. Er is vooral nood aan een plek waar de taalprofessionals met elkaar in conversatie kunnen gaan over hun eigen terminologie in verschillende talen. Deze plek is bij voorkeur dezelfde plek waar de terminologie wordt beheerd en gedeeld.


Wilt u graag reageren? Heeft u suggesties? Stuur uw reactie naar Dit e-mailadres wordt beveiligd tegen spambots. JavaScript dient ingeschakeld te zijn om het te bekijken..


Meer info:

http://www.termbeheerder.org/

http://www.termtreffer.nl/

http://www.evoterm.net/

http://www.thelanguageindustry.eu/