Gent, 15 december 2022 - Dries Debackere) Lange cycli zijn fijn. Je ziet ze van ver komen, en je kunt ze niet missen, ook niet als je even verstrooid bent geweest. Steenkool, stoommachine, trein. Olie, plastic, auto. Zon, computer, data. Die laatste cyclus draait overigens nog lang niet op volle toeren. De zon kan nog oneindig veel meer energie leveren, de computers worden nog veel krachtiger en de honger naar data lijkt niet te stillen.

Iedereen copywriter

Ook de honger naar taaldata is niet te stillen, en daarmee zitten we in de taalsector ... en ook in de actualiteit natuurlijk. Tenzij je de afgelopen twee weken wel erg verstrooid bent geweest, heb je minstens een paar keer met ChatGPT gespeeld.

Gewone mensen praten nu over hun nieuw verworven vaardigheden: slogan bedenken, biootje schrijven, tekst samenvatten, aanbevelingsbriefje schrijven, argumenten halen om een korting te krijgen, lijstjes maken. Ja, gewone mensen kunnen nu ook copywriten. Vertalen konden ze al; daar hebben ze Google Translate en Deepl voor. Nu we twee weken verder zijn, schrijven ook leerlingen en studenten niet meer zonder suggesties van ChatGPT, zoals ze al niet meer vertaalden zonder vertaaltools. Gelijk hebben ze, want deze technologieën gaan niet meer weg, het zijn gebruiksvoorwerpen geworden. Gewone mensen, leerlingen en studenten schrijven nu met een beetje hulp van hun nieuwe maatje spectaculair betere teksten dan ze ooit op eigen houtje zouden kunnen schrijven. Ze geven het graag toe, ze zeggen het zonder gêne, ze zijn blij.


Taalkwaliteit aan de bron bewaken

In de coulissen staan er intussen tientallen GPT's klaar, inzetbaar voor alles en nog wat, ook voor specifieke doeleinden. Sommige voor de consument, andere voor de professionals, nog andere enkel voor de grote jongens. Sommige zullen gratis zijn, andere te betalen. Maar allemaal verslinden ze taaldata, meer en nog meer. En allemaal worden ze getraind, meer en beter. En zoals in eerdere lange cycli de kwaliteit van de grondstof gaandeweg aan belang won, zo wordt de kwaliteit van de taaldata die we aan onze taalmodellen en taalproductieprocessen voeden steeds belangrijker. Kwaliteitsbewaking verschuift naar de bron. Vergeet post-editing van machineoutput, daar hebben we binnenkort een GPT voor.


Overal GPT"s

Er komt nog oneindig veel meer content, meer beeld, meer voice, meer modi, meer talen. Met dank aan steeds meer en betere data en steeds meer en betere training van taalmodellen. Akkoord, de content is steeds minder voor menselijke consumptie en steeds vaker voor de machines bedoeld. Content gegenereerd door machines voor machines. Als het echt nodig is, vat een van die machines het nog wel even samen voor de mens.

Meer, beter en straks ongetwijfeld ook overal. Want we gaan de GPT's via API integreren in onze agenda en ons mailprogramma, toch? Als Canva tekst-naar-beeldgenerator Stable Diffusion kan integreren, dan kan Word toch ook ChatGPT integreren? Binnenkort praten de GPT's ook met het internet en met de zoekrobots (met Bing vermoedelijk eerder dan met Google Search), kunnen ze voor ons opzoekingen verrichten en de zoekresultaten samenvatten in een prettig chatformaat.

En voor de schrijf- en vertaalprofessionals onder ons, een werkstation of TMS (translation management system) met een batterij GPT's naast de vertaalmachines, dat is toch niet vergezocht? Voor wanneer? 


Fundamentele keuzes voor taalprofessionals

Maar ten gronde, wat betekent het taaldatatijdperk voor de taalprofessionals? Ga jij als Charlie Chaplin in Modern Times aan de band staan en machineoutput post-editeren, typisch het werk waarvoor we binnenkort ook wel een GPT hebben? Of ga jij zelf taalproductieprocessen aansturen, kwaliteit van taaldata aan de bron bewaken, los van de vraag of het taaldata zijn als grondstof voor een taalmodel, voor een machinaal dan wel een creatief, ambachtelijk, intellectueel uitdagend taalproductieproces?

Ambieer je dat laatste, dan heb je aan de schrijfrobots, vertaalmachines en andere tools en taaltechnologieën een ideale copiloot die jou een eindeloze stroom creatieve suggesties kan aanreiken, waardoor je taalwerk nog beter, nog kostenefficiënter of nog sneller geleverd kan worden, naargelang van je verdienmodel natuurlijk. En oké, ChatGPT heeft nog geregeld hallucinatiebuien, praat bedrieglijk zelfverzekerd, maar dat komt wel goed. Bedenk dat we aan het begin van de taaldatarevolutie staan, niet aan het einde. Ook ethisch is ChatGPT moeilijk op grove misstappen te betrappen; het systeem lijkt wel met een soort waardensysteem te zijn gevoed.

En dan is er nog de context. Ook op dat vlak staan we met zekerheid nog maar aan het begin van het tijdperk. Wat als de GPT's straks veel, maar dan ook echt véél meer context kunnen behappen? En met het internet in verbinding staan? En met je agenda, je mail en je teksteditors overal: in je Office-apps, in je cms, op je socials en waar je ook maar content creëert?

Tja, waar ligt dan nog de taallat voor de taalprofessionals? Op de grond? Of net nog veel hoger dan vandaag? De taalprofessional van morgen heeft een arendsoog voor taal en kijkt dwars door de bedrieglijk zelfzekere taal van meester-bullshitters als ChatGPT. Daar is een dubbele bagage voor nodig: een taalbagage maar ook een diep inzicht in taaltechnologie en in de productie en aanlevering van kwaliteitsvolle taaldata, of het nu voor tekstgeneratie, automatische spraakherkenning, voice over of vertalen is. Zonder deze dubbele bagage beland je aan de band in de taalfabriek en ben je gedoemd tot post-editeren ... tot de GPT je komt vervangen.


Vertalen als concept op zijn retour?

Misschien is het vertaaltijdperk twee weken geleden over zijn hoogtepunt gepasseerd, nu iedereen weet dat ChatGPT met een eenvoudige prompt én vooral ook zonder brontekst een hoop wervende teksten kan genereren in diverse talen en aangepast aan diverse doelpublieken met diverse noden en interesses, in diverse landen ook. Waarom zou je nog een brontekst schrijven en dan (laten) vertalen en reviseren en eventueel ook nog reviewen en adapteren of transcreëren? Waarom zou je nog heel dat proces opzetten, als je copiloot het commando verstaat om zulke wervende teksten te schrijven in om het even welke taal ... in één enkele stap?


Meer leren over taal en taaltechnologie?

Geboeid door de ontwikkelingen in de taalsector en benieuwd waar je meer kunt leren over taal en taaltechnologie? De Europese Commissie publiceert een inventaris van taaltechnologische cursussen en opleidingen in Nederland en België. Een voorlopige inventaris vind je nu al op Drongo.nl.

Mee debatteren kan ook. Noteer alvast 9 februari 2023 van 15 tot 17 uur in je agenda voor een online rondetafel over de taalprofessional van de morgen.