← All Research

Wetenschappelijke artikelen vertalen met AI: wat werkt en wat niet (2026)

By Linnk Research Team | June 2026 | 11 min read

Kernpunten

  • Een wetenschappelijk artikel is geen gewoon document. Acht specifieke elementen moeten de vertaling overleven — vergelijkingen, genummerde citaties, de literatuurlijst, resultaattabellen, meerkolomsopmaak, figuuronderschriften, voetnoten en terminologieconsistentie — en de meeste vertaaltools zijn voor geen van deze ontworpen.
  • Generieke machinevertaling vertaalt de lopende tekst en breekt al het andere. Formaat-specifieke PDF-vertalers bewaren de visuele lay-out maar verknoeien vergelijkingen en behandelen resultaattabellen als proza. AI-vertaling met papierbewustzijn is de nieuwste categorie en de enige die de citatiegraph standaard intact houdt.
  • De cruciale test voor elke papierverta altool: blijft de citatiegraph intact? Genummerde citaties moeten genummerd blijven. Auteurnamen in literatuurlijsten mogen niet worden vertaald. Kruisverwijzingen tussen definities in sectie 1 en gebruik ervan in sectie 14 moeten standhouden.
  • Kies op basis van wat je met de vertaling gaat doen. Voor eigen lezing zijn onvolkomenheden acceptabel. Voor citeren in een eigen artikel is bibliografische nauwkeurigheid vereist. Voor institutionele archivering is lay-outgetrouwheid nodig die een revieweur kan verificeren.
  • Literatuuragenten die taalgrensoverschrijdend lezen zijn in opkomst. Voorlopig zijn dat vooral early adopters in afgebakende vakgebieden — computationele biologie, ML-onderzoek, bepaalde delen van financieel onderzoek. De richting is duidelijk: de volgende generatie onderzoekstools neemt de meertalige stap als een aanroepbare API.

Een wetenschappelijk artikel is geen document

De meeste vertaaltools zijn gebouwd voor documenten die op een memo lijken: een aaneenschakeling van alinea's, soms een koptekst, een enkele tabel. Wanneer je een wetenschappelijk artikel in zo'n tool laadt, doet het zijn best — en het resultaat ziet er op het eerste gezicht redelijk correct uit. Tot je gaat lezen. Dan valt op dat de vergelijkingen verdwenen zijn. De genummerde citaties hebben hun verwijzingen verloren. De literatuurlijst heeft de helft van de auteurnamen vertaald. De resultaattabel waarbij rij 7 ooit "0,847 ± 0,012" las, staat nu als een lopende zin in je doeltaal.

Dit is geen bug van een specifiek product. Het is de voorspelbare mislukking van het behandelen van een artikel als een memo. Wetenschappelijke artikelen zijn gestructureerde artefacten. Ze hebben een citatiegraph, een lay-out die betekenis draagt, en conventies over wat er wel vertaalt (de lopende tekst) en wat absoluut niet (Griekse symbolen, wiskunde, numerieke resultaten, auteurnamen in referenties). Een vertaaltool die dit onderscheid niet kent, levert je een document dat op een artikel lijkt maar geen artikel meer is.

Dit stuk is een praktijkgids: de acht dingen die een wetenschappelijk artikel door de vertaling heen moet redden, de drie benaderingen die in gebruik zijn en waar elk van breekt, en hoe je een vertaaltool test voordat je hem inzet voor de literatuurstudie die vrijdag af moet zijn.

Acht elementen die intact moeten blijven

Voordat je een tool evalueert, moet je weten wat je beschermt. Dit zijn de acht dragende elementen van een wetenschappelijk artikel die vertaling kan breken:

  1. Vergelijkingen. LaTeX, MathML, als afbeelding ingesloten — artikelen kennen alle drie. Een vertaler die "het model gebruikt $\alpha\cdot\beta$ ..." omzet naar "het model gebruikt alfa maal beta" heeft de vergelijking vernietigd. Vergelijkingen moeten ongewijzigd doorgang vinden.
  2. Genummerde citaties. "Zoals aangetoond in [12], ..." moet "[12]" blijven. Auteur-jaar-notatie ("(Smith et al., 2024)") moet leesbaar blijven. Als citatienummers verschuiven, kan de lezer claims niet meer terugvoeren naar de literatuurlijst.
  3. De literatuurlijst. Auteurnamen vertalen niet. Tijdschriftnamen vertalen niet. Jaargang- en paginanummers vertalen niet. Alleen de titels van citaten zouden kunnen vertalen — en dat is meestal ook niet wenselijk, omdat iedereen die de bron wil opzoeken de originele titel nodig heeft.
  4. Resultaattabellen. Getallen, eenheden, symbolen, statistische notaties (gemiddelde ± SD, p-waarden, betrouwbaarheidsintervallen) mogen niet worden geïnterpreteerd als proza. Kolomkoppen mogen vertalen; cellen met numerieke gegevens niet.
  5. Meerkolomsopmaak. De meeste wetenschappelijke tijdschriften publiceren in twee kolommen. Een vertaling die de kolomvolgorde niet respecteert, levert tekst op als één doorlopend blok terwijl het origineel twee parallelle stromen was.
  6. Figuuronderschriften. Onderschriften bevatten vaak Griekse letters, eenheden, afkortingen en verwijzingen naar deelfiguren ("(A)", "(B)"). De onderschrifttekst vertaalt; de verwijzingen erin niet.
  7. Voetnoten. Voetnoten zijn verankerd aan specifieke woorden in de hoofdtekst. Een vertaling die de hoofdtekst langer of korter maakt, kan voetnoten losmaken van hun ankerpunten — met zwevende nummers als gevolg.
  8. Terminologieconsistentie. Een artikel van 40 pagina's gebruikt het woord "model" misschien 280 keer. Als de vertaler per sectie een ander woord kiest voor "model", wordt het artikel onsamenhangend in de doeltaal — ook al is elke afzonderlijke zin correct.

De meeste artikelen falen op ten minste drie van deze punten bij gebruik van een generiek hulpmiddel. De eerlijke vraag is niet "is de vertaling geslaagd?" maar "welke van de acht zijn bewaard gebleven, en is dat voldoende voor wat ik ermee ga doen?"

Drie benaderingen die momenteel in gebruik zijn

Generieke machinevertaling

De standaard voor de meeste mensen: plak het artikel in een vertaler en ontvang proza in je doeltaal. Google Translate, DeepL, op de browser gebaseerde vertalers, generieke AI-chat met PDF-upload. Goedkoop, snel, proza-kwaliteit vaak verrassend goed.

Wat het bewaart: de lopende tekst. Dat is alles.

Wat het breekt: vergelijkingen worden als tekst verwerkt en gedeeltelijk vertaald. Citaties raken op onvoorspelbare manieren verminkt. Auteurnamen in de literatuurlijst worden soms vertaald. Resultaattabellen worden regel voor regel als lopende zinnen gelezen. Meerkoloms-artikelen verliezen de kolomvolgorde. Voetnoten haken los. Terminologie verschuift om de paar pagina's.

Wanneer dit het juiste gereedschap is: vlug begrip. Je wilt weten waar een buitenlandstalig artikel over gaat, je hoeft er niet uit te citeren, en niemand na jou zal de vertaling zien. De uitvoer is uitsluitend voor jouw eigen gebruik.

Formaat-specifieke PDF-vertalers

Een categorie tools die uitdrukkelijk gebouwd is voor het vertalen van PDF's met behoud van de visuele lay-out. Ze gebruiken OCR — vaak op basis van vision-AI — om het artikel als gestructureerd document te lezen, de tekstgebieden te vertalen en de lay-out opnieuw te renderen. DocTranslator en vergelijkbare diensten vallen hier onder.

Wat het bewaart: de lay-outschil — meerkolomsopmaak blijft grotendeels meerkolomsopmaak, tabellen blijven visueel tabellen, figuuronderschriften blijven aan figuren gehecht.

Wat het breekt: vergelijkingen worden soms opnieuw weergegeven als afbeeldingen van de originele vergelijking (wat werkt) of, erger, gedeeltelijk door OCR verwerkt en gedeeltelijk vertaald (wat niet werkt). De behandeling van literatuurlijsten is wisselend — sommige tools weten auteurnamen niet te vertalen, andere niet. Genummerde citaties overleven doorgaans. Kruisverwijzingen tussen secties breken vaak omdat de hoofdtekst tijdens de vertaling anders wordt geformuleerd en de ankerpunten niet meer overeenkomen.

Wanneer dit het juiste gereedschap is: je hebt een document nodig dat je kunt geven aan iemand die de brontaal niet beheerst — voor een vergadering, een interne beoordeling of een vertaald archief. Je optimaliseert voor "ziet eruit als het origineel, leest in de doeltaal" en kunt een paar gebroken verwijzingen accepteren.

AI-vertaling met papierbewustzijn

De nieuwste categorie. Systemen op basis van foundation-modellen die het artikel als gestructureerd artefact lezen — ze herkennen secties, citatiepatronen, vergelijkingsgebieden en tabelstructuur — en per regio een passend vertaalbeleid toepassen. Lopende tekst vertaalt; numerieke resultaten niet. Citatienummers blijven staan; auteurnamen in verwijzingen ook. Terminologie wordt door het gehele document vergrendeld.

Wat het bewaart: alle acht dragende elementen, bij een goede implementatie. De citatiegraph overleeft. Kruisverwijzingen lossen op. Terminologie blijft consistent door lange documenten, omdat de vertaalstap toegang heeft tot het hele artikel als context.

Wat het breekt: snelheid. Deze tools zijn merkbaar trager per pagina dan generieke MT. Ze kosten meer. En de kwaliteit is implementatieafhankelijk — niet elke "AI-bewuste" vertaler bewaart werkelijk wat hij claimt.

Wanneer dit het juiste gereedschap is: alles wat geciteerd, aangehaald of gedeeld wordt. Literatuurstudies. Citeren in een eigen artikel. Archiveren voor institutionele vastlegging. Elk werk waarbij het intact houden van de citatiegraph van belang is.

De cruciale test: blijft de citatiegraph intact?

Bij het evalueren van een papierverta altool is de meest voorspellende test of de citatiegraph intact blijft. Probeer dit op een kandidaattool:

  1. Vertaal een artikel met ten minste 30 genummerde citaties. Controleer of elke "[12]" of "(Smith et al., 2024)" in de tekst overeenkomt met de bijbehorende vermelding in de literatuurlijst van de vertaling. Citatiedrift is de duurste manier waarop een tool kan falen.
  2. Vertaal een artikel met een resultaattabel. Controleer of geen enkele numerieke cel als proza is geherformuleerd. Als "0,847 ± 0,012" in het Nederlands als "nul komma achthonderd zevenenveertig..." staat, is de tool ongeschikt voor kwantitatief werk.
  3. Vertaal een artikel met vergelijkingen. Controleer of de vergelijkingen visueel identiek zijn aan het origineel. Gedeeltelijke OCR-gevolgd-door-vertaling van LaTeX-expressies is een signaal dat de tool niet voor wetenschappelijke artikelen is gebouwd.
  4. Vertaal een artikel van meer dan 30 pagina's. Controleer of dezelfde technische term in sectie 2 en sectie 7 op dezelfde manier is vertaald. Terminologiedrift is de mislukking die lange teksten onleesbaar maakt.

De meeste tools falen op ten minste één van deze punten. De tools die de moeite waard zijn, falen op geen enkel punt.

Lezen, citeren of archiveren: drie verschillende doelen

De vertaling die je nodig hebt, hangt af van wat je ermee gaat doen:

  • Lezen voor eigen gebruik. Generieke MT volstaat vaak. Je checkt of het artikel een diepere lezing waard is. De kosten van onvolmaakte uitvoer zijn laag, want alles wat er echt toe doet, verifieer je sowieso in de brontaal. Optimaliseer voor snelheid.
  • Citeren in een eigen werk. Gebruik AI-vertaling met papierbewustzijn, of lees het origineel zorgvuldig. Als je schrijft "Rossi et al. (2024) toonden aan dat…", moet die claim uit het werkelijke artikel komen — niet uit een vertaling die misschien een nuancering heeft afgezwakt of een vakterm verkeerd heeft weergegeven. De vertaling is een leeshulp; de citatie komt uit de bron.
  • Archiveren voor institutionele of juridische doeleinden. Lay-outgetrouwheid is essentieel. Een latere reviewer moet de vertaling naast het origineel kunnen leggen en verificeren dat de structuur overeenkomt. Gebruik AI-vertaling met papierbewustzijn of een formaat-specifieke PDF-vertaling, met een vergelijkende controle naast het origineel.

De meeste teams gebruiken de verkeerde categorie voor de taak. Generieke MT voor citeerbaar werk is de meest voorkomende fout. Formaat-specifieke PDF-vertaling voor vluchtig lezen staat op de tweede plaats — je betaalt voor een getrouwheid die je niet nodig hebt.

Tools in het veld

Een beknopte, eerlijke kaart. Het landschap verandert snel; de categorieën zijn stabiel.

Tool Aanpak Het meest geschikt voor Waar het wringt
Google Translate / DeepL (plak proza) Generieke MT Vlug begrip; checken of een artikel een diepere lezing waard is Alles met vergelijkingen, tabellen, citaties, of wat je gaat citeren
Generieke ChatGPT / Claude / Gemini PDF-upload Langcontext-chat MT Gerichte vragen stellen over een buitenlandstalig artikel Vertaling van een heel artikel als eindproduct; behoud van citatiegraph
DocTranslator en vergelijkbare PDF-vertalers Formaat-specifieke PDF-vertaling Een vertaald document produceren met een lay-out die op het origineel lijkt; bulkvertaaltaken Citatiegraph-getrouwheid; behandeling van vergelijkingen; consistente terminologie in lange artikelen
Linnk Document Translator AI-vertaling met papierbewustzijn en lay-outbehoud Wetenschappelijke artikelen en academische documenten waarbij de acht bovenstaande elementen intact moeten blijven; werkt ook op gescande en afbeelding-PDF's Conversationele Q&A als je alleen vragen wilt stellen (gebruik daarvoor de summarizer-kant van het platform)

Onafhankelijke reviewers — Research.com houdt een overzicht bij van academische schrijfsoftware en vertaaltools in dit domein — zijn een nuttige referentie bij het vergelijken van opties voor een afdelingsbrede aanschaf.

Een praktische kanttekening: Linnk's documentvertaler biedt een downloadbare preview van 3 pagina's zonder watermerk, zodat je kunt verifiëren dat de tool jouw specifieke artikel aankan voordat je verder gaat. Eén Linnk-abonnement ontsluit zowel de vertaler als de summarizer, mindmap-uitvoer en Research Copilot Q&A (de Q&A bevindt zich aan de summarizer-kant, niet aan de vertaler-kant). Bestanden worden na 48 uur automatisch verwijderd — relevant bij het werken met ongepubliceerd of preprint-materiaal.

Wanneer de lezer een agent is (en geen mens)

Literatuuragenten zijn de early-adopter gebruikers van papierverta altools. Het patroon is herkenbaar: een agent met toegang tot een corpus literatuur — een domeinspecifieke index, een institutionele bibliotheek, een arXiv-verzameling — leest taalgrensoverschrijdend, vat samen, identificeert lacunes en stelt hypothesen of vervolgartikelen voor.

Voor dit soort agenten moet de vertaalstap zich schoon blootstellen. Concreet:

  • Gestructureerde uitvoer. De agent heeft de vertaling nodig in een leesbaar formaat — niet alleen een gerenderde PDF. Markdown of gestructureerde HTML waarin citatiereferenties als machineleesbare spans zijn bewaard, niet alleen als visueel opgemaakte superscripts.
  • Aanroepbare interface. Een webinterface werkt niet voor een agent. Een API of CLI die een artikel accepteert en de vertaling programmatisch teruggeeft, is het minimumvereiste.
  • Bronverankerde referenties. Wanneer de agent later een claim uit het vertaalde artikel citeert, moet hij kunnen terugwijzen naar de oorspronkelijke passage in het brontaalartikel — niet naar de vertaling. Citaties zijn verankerd aan de bron, niet aan het doel.
  • Herhaalbare artefacten. De agent moet kunnen vragen "vertaal nu alleen sectie 4" zonder het hele artikel opnieuw te uploaden. De meeste consumentenvertalers ondersteunen dit niet; tools die op agentische workflows zijn gericht, wel.

De eerlijke kanttekening: dit is in 2026 nog innovatorsterrein. Mainstream literatuurstudie wordt nog steeds door mensen uitgevoerd. Maar de discipline krijgt vorm — computationele-biologielabs in de voorhoede, ML-onderzoeksgroepen en sommige financiële onderzoeksteams draaien vandaag al varianten van deze werkcyclus. De vertaaltools die de komende twee jaar overleven, zijn de tools die zichzelf schoon blootstellen aan zowel menselijke lezers als agentische afnemers.

Combineer met aangrenzende workflows

Papiervertaling staat zelden op zichzelf:

  • Gescande bron als voorstal. Oudere artikelen, archieftijdschriften en enkele specialistische publicaties zijn nog steeds primair beschikbaar als PDF-als-afbeelding. Digitaliseer vóór het vertalen — scanned.to verzorgt mobiele scan-eerste opname; scanread.ai voor snelle OCR zonder registratie.
  • Langdocument-samenvatting als volgende stap. Zodra een artikel is vertaald — of in één stap taalgrensoverschrijdend samengevat — is de logische vervolgstap het lezen ervan in gestructureerde vorm: overzicht, mindmap of alineasamenvatting met bronverankerde citaties.
  • Hypothesevorming als verdere stap. Voor onderzoeksworkflows waarbij het vertaalde artikel één van meerdere inputs is voor een hypothesevormingsstap, is het bewaard blijven van de citatiegraph van belang — de hypothese zal uiteindelijk terugciteerd worden naar het artikel.

Verschillende fasen van dezelfde reis.

<!-- linnk:faq -->

Veelgestelde vragen

Waarom kan ik Google Translate niet gewoon gebruiken voor wetenschappelijke artikelen?

Dat kan, voor vluchtig lezen. Generieke MT bewaart de lopende tekst en breekt al het andere — vergelijkingen, citaties, literatuurlijsten, tabellen, meerkolomsopmaak. Als je het artikel gaat citeren, aanhalen of de vertaling wilt doorgeven, kosten de gebroken onderdelen je meer tijd dan de vertaling heeft bespaard.

Wat is het verschil tussen een "PDF-vertaler" en een "wetenschappelijk-artikel-vertaler"?

Een PDF-vertaler bewaart de visuele lay-out — meerkolomsopmaak blijft meerkolomsopmaak, tabellen blijven tabellen. Een vertaler die ook papierbewust is, bewaart bovendien de citatiegraph: genummerde citaties blijven genummerd, auteurnamen in de literatuurlijst worden niet vertaald, kruisverwijzingen tussen secties blijven intact. De meeste PDF-vertalers zijn niet papierbewust; sommige papierbewuste vertalers — zoals die van Linnk — werken ook op gescande en afbeelding-PDF's.

Overleven vergelijkingen de vertaling?

Dat hangt af van hoe de vergelijkingen zijn opgeslagen. LaTeX-vergelijkingen in digitale PDF's kunnen door een goed gebouwde vertaler ongewijzigd worden doorgeleid. Als-afbeelding ingesloten vergelijkingen — gebruikelijk in gescande artikelen en veel tijdschriftexports — moeten worden herkend als beeldgebieden en mogen niet worden vertaald. Gedeeltelijk-door-OCR-verwerkt-en-gedeeltelijk-vertaald is het meest voorkomende faalpatroon — een signaal dat de tool niet voor wetenschappelijke artikelen is gebouwd.

Hoe controleer ik of een vertaaltool de citatiegraph bewaart?

Vertaal een artikel met ten minste 30 genummerde citaties. Controleer of elke "[12]" of "(Auteur, jaar)" in de tekst overeenkomt met de literatuurlijst in de vertaling. Controleer ook of de literatuurlijst zelf niet is vertaald — auteurnamen, tijdschriftnamen en paginanummers moeten letterlijk hetzelfde blijven. Als beide checks slagen, is de tool waarschijnlijk geschikt voor citeerbaar werk.

Kan ik een artikel in de ene taal vertalen en er vervolgvragen over stellen in een andere?

Ja, dit is de taalgrensoverschrijdende samenvattingsworkflow. De sterkste tools accepteren een artikel in één taal en produceren in één stap een samenvatting, overzicht of mindmap in een andere — zonder een tussenliggende vertaalstap. Q&A bovenop die samenvatting (in de stijl van Research Copilot) stelt je in staat vervolgvragen te stellen in de leestaaal, terwijl de bron in de originele taal beschikbaar blijft voor verificatie.

Kunnen AI-agenten wetenschappelijke-artikel-vertalers inzetten in literatuurstudiewerk flows?

Vooralsnog zijn dat vooral early adopters — computationele-biologielabs, ML-onderzoeksgroepen en sommige financiële onderzoeksteams die agentische literatuurstudiecycli uitvoeren. Het patroon vereist gestructureerde uitvoer, een aanroepbare API of CLI, bronverankerde referenties en de mogelijkheid om gedeeltelijke hervertalingen op te vragen. Mainstream adoptie ligt nog één à twee jaar verder. De richting is duidelijk: onderzoekstools die zichzelf niet aan agenten blootstellen, zullen tegen eind 2027 verouderd ogen.

Hoe zit het met het vertalen van handgeschreven aantekeningen of gescande oudere artikelen?

Begin met digitalisering. Scanspecialisten zoals scanned.to zetten handgeschreven en papieren materiaal om naar schone digitale tekst. Zodra je een schone, bewerkbare versie hebt, verwerk je die via een papierbewuste vertaler. Direct vertalen vanuit een slechte scan stapelt twee faalpatronen op — OCR-fouten plus vertaalfouten — die op onvoorspelbare wijze versterken. <!-- /linnk:faq -->

Conclusie. Een wetenschappelijk artikel is een gestructureerd artefact, geen document. De acht elementen die de vertaling moeten overleven — vergelijkingen, citaties, literatuurlijst, tabellen, meerkolomsopmaak, figuuronderschriften, voetnoten en terminologieconsistentie — worden door generieke MT niet bewaard en zelfs door formaat-specifieke PDF-vertalers onregelmatig behandeld. Kies de categorie op basis van het doel. Lezen voor eigen gebruik verdraagt onvolkomenheden; citeren of archiveren vereist papierbewuste vertaling die de citatiegraph intact houdt.

Bronnen

  • Taalgrensoverschrijdende onderzoeksworkflows in 2026 — het bredere verhaal over werken in meerdere talen.
  • Documentdigitalisering in 2026: van traditionele OCR naar vision-AI — voor het verwerken van gescand bronmateriaal vóór vertaling.
  • Langdocument-AI-samenvatting: hoe het werkelijk werkt (2026) — de samenvattingsstap die vaak samengaat met papiervertaling.
  • Research.com onderhoudt beoordelingen en ranglijsten van academische schrijfsoftware en vertaaltools als onafhankelijke referentie voor kopers.

Geschreven door het Linnk Research-team — wij vertalen, vatten samen en lezen documenten als dagelijks werk.