Wil de echte Paulus opstaan?
Een kijkje achter de schermen van 60 jaar Paulinische stylometrie
Al meer dan twee eeuwen lang betwisten Bijbelwetenschappers de echtheid van de nieuwtestamentische brieven die in naam van Paulus zijn geschreven. Hierbij baseren zij zich onder meer op taalkundige verschillen tussen de brieven, zoals het gebruik van unieke woorden en opvallende syntax. Voor deze vergelijking zijn onderzoekers in de loop van de twintigste eeuw steeds meer gebruik gaan maken van inzichten uit de statistiek, maar dit type onderzoek nam pas echt een vlucht na de uitvinding van de computer, te beginnen met het werk van Andrew Queen Morton in de jaren 60.
Onderzoeksgeschiedenis in vogelvlucht
Als een echte pionier op het gebied van digitaal Bijbelonderzoek testte Morton de ooit gangbare Tübingen-hypothese die stelt dat alleen Romeinen, 1-2 Korintiërs en Galaten – de zogenaamde Hauptbriefe – door Paulus waren geschreven. Met behulp van de computer analyseerde Morton (1965) onder meer de gemiddelde zinslengte en het gebruik van veelvoorkomende woorden zoals kai (“en”, “ook”) en de (“en”, “maar”) in Griekse schrijvers. De gevonden afwijkende patronen waren voor Morton aanleiding om ook de brieven van Paulus aan een dergelijk onderzoek te onderwerpen. De grote verschillen in het gebruik van kai en de tussen de Hauptbriefe en de andere – voor hem betwiste – brieven overtuigden hem ervan dat Paulus alleen de Hauptbriefe had kunnen schrijven.
Anthony Kenny (1986) trok deze conclusie echter in twijfel vanwege Mortons beperkte selectie van taalkundige criteria. Kenny analyseerde maar liefst 96 criteria in alle 13 brieven, variërend van het gebruik van verschillende woordsoorten tot het gebruik van werkwoorden in verschillende modi, tijden en diathesen. Van al deze criteria berekende Kenny de relatieve frequentie waarin zij voorkwamen bij Paulus zonder daarbij het gebruikelijke onderscheid te maken tussen betwiste en onbetwiste brieven. Onder de eerste groep worden doorgaans Efeziërs, Kolossenzen, 2 Thessalonicenzen en de brieven aan Timoteüs en Titus gerekend; onder de tweede groep verstaat men tegenwoordig naast de Hauptbriefe ook Filippenzen, 1 Thessalonicenzen en Filemon. Door middel van correlatiecoëfficiënten (Pearson’s ρ) liet Kenny zien welke brieven verwantschap met elkaar vertonen en welke niet. Kenny’s conclusie was dat alle brieven met elkaar correleerden met uitzondering van Titus, maar hij meende wijselijk dat het niet aan de stylometrist maar aan de Bijbelwetenschapper is om op basis van deze uitkomst iets over het auteurschap van de brieven te zeggen.
Recenter vergeleek Jermo van Nes (2018) de in de onderzoeksgeschiedenis meest genoemde taalverschillen tussen de brieven aan Timoteüs en Titus – ook wel de Pastorale Brieven (vanaf nu: PB) genoemd – en de andere betwiste brieven met de zeven onbetwiste brieven. Zo keek hij onder meer naar het gebruik van hapax legomena, de lexicale rijkheid (i.e. het aantal unieke woorden in verhouding tot het totaal aantal gebruikte woorden in een tekst), het ontbreken van partikels, nevenschikkende en onderschikkende zinrelaties, en niet-reguliere grammaticale constructies zoals parenthesen, anakoloeten en ellipsen. Met behulp van lineaire regressieanalyse stelde hij vast dat er niet tot nauwelijks significante verschillen waarneembaar zijn tussen de beide briefcorpora. Ook stelde hij de vraag of taalkundige variatie binnen een bepaald corpus noodzakelijk verklaard moet worden door auteurschapsvariatie, aangezien in de klassieke en moderne taalwetenschap ook andere verklaringsmodellen zijn voorgesteld, zoals ouderdom, emotie of verschillen tussen gesproken en geschreven taal.
De tot nu toe genoemde studies hebben met elkaar gemeen dat zij gebaseerd zijn op zogenaamde univariate statistiek, een methode waarbij slechts één variabele per keer wordt geanalyseerd. Sinds eind jaren 80 van de vorige eeuw maakten nieuwe technologische ontwikkelingen – vooral binnen de computerwetenschappen – de toepassing van zogenaamde multivariate statistiek mogelijk. Deze methode stelde onderzoekers in staat om meerdere variabelen tegelijkertijd te analyseren. De eerste invloedrijke Paulusstudie in dit verband was die van Kenneth Neumann (1990), die uit 617 taalcriteria uiteindelijk vier effectieve elementen (woordlengte, verbuigbare eigennamen, keuze voor synoniemen in relatie tot de verwachting en het relatief aantal woorden die met een τ beginnen) koos om de echtheid van de betwiste brieven te testen. Daarbij gebruikte hij andere bijbelse (Hebreeën) en buitenbijbelse geschriften (Clemens, Ignatius, Philo, Josephus en Epictetus) om te zien of de betwiste brieven meer overeenkomsten met deze geschriften of Paulus’ onbetwiste brieven vertoonden. Neumann’s discriminatieanalyse liet niet alleen zien dat traditionele taalcriteria zoals hapax legomena en partikels ineffectief bleken om verschillen in auteurschap te duiden, maar ook dat 1 Timoteüs meer overeenkomsten vertoont met Hebreeën en 2 Timoteüs meer met de brieven van Ignatius dan met Paulus’ onbetwiste brieven. Ook Efeziërs en Kolossenzen weken behoorlijk af van de onbetwiste brieven.
In 2016 stelde James Libby dat genre (en niet auteurschap) de vaak gevonden taalverschillen tussen de brieven van Paulus kunnen verklaren. Met behulp van correspondentieanalyse testte Libby tien taalcriteria voor zes auteurschapstheorieën en 13 verschillende genres. Anders dan eerdere onderzoekers koos hij voor taalcriteria op woord-, zins- en tekstniveau. Met zijn onderzoek vond Libby niet alleen een duidelijk onderscheid tussen de taalstructuren van de Evangeliën, Handelingen, brieven en Openbaring, maar ook verschillende clusters van sub-genres onder de brieven zelf: persoonlijke instructiebrieven (1 Timoteüs en Titus), theologisch/praktische brieven (Efeziërs en Kolossenzen) en apocalyptische brieven (1-2 Thessalonicenzen).
Zeer recent betoogde Benjamin White (2025) om het fundamentele onderscheid tussen betwiste en onbetwiste brieven op te geven, omdat dit onderscheid nu eenmaal gebaseerd is op moderne vooronderstellingen over Paulus. Volgens White zijn er tal van factoren die bewust of onbewust de resultaten van stylometrisch onderzoek beïnvloeden. Door het gebruik van verschillende criteria (i.c. 50-100 meest gebruikte woorden en verschillende n-grammen), verschillende methoden (i.c. cosinusvergelijking en clusteranalyse) en verschillende stukken tekst (i.c. delen van 2000 woorden en gehele brieven) te gebruiken, laat White zien dat de data voor meerderlei uitleg vatbaar zijn. Interessant genoeg laten zijn uitkomsten geen ruimte voor de gangbare hypothese van 7 onbetwiste brieven en 3 zogenaamde deutero-Paulinische brieven (i.e. Efeziërs, Kolossenzen en 2 Thessalonicenzen), omdat de delen en gehelen van deze corpora niet samen clusteren. Titus en 1 Timoteüs lijken vanuit White’s perspectieven niet tot de Paulinische kern te behoren; voor 2 Timoteüs is dit onduidelijk. White adviseert daarom niet langer bevooroordeeld stylometrisch onderzoek te doen, maar vooral te kijken naar hoe de eerste gelovigen omgingen met (het auteurschap van) de brieven van Paulus.
Kritische evaluatie
Dit zeer beknopte maar exemplarische overzicht laat iets zien van de diverse mogelijkheden die de computer biedt bij de stylometrische vergelijking van de Paulinische brieven, vooral op het gebied van dataverzameling en analyse. Voorheen was dit type onderzoek tijdrovend werk, omdat data met de hand en statistische formules met het hoofd moesten worden gegenereerd. Tegenwoordig zijn er diverse computerprogramma’s die onderzoekers de mogelijkheid bieden om vrijwel elk willekeurig facet van Paulus’ schrijfstijl in kaart te brengen en binnen enkele seconden uitsluitsel te geven over hoe deze vondsten zich statistisch tot elkaar verhouden. Wat dat betreft is er veel veranderd en is het vooral te danken aan de computer dat stylometrische studies aan verklarende kracht hebben gewonnen. De resultaten van digitaal onderzoek lijken immers veel objectiever dan de persoonlijke impressies van eerdere onderzoekers.
Dit doet echter niets af aan het feit – zoals White (2025) heeft laten zien – dat er heel wat haken en ogen aan stylometrisch onderzoek zitten. Zo kan de lezer zich afvragen waarom deze objectievere studies na tientallen jaren nog steeds geen uitsluitsel kunnen geven over welke brieven echt zijn en welke niet. Bovenstaand overzicht getuigt immers van heel wat tegenstrijdige conclusies. Dit lijkt vooral te maken te hebben met wat er zich letterlijk en figuurlijk achter de schermen afspeelt. Computers zijn tot veel in staat, maar ze worden gemaakt en aangestuurd door mensen die van nature werken met vooronderstellingen. Alles draait uiteindelijk om de keuzes die onderzoekers voor, tijdens én na hun onderzoek maken.
Nog voor het onderzoek begonnen is moeten er namelijk belangrijke keuzes worden gemaakt. Ten eerste, welke teksteditie wordt gebruikt? De gezaghebbende tekst van Nestle-Aland, die binnenkort zijn 29e editie kent, is tot stand gekomen aan de hand van andere principes dan bijvoorbeeld de tekstkritische editie zoals uitgegeven door de Society of Biblical Literature (2010). Verschillende edities herbergen niet exact dezelfde data, wat de uitkomst van het onderzoek beïnvloedt. Ten tweede, welke data wordt geanalyseerd? Dit vraagt in bepaalde gevallen om een juiste definitie. Is een hapax legomenon bijvoorbeeld een woord wat eenmaal voorkomt in het Nieuwe Testament of meermaals voorkomt maar slechts in één brief van Paulus? Ten derde, wordt alleen gekeken naar woordgebruik of ook naar frasen, syntax en/of zin overstijgende elementen? Dit brengt direct de vraag met zich mee, ten vierde, hoeveel data geanalyseerd wordt en waarom precies. Worden taalcriteria geselecteerd op basis van de onderzoeksgeschiedenis (welke elementen hebben altijd een kritische rol gespeeld in auteurschapsdiscussies) of op basis van onderzoek wat heeft uitgewezen welke elementen kritische indicatoren zijn voor stijl of auteurschapsvariatie? En, ten vijfde, worden deze criteria geanalyseerd in de hele tekst van elke brief of in bepaalde delen van een brief (e.g. 500, 1000 of 2000 woorden)? Het maken van dergelijke keuzes is allesbepalend voor de dataverzameling en dus ook voor de uitkomst van een statistische vergelijking.
Alles draait uiteindelijk om de keuzes die onderzoekers voor, tijdens én na hun onderzoek maken
Ook wanneer alle data verzameld is moeten er beslissingen worden genomen. Zo is een eerste belangrijke vraag of alle data gebruikt moeten worden. In de statistiek is het raadzaam om zogenaamde uitschieters of uitbijters (i.e. extreme waarden die niet overeenkomen met de meeste andere observatiepunten in een dataset) niet in rekening te brengen, aangezien ze een vertekend beeld van de werkelijkheid kunnen geven. Uitschieters worden meestal aangetroffen in de kortste en/of langste brief van Paulus, respectievelijk Filemon en Romeinen. Hierbij rijst ook de vraag of alle data van citaten uit de Septuaginta verdisconteerd moeten worden, aangezien dit niet Paulus’ eigen taaluitingen zijn. Een andere cruciale vraag is hoe de gevonden data precies met elkaar vergeleken moeten worden. Veronderstel je op basis van de onderzoeksgeschiedenis dat één of meerdere brieven van Paulus echt zijn en vergelijk je deze met de brief of brieven waarover discussie is (e.g. Van Nes 2018)? Of veronderstel je dat alle dertien brieven (on)echt zijn en zoek je naar significante verschillen binnen dit briefcorpus (e.g. White 2025)? Of vergelijk je de gevonden data met buitenbijbelse geschriften om te bepalen welke taalelementen beslissend kunnen zijn voor de echtheid van een document (e.g. Neumann 1990)? En dan is er natuurlijk nog de bijkomstige vraag welke statistische test het beste gebruikt kan worden, afhankelijk van de doelstelling en het gekozen vergelijkingsmodel.
Zelfs wanneer alle data verzameld en statistisch geanalyseerd zijn moeten er nog keuzes worden gemaakt, met name over de presentatie en interpretatie van de bevindingen. Terecht zijn onderzoekers in het verleden meer dan eens beticht van het verdraaien van de werkelijkheid door bijvoorbeeld de data van de PB te presenteren als één geheel in plaats van drie afzonderlijke eenheden omwille van hun beperkte lengte. Wanneer de data van alle andere brieven wel als individuele eenheden worden gepresenteerd kan er immers van een eerlijke vergelijking geen sprake meer zijn. Een andere vraag is hoeveel verschil nodig is om te kunnen spreken van een ‘significant’ verschil, i.e. een dusdanig verschil waarbij je de gestelde nulhypothese (bv. de PB zijn onecht) al dan niet moet verwerpen. Tot slot moet de vraag worden gesteld of taalverschillen tussen de brieven per definitie duiden op verschillende schrijvers. Worden taalverschillen enkel veroorzaakt door mensen, of kunnen ook andere factoren daar aan bijdragen? Het was niet ongebruikelijk in de Oudheid dat brieven werden geschreven met behulp van een secretaris (vgl. Rom. 16:22), die mogelijk invloed uitoefende op de bewoording van de brief. Ditzelfde zou kunnen gelden voor co-auteurs (vgl. 1-2 Kor. 1:1; Gal. 1:1-2; Filip. 1:1; Kol. 1:1; 1-2 Thess. 1:1; Fil. 1:1). Misschien schreef Paulus enkele brieven zelf (vgl. Ef. 1:1; 1-2 Tim. 1:1; Tit. 1:1) en dicteerde hij anderen aan een secretaris, wat eventuele verschillen tussen geschreven en gesproken taal laat zien. Paulus schreef brieven over een periode van minstens 10 jaar op verschillende momenten onder verschillende omstandigheden met verschillende emoties. Hoe heeft dit zijn weerslag gehad op de inhoud en dus ook het taalregister van Paulus’ brieven? Zo zijn er dus tal van verschillende verklaringsmodellen mogelijk, die niet altijd in rekening (kunnen) worden gebracht door de stylometrie.
Toekomstperspectief
Gezien de vele keuzes die stylometristen achter hun schermen moeten maken, is het misschien niet zo gek dat zij tot verschillende conclusies zijn gekomen voor wat betreft de brieven van Paulus. Maar hoe zit het dan met de toekomst van dit onderzoeksveld? Als we van een impasse mogen spreken, welke stappen zouden dan nodig zijn om daar in de (nabije) toekomst uit te geraken?
Misschien is een eerste stap vooruit om – ondanks alle mogelijkheden die de computer biedt – de beperkingen van stylometrie te erkennen. De computer helpt enorm in het inzichtelijk maken van taalkundige verschillen tussen de brieven, en zal dit vermoedelijk ook blijven doen. De opkomst van AI-technologie zal de verschillen alleen maar beter en makkelijker in kaart kunnen brengen, juist ook in relatie tot data van eigentijdse en gelijkaardige geschriften. Steeds betere algoritmes kunnen helpen bij het in kaart brengen van taalverschillen tussen meerdere briefcorpora van verschillende auteurs, die taalkundige kaders kunnen scheppen waarin de taalverschillen tussen de brieven beter geduid kunnen worden. Maar veel meer dan het in kaart brengen van taalverschillen en daar statistische conclusies aan verbinden zal de computer niet kunnen doen. Uiteindelijk is en blijft het aan de onderzoeker om de data en statistische gegevens te interpreteren in het licht van de Oudheid.
Interdisciplinair samenwerken lijkt dan ook dé aangewezen weg om dit fascinerende veld te blijven bestuderen
Misschien is een tweede stap vooruit om de gangbare vooronderstelling dat taalvariatie per definitie verklaard wordt door meerdere schrijvers te laten varen. Er lijken immers diverse variabelen in het spel die (kunnen) bijdragen aan taalvariatie. Dit vraagt om nieuwe vormen van onderzoek, namelijk naar de impact van externe factoren op taalvariatie in de Oudheid. Dat is echter een complexe onderzoek aangelegenheid.
Dat maakt dat een derde stap vooruit misschien wel gelegen is in betere samenwerking tussen theologen, historici, taalkundigen, wiskundigen en ICT-ers. Elk terrein vraagt om zijn eigen specialismes en competenties. Het is pas recent dat er meer co-publicaties verschijnen op het terrein van Paulinische stylometrie, en dat is een welkome trend. Dit veld begint langzaamaan te complex te worden voor de individuele onderzoeker, zeker voor theologen die doorgaans niet geschoold worden in taalkunde en/of statistiek tijdens hun opleiding. Omgekeerd geldt dat taal- en wiskundigen net zoals ICT-ers vaak weinig besef meekrijgen van de sociaalhistorische realiteit waarin de Paulinische brieven geschreven werden. Interdisciplinair samenwerken lijkt dan ook dé aangewezen weg om dit fascinerende veld te blijven bestuderen.
Dr. Jermo van Nes was tot voor kort docent Nieuwe Testament aan de Evangelische Theologische Faculteit, Leuven.
Literatuur
Anthony Kenny, A Stylometric Study of the New Testament, Oxford 1986
James A. Libby, “The Pauline Canon Sung in a Linguistic Key: Visualizing New Testament Text Proximity by Linguistic Structure, System, and Strata”, Biblical and Ancient Greek Linguistics 5 (2016) 122–201
A. Q. Morton, The Authorship of the Pauline Epistles: A Scientific Solution, Saskatoon 1965
Jermo van Nes, Pauline Language and the Pastoral Epistles: A Study of Linguistic Variation in the Corpus Paulinum, Leiden 2018
Kenneth J. Neumann, The Authenticity of the Pauline Epistles in the Light of Stylostatistical Analysis, Atlanta 1990
Benjamin L. White, Counting Paul: Scientificity, Fuzzy Math, and Ideology in Pauline Studies, Oxford 2025