De dag waarop de oudheidkunde een robuustere wetenschap werd

U ziet het verschil niet, maar er zijn hier twee kopiisten aan het werk geweest

Je hebt twee soorten nieuws. Enerzijds de dingen die dit jaar actueel zijn en straks vergeten zijn. Vijf jaar geleden was het voorpaginanieuws dat de gemeente Rotterdam voor een vermogen was opgelicht en was de Grexit nog actueel. Anderzijds de dingen die zachtjes op de achtergrond spelen, zoals het echte wetenschapsnieuws: een doorbraak, eenmaal geboekt, die resultaten oplevert waardoor onze kinderen en kleinkinderen meer zullen weten dan wij. Zulk nieuws is niet de waan van de dag, maar is wel het echte, feitelijke, werkelijk belangrijke nieuws.

Vanavond maken we het mee. Op het eerste gezicht is het wat banaal: onderzoekers van het Qumran-instituut in Groningen zijn erin geslaagd vast te stellen dat de Grote Jesaja-rol uit Grot 1 is vervaardigd door twee mensen die zó schreven dat het resultaat eenvormig was. De meeste qumranologen dachten dat er maar één kopiist aan het werk was geweest. Maar het zijn er twee en dat is niet door een slimme hedendaagse filoloog geconstateerd, zoals bij dit soort onderzoek normaliter gebeurt, maar is vastgesteld met behulp van Artificiële Intelligentie.

Het feitelijke nieuws is dus dat de subjectieve component uit het onderzoek is weggehaald. Zeg maar dat het niet langer Fingerspitzengefühl is. Dit is harde, harde wetenschap. Robuuster. De oudheidkunde wordt in een klap kwalitatief beter.

Het Groningse team van Mladen Popović moest verschillende hindernissen overwinnen:

  • goede digitale foto’s maken;
  • een artificieel neuraal netwerk bouwen waarmee op die foto’s de voorgrond (de inkt) viel te scheiden van de achtergrond (het perkament);
  • de computer duizenden letters zo laten analyseren dat schrijvershanden herkenbaar waren;
  • statistische procedures loslaten op de resultaten om te analyseren of er een of meerdere kopiisten bezig waren geweest en, indien meerdere, wie wat heeft gedaan;
  • de eigen resultaten controleren.

Dat de Jesaja-rol twee afschrijvers heeft gehad is een conclusie voor specialisten. Het is belangrijk voor Popović’ project The Hands That Wrote the Bible, dat alle handen van de Dode-Zee-Rollen wil onderzoeken. Zo wil men vaststellen wie wat schreef, wat bij elkaar hoort en hoe die enorme collectie in die grotten tot stand is gekomen. Is het lukraak bij elkaar verzameld materiaal of heeft een kleine groep klerken alles vervaardigd? Is er, met andere woorden, sprake van een representatieve doorsnede van het antieke tempeljodendom of is er sprake van het materiaal van een splintergroep? Toevallig heeft het mijn belangstelling, maar als het niet de uwe heeft, even goeie vrienden.

Het is echter voor elke oudheidkundige belangrijk. We leren nu, als het ware op microniveau, hoe kopiisten werkten: iemand kon dus het handschrift van een ander zo nabootsen dat we dat eigenlijk niet herkennen. Dat is een inzicht dat alle oudheidkundigen doet opveren en ik weet dat men nu al kijkt naar een heel beroemd Grieks manuscript. Maar je kunt je voorstellen dat we straks WIC-archieven uit de zeventiende eeuw of de stadsrechten van Brabant gaan analyseren en zien wat er op de kanselarij gebeurde.

Het feitelijke belang is echter dat geesteswetenschappers nu de subjectieve component van het handschriftenonderzoek kunnen elimineren. Paleografie is als de digitale paleografie waarover ik al blogde gewoon hard science geworden. De gezondheid van een wetenschap stel je niet vast aan de hand van nieuwe inzichten, maar aan de hand van nieuwe methoden. Vandaag zien we dat die in de oudheidkunde nog steeds bestaan.

Noteer het op de kalender: u las vandaag echt nieuws. Voor een oudheidkundige is dit zoiets als het moment waarop fysici erin slaagden supergeleiding te doen op zulke temperaturen dat het met vloeibaar stikstof viel te koelen. Zoals een fysicus zich herinnert waar hij was toen hij dat hoorde, zo zal een oudheidkundige 21 april 2021 herinneren. Als het straks in december niet staat op het eindejaarslijstje van belangrijkste wetenschappelijke ontdekkingen, ligt dat aan de journalistiek en niet aan de wetenschap.

Hier is het artikel en verder is daar Ha’aretz en daar Eurekalert. Ik heb erover geschreven voor het Handelsblad maar het is nog niet online en gaat zaterdag in de papieren krant.

[Dit stuk wordt gereblogd op #GrondslagenNet, de groepsblog van archeologen, classici en oudhistorici.]

18 gedachtes over “De dag waarop de oudheidkunde een robuustere wetenschap werd

  1. Dirk Zwysen

    Het heeft een hoog Star Trek-gehalte, dat onderzoek door een computer. Detail of muggenziften (en ik vergis me misschien, ben geen mediëvist): Brabant heeft geen stadsrechten, Brabantse steden wel.

  2. Adriaan Gaastra

    Volgens mij zijn er in de loop der jaren behoorlijk veel initiatieven ontplooid op het gebied van digitale paleografie. Dit is echt niet het eerste toegepaste initiatief. Maar goed, ik kan me wel voorstellen dat de Dode Zee-rollen wat meer aandacht van de media genereren dan, pak ‘m beet, een handschrift in Visigotische minuskel.

    1. Natuurlijk is het niet nieuw. Ik blogde al eens over het Geheime Evangelie van Marcus. Maar het herkennen van individuele schrijvershanden is wel een kwalitatieve sprong vooruit.

  3. A. den Teuling

    Het Nationaal archief is op grote schaal bezig met en ver gevorderd in het machineleesbaar maken van geschreven teksten. Of men zich beperkt tot de zestiende t/m de negentiende eeuw weet ik niet. De schrijfmachine kwam vanaf ca 1900/1920 algemeen in gebruik.
    Middeleeuwse oorkonden hebben in het algemeen kanselarijkenmerken, waaronder de naam en functie van de schrijver. Dat kan natuurlijk interessant zijn voor andere geschriften uit dezelfde omgeving waar dergelijke kenmerken ontbreken.

    Mijn kleinzoon had voor zijn studie Kunstmatige intelligentie (AI) in Groningen als bachelor-afstudeerproject het machineleesbaar maken van een Latijns handschrift van ik meen rond 1400. Het handschrift diende als voorbeeld-project en ter toetsing werd er een transcriptie bijgeleverd, want AI-studenten werden niet geacht Latijn te kennen. De opdracht was tenminste een 85% foutloze transcriptie te bereiken. Mijn dochter, classica, haalde twee fouten uit de bijgeleverde transcriptie, en het systeem dat mijn kleinzoon met een medestudent had ontwikkeld scoorde daardoor nog hoger, met andere woorden, het ontwikkelde systeem was veel beter dan vereist. De studiebegeleider wilde de fouten in de transcriptie van de voorbeeldset niet corrigeren, want dan waren de resultaten van andere studenten niet meer vergelijkbaar. Dat een andere Groninger student of afgestudeerde Popóvic van dienst kon zijn is dus niet verbazingwekkend.

    1. Dit gaat nog een stap verder dan machineleesbaar maken: het gaat om het herkennen van individuele schrijvershanden. Even goed zitten we in dezelfde richting.

  4. Martin van Staveren

    Classificatie kan goed gedaan worden met AI. Is het een hond of een kat? Beiden lopen op vier pootjes, hebben een staart en een vacht en een snuit. Er zijn grote honden en katten, maar ook kleine. Maar toch zien wij het verschil.

  5. Huibert Schijf

    In het Amsterdamse Stadsarchief zijn alle notariële akten gedigitaliseerd. De negentiende-eeuwse akten zijn goed leesbaar omdat ze in een onpersoonlijk klerkenhandschrift zijn geschreven. De Groningse programmatuur zou verder kunnen worden gevalideerd door akten van verschillende notarissen te nemen. De handschriften zouden verschillend moeten zijn. Of er wordt een steekproef van akten van een notaris genomen. Daardoor zou kunnen worden vastgesteld of die notaris verscheidene klerken in dienst had.

    1. A. den Teuling

      Die gemakkelijke leesbaarheid geldt ook voor de 18de eeuw, dat is wat ronder, en minder hellend en lijkt meer op de 16de-eeuwse humanistenhand. Ik neem aan dat ze met het moeilijker leesbare cursieve 17de-eeuwse en oudere schrift bezig zijn.

  6. Interessant!
    Ik ben benieuwd of we na verloop van tijd individuele kopiisten gaan herkennen die totaal verschillende manuscripten hebben geschreven.
    Ook zou ik wel willen weten of deze AI herkent of een handschrift veranderd is over de jaren, of na een fysieke handicap, of dat dit als een ‘andere schrijver’ wordt geklasseerd.

  7. Tsjonge, wat een vertrouwen in kunstmatige intelligentie! Mag ik hier toch een algemene kanttekening bij maken, zonder overigens het specifieke onderzoek te kennen?

    “Het feitelijke nieuws is dus dat de subjectieve component uit het onderzoek is weggehaald”. Nee!!! Driewerf nee!!! Beslist niet! Ook de AI moet namelijk met testdata gevoed worden en die voeding (door deskundigen, mag je hopen) is nog steeds zo subjectief als het maar zijn kan. De subjectieve component verplaatst zich alleen maar van de door de AI bekeken data naar de testdata. Maar de beoordeling blijft uiteindelijk subjectief. Een soort wet van behoud van subjectiviteit dus…

      1. Raymond Haselager

        Bij machine learning kent men het onderscheid tussen supervised learning en unsupervised learning. Bij de eerste krijgt de computer een dataset waaraan al een classificatie is toegevoegd. hier komt dus vaak een subjectieve component in het onderzoek en dat wordt inderdaad vaak vergeten. Wat wel een groot voordeel blijft is de reproduceerbaarheid, deze is wel objectief.

        Bij unsupervised learning kijkt de computer naar structuren in de dataset. hierna moeten de resultaten natuurlijk nog geinterperteerd worden. Het lijkt me dat deze technieken in het boven genoemd onderzoek gebruikt zijn.

        1. Ik heb het zeer interessante artikel gelezen en hoewel ik het niet helemaal kan volgen is de voornaamste AI-component patroonherkenning en dat is inderdaad een stuk minder subjectief dan ik dacht. Daar heeft Jona gelijk in. Ik vond trouwens in het nawoord een alternatieve verklaring leuker. Het kan ook dezelfde schrijver met een andere pen zijn geweest. Zoiets van eerst de linker scroll schrijven, een week vakantie nemen, hé waar is mijn pen gebleven, andere pen pakken, rechter scroll schrijven. Ik snap niet helemaal waarom dat minder waarschijnlijk zou zijn…

Reacties zijn gesloten.