MoM | Handschriftherkenning & digitale paleografie

Een A en een E als hoofdletter en als cursieve letter en iets er tussenin (uit E.G. Turner, Greek Manuscripts of the Ancient World, 1987)

Nog even iets naar aanleiding van de Sapfo-fragmenten. De eerste vraag was die naar de provenance en echtheid. Vóór ontdekker Dirk Obbink in het Times Literary Supplement (niet meer online) de discussie de verkeerde kant op loodste, gingen er al geruchten, en één daarvan was dat het handschrift van de schrijver bekend was van een ander antiek manuscript, aanwezig in de Green-collectie. Ik heb dat toen geloofd: hier vlieg ik erin.

Papyrologe Roberta Mazza was minder naïef en wees er meteen op dat het ongeloofwaardig was dat de Greens delen bezaten van een tekst waarvan andere delen pas net uit een kartonnage waren gehaald. Hoe kon Obbink vaststellen dat hij te maken had met dezelfde tekst? Het antwoord is dat het in theorie zou kunnen. Maar ook dat het heel problematisch is.

Handschriften vergelijken

Wereldwijd zijn er een kleine 70.000 gepubliceerde papyri. Nu haalde dus iemand een tekst uit een kartonnage – ik zeg er nog even bij dat de vernietiging van egyptologische data niet strookt met welke wetenschappelijke gedragscode dan ook – en herinnerde Obbink zich een van die duizenden en duizenden handschriften. De man is een genie maar dit is wat al te geniaal.

Toch is wel iets mogelijk. Van enkele Dode-Zee-rollen is vastgesteld dat ze zijn geschreven door dezelfde klerk. Door rustig te kijken kan een goede paleograaf (specialist in oude handschriften) zien in welke volgorde de lijntjes zijn gezet die een letter vormen – zie het plaatje hierboven. Hij kijkt ook naar de lengte van de stokken en de staarten van de letters, naar het ritme, naar de verhouding tussen hoogte en breedte en nog zo wat eigenschappen.

Hoewel de paleograaf dus probeert bepaalde eigenschappen zo expliciet mogelijk te benoemen, speelt Fingerspitzengefühl een rol. Het is een beetje zoals de stilistische dateringen van antiek aardewerk: de grens tussen twee kunsthistorische perioden is herkenbaar, maar is vaak niet echt bevredigend onder woorden te brengen.

Digitale paleografie

We willen die criteria natuurlijk wél explicieter maken. Bij het onderzoek naar bijvoorbeeld het Geheime evangelie van Marcus maakte de Finse onderzoeker Timo Paananen gebruik van de kwantitatieve technieken die ook forensisch analisten benutten. Daarmee viel bijvoorbeeld vast te stellen dat in de tekst de forger’s tremor afwezig was, de aarzeling die een vervalser heeft als hij een schrift benut dat hij niet van kinds af aan gebruikt. (Dit wil overigens niet zeggen dat Geheime Marcus echt is, alleen dat een argument tegen authenticiteit niet klopt.)

Maar er is iets op komst dat nog spectaculairder is. In Groningen probeert het Qumran-instituut de klerken te identificeren die de Dode-Zee-rollen hebben geschreven. De computer wordt in dit project gevoed met meer data dan een mens behappen kan, namelijk foto’s van álle letters van álle Dode-Zee-rollen. Artificiële intelligentie kan daardoor z’n werk beter doen dan zelfs de knapste paleograaf. De ambitie is bovendien de kwaliteit van de identificatie in een percentage te vangen.

Hiermee ontstijgt handschriftherkenning het domein van het gedeeltelijk subjectieve. Het wordt wetenschappelijker. Je kunt je voorstellen dat het met zulke vormen van digitale paleografie, als eenmaal alle tienduizenden papyri zijn beschreven, mogelijk wordt van een nieuw-ontdekte papyrus te zeggen dat die van de hand van deze of gene bekende klerk is. Die mogelijkheid komt in zicht. Maar in 2014 was het onzin.

[De reeks “Methode op Maandag” (MoM) toont wat de oudheidkundige wetenschappen maakt tot wetenschappen. Overzichten van deze en vergelijkbare stukjes zijn hier en daar. Dit stuk wordt gereblogd op #GrondslagenNet, de groepsblog van archeologen, classici en oudhistorici.]

11 gedachtes over “MoM | Handschriftherkenning & digitale paleografie

  1. Marcel Meijer Hof

    Ik voel altijd een grote bewondering en diepe dankbaarheid voor al die onvermoeibare werkmieren, die nauwgezet en minutieus gegevens verzamelen, ordenen en rubriceren opdat anderen hieruit vergezichten en brede visies goed gefundeerd kunnen onderbouwen.

    Ik pleit derhalve voor het oprichten van minimaal één monument voor de onbekende archivaris alsmede een gedenknaald voor de accurate secretaresse, zonder wier toewijding de grootse inzichten niet tot stand zouden kunnen komen.

    Ter -manke- vergelijking: Het stadhuis van Enschede (G. Friedhoff) is in het onvermoede bezit van een eigen heilige, vormgegeven door beeldhouwer Fritz van Hall († voorjaar 1945 in Polen), te weten Sint Bureaucratius – als kleine opmaat op een trapleuning van een opgang naar de burgemeesterskamer en de kantoren der wethoudersters. Een kleine gezwollen bronzen figuur met geklede jas en hoge hoed, als attribuut de staf van een Maior Domus.

  2. “hier vlieg ik erin.”
    Nu ben je te streng voor jezelf, vooral omdat Mazza haar stuk bijna 7 jaar na de jouwe schreef. Zolang er weinig feiten bekend zijn, zoals toen, is elke conclusie een gok. Ik heb niets tegen gokken, zolang men maar beseft dat men ook kan verliezen.
    Eigenlijk breng je verheugend nieuws. Dit Sapfo-schandaal heeft ertoe geleid dat handschriftherkenning betrouwbaardere methodes ontwikkelt. En dat nog wel door Stadjers!

    1. Mazza constateerde het meteen. Ze kwam er zeven jaar later op terug.

      Bij mij vielen de schellen van de ogen na het interview met André Lardinois in De Volkskrant, die de laatste geloofwaardigheid van Obbink onderuit haalde. Die had geschreven dat de provenance gedocumenteerd was; Lardinois zei dat het ongetwijfeld van de zwarte markt kwam. Toen was duidelijk dat er iemand loog.

  3. Huibert Schijf

    Mooi voorbeeld om te laten zien dat vooruitgang in de wetenschap vaak niet afhangt van nieuwe ontdekkingen of theorieën, maar van nieuwe technieken die nieuwe vragen aan bestaande gegevens mogelijk maken. De volgende stap is teksten digitaal te laten transcriberen en daarmee doorzoekbaar te maken. Het Amsterdamse Stadsarchief is druk aan het experimenteren met zeventiende notariële akten. Het lukt nog niet voor honderd procent, maar het begin is er. Deze ontwikkelingen zullen de komende decennia nog veel vooruitgang boeken en nieuwe inzichten mogelijk maken. Bij het krantenarchief van de KB (Delpher.nl) lukt het nu al heel aardig.

  4. Huibert Schijf

    Buiten de orde! Het stukje van Ghurabalbayn op Grondslagen.nl over een mier op de zijderoute vind ik fantastisch. Wat een geleerdheid.

  5. “Artificiële intelligentie kan daardoor z’n werk beter doen dan zelfs de knapste paleograaf.”

    Dat betwijfel ik. Wie voedt die artificiële intelligentie (AI)? Want om zijn werk te doen, moet iemand die AI vertellen waar die op moet letten. Dus beter? Beslist niet! Maar AI kan wel meer werk doen, dat is wel waar.

    1. Arnold den Teuling

      Dat klopt inderdaad. Het Amsterdamse gemeentearchief is niet de enige die OCR doet met handschriften,het Nationaal archief in Den Haag is hier ook al lang mee bezig. Een van mijn kleinzoons heeft een afstudeerproject gedaan met het artificieel lezen van een 15-de-eeuws handschrift (een boekhand). Ter controle werd hierbij een transcriptie gebruikt, waarin de menselijke transcribent onopzettelijk een paar fouten had gemaakt. De score van de Artificial Intelligence was daardoor lager, maar doordat er drie classici, één tevens archivaris, in de familie zitten, waren die fouten uit de transcriptie gehaald, Daardoor werden het resultaat van de AI nog wat beter maar haalde het nog steeds geen 100 %. De heer Popov in Groningen is ook bezig met een AI-systeem te ontwikkelen om Dode-zee-rollen te gaan lezen.
      Maar mensen doen het net altijd beter. Zo dankt de componist Roellrin zijn bestaan aan het feit dat de Spaanse uitgever van het handschrift de letter k verkeerd las, in het cursieve schrift lijkt lr wel wat op de in het Spaans niet voorkomende letter k. De componist heette natuurlijk Roelkin, en het zou goed kunnen gaan om de Groninger Rudolf Huisman alias Agricola.
      De Amerikaan Alexander Turyn heeft al omstreeks de jaren 1960 ontdekt dat de correcties in het voornaamste Sophocleshandschrift (een Mediceus) aangebracht zijn door de schrijver van de voornaamste vertegenwoordiger van een andere handschriften familie, een Parisinus. Ik betwijfel of AI zo’n identificatie ooit zal kunnen presteren.

    2. AI moet leren. Maar AI kan ook veel meer data aan. Het zal beter en beter worden. Vanzelfsprekend is het de heilige graal niet maar ik denk dat enig gekwalificeerd optimisme gerechtvaardigd is. (Ook omdat ik wat onder-embargo-informatie heb uit Groningen. 😉 )

Reacties zijn gesloten.