MoM | Thesaurus linguae Latinae

Kasten vol dozen met systeemkaarten

De Thesaurus linguae Latinae is een wetenschappelijk woordenboek van het Latijn. Nu zou je kunnen denken: er bestaan toch al woordenboeken Latijn? Inderdaad, het meest bekend is voor Nederlanders het woordenboek van Pinkster, voor Engelsen de Oxford Latin Dictionary, en zo heeft elk taalgebied wel zijn Latijnwoordenboek.

Nu is er een aantal problemen met deze woordenboeken. Ten eerste zijn ze gemaakt op basis van maar een beperkt aantal teksten, meestal bestaand uit werken van  “grote” auteurs als Cicero, Caesar, Vergilius, Ovidius. Ten tweede bouwen ze meestal op elkaar op: zo is Pinkster oorspronkelijk een bewerking van het Duitse woordenboek van Pons, dat weer een bewerking is van Taschen-Heinichen. Op deze manier krijgen we steeds dezelfde lemmata met dezelfde betekenissen, en soms zelfs dezelfde fouten.

Een écht woordenboek

Wetenschappers hadden al eind negentiende eeuw de behoefte aan een nieuw, goed woordenboek, waarin echt alle woorden staan die ooit zijn voorgekomen, om echt alle teksten goed te kunnen begrijpen. Het probleem is namelijk dat de Latijnse literatuur eigenlijk alleen maar in fragmenten is overgeleverd: hele boeken van Livius en Tacitus ontbreken, van de meeste auteurs kennen we alleen maar de namen, van andere hebben we een paar losse zinnetjes zonder context. En dan hebben we eigenlijk vooral de schrijftaal over, boeken geschreven door de elite voor de elite. Maar toch zien we ook iets van de maatschappij daaronder: handboeken voor het dagelijks gebruik van artsen, een reisbericht van een vrouw naar het heilige land, en niet te vergeten graffiti uit Pompeii. Om dit heel diverse materiaal te kunnen interpreteren heb je een heel goed woordenboek nodig. Een woordenboek dat alleen op een paar klassieke auteurs is gebaseerd, helpt niet veel als je de handleiding van een arts van een paar eeuwen later wilt begrijpen, of een moeilijke theologische discussie uit de vijfde eeuw.

Zo ontstond het idee de hele Latijnse literatuur, nee alle Latijnse teksten goed te onderzoeken. Maar wat heet nu alle? Het begin is vrij duidelijk: de oudste fragmenten van het Latijn zijn oude wetteksten, de twaalftafelenwet uit ca. 450 v.Chr., de oudste auteur van wie echt iets substantieels is overgeleverd, is Plautus (ca. 254-184 v. Chr.). Maar tot wanneer zou het moeten gaan? Interessant is de overgang van het Latijn in de Romaanse talen, en vooral ook de laat-Latijnse periode. Als grens werd daarom ca. 600 n. Chr. genomen, met het idee, dat vanaf dan Latijn echt een taal is die je op school moet leren en niet meer als moedertaal kan gelden. De grenzen zijn bepaald, maar hoe nu verder?

Systeemkaartjes

We zijn eind negentiende eeuw, computers zijn nog niet te bekennen. Om een woordenboek te schrijven moet je eerst te weten zien te komen waar een woord eigenlijk voorkomt. Daarom werd er begonnen de hele Latijnse literatuur op systeemkaartjes, Zettel, te schrijven. Als er bijv. vijftig woorden op een kaartje stonden, werd het kaartje vijftig keer gekopieerd. Nu bestonden kopieermachines natuurlijk ook nog niet, dus gebeurde dit door middel van lithografie. Zo hebben we bijv. vijftig kaartjes van de eerste paar regels van Vergilius. Nemen we de eerste zin van Vergilius: arma virumque cano. Nu werd op het eerste kaartje arma onderstreept en rechtsboven arma geschreven. Dit kaartje ging naar de doos voor arma, “wapens”. Op het tweede werd virum onderstreept, rechtsboven werd echter niet virum geschreven, maar de onverbogen vorm vir, “man”. Dit kaartje kwam in de doos vir. Zo vulden zich de doosjes. Ze gingen chronologisch te werk, dus eerst de oudste teksten en dan steeds verder naar 600 n. Chr. toe.

Zettel

Toen ze ongeveer bij de tweede eeuw n. Chr. aankwamen, bleken het toch erg veel kaartjes te worden. Bovendien waren inmiddels de “klassieke” auteurs alle aan de beurt geweest. Uit de latere eeuwen zijn heel veel teksten overgebleven, vooral veel christelijke teksten. Nu hebben die niet een compleet ander soort Latijn geschreven als in de periode ervoor. Om te vermijden dat er alleen al voor het woordje et (“en”) honderden dozen zouden ontstaan, werd er vanaf dit punt een andere methode gebruikt: alleen nog woorden die in de periode ervoor niet of nauwelijks voorkomen, of met een nieuwe betekenis of constructie, zouden een kaartje mogen krijgen. Daarom werd deskundigen voor de verschillende laatantieke auteurs gevraagd de kaartjes voor hun auteur te maken. Op deze manier ontstond in een vrij korte tijd een enorme analoge database voor het hele overgeleverde Latijn, netjes gerangschikt naar lemma en binnen een lemma chronologisch.

Gestaag doorwerken

Hiermee kon dus een woordenboek worden gemaakt. Daarvoor werd een periode van twintig jaar geschat. Dit bleek echter al gauw absoluut utopisch. Eén persoon alleen had dit zeker nooit aan gekund, maar ook in een team bleek dit ondoenlijk.

Toch werd er gestaag doorgewerkt en ongeveer elk jaar kwam er een deel uit. Zo ging het project door tijdens de Eerste Wereldoorlog en tijdens de Tweede. Het overleefde de verdeeldheid van Duitsland en de hereniging. Tot nu toe zijn de letters A-M, O-P en delen van N en R verschenen. Er werkt een internationaal team van wetenschappers aan, sommige voor een jaar, sommige voor jaren of hun hele leven.

De praktijk

Wat doet nu iemand die daar werkt? Hij of zij krijgt een doos met kaartjes, dat kunnen er een paar zijn bij kleine woorden, of meerdere dozen bij grote woorden. Omdat de kaartjes chronologisch staan, komen de oudste teksten het eerst. De kaartjes worden gecontroleerd aan de hand van moderne edities, vaak zijn er ook commentaren of vertalingen bij nodig. Vooral bij fragmenten kan dit een puzzel worden.

Bovendien komen er teksten langs uit allerlei verschillende vakgebieden: juridische teksten, teksten over architectuur, landbouw, astronomie, geschiedkundige werken, gedichten, brieven, christelijke pamfletten, theologische discussies, redevoeringen, komedies etc. Hij moet zich dus ook in deze verschillende deelgebieden gaan inwerken en eventueel experts op deze gebieden om raad vragen.

Op basis van de context bepaalt de medewerker wat voor een betekenis het woord op die plaats heeft. Zo verdeelt hij alle citaten over verschillende groepjes, die hij weer probeert met elkaar in verband te brengen. Zo ontstaat er een soort stamboom en worden ontwikkelingen in het gebruik van een woord duidelijk.

Encyclopedie van het Latijn

Is dit nu een woordenboek zoals Cicero het zou kunnen hebben gebruikt, of Augustinus? Afgezien van het feit dat woordenboeken nog niet bestonden, moet het antwoord nee zijn. Het is een encyclopedie van het Latijn zoals het toevallig overgeleverd is.

Ooit vaak gebruikte woorden staan er helemaal niet in, of maar met een paar voorbeelden. Gewoon omdat niemand ze opgeschreven heeft of omdat de teksten waarin ze stonden verdwenen zijn. Dit geldt vooral voor vakjargon, bijv. in de scheepsbouw, in het leger. Speciale betekenissen van een woord zijn verdwenen. Van dialecten weten we maar een paar woorden. Andere woorden hebben juist heel veel citaten, terwijl ze al snel ouderwets waren, of alleen door bepaalde mensen werden gebruikt, bijv. theologen. Een woord dat iemand op de muur van een WC in Pompeii heeft geschreven wordt net zo serieus genomen als een citaat van Cicero. Ook wat je eventueel als een fout zou kunnen beschouwen komt in de Thesaurus linguae Latinae. Het is een bestandsopname van wat we hebben, niet van wat er ooit is geweest.

Digitale databases

Er zijn toch tegenwoordig toch ook computers? Kan het daarmee niet sneller? Er bestaan inderdaad tekst-databases voor het Latijn, meestal achter betaalmuren, maar dat is een ander verhaal.

Er kleven echter verschillende nadelen aan deze databases. Ook de omvangrijkste database heeft niet alle Latijnse teksten. Vooral onbekende werken ontbreken vaak. De edities in zo’n database zijn niet altijd de nieuwste, en het zogenaamde kritische apparaat, waarin de uitgever uitlegt hoe zijn tekst tot stand gekomen is, ontbreekt. En je moet alle vormen van een lemma invoeren om ook echt alle citaten van een woord te krijgen. Dat betekent bij een werkwoord alle werkwoordsvormen, ook uitzonderingen. Een database is anders gezegd niet gelemmatiseerd. Daardoor zijn ook homoniemen niet van elkaar gescheiden, bijv. populus in de betekenis “volk” of “populier”. Dat is alles bij de analoge database van de Thesaurus linguae Latinae al gebeurd.

Meer dozen met systeemkaarten

Maar het belangrijkste is: we hebben het alleen maar over het verzamelen van de citaten. Het interpreteren en indelen van de citaten kan de computer niet overnemen. Natuurlijk gebruiken de medewerkers van de Thesaurus linguae Latinae dagelijks computers, om even de context van een citaat te bekijken, tijdschriftartikelen te raadplegen en het artikel zelf te schrijven.

Uitleg in het Latijn

Als iemand de Thesaurus linguae Latinae weleens heeft bekeken, zal hem of haar zijn opgevallen, dat het woordenboek helemaal in het Latijn is. Inderdaad zijn niet alleen de citaten, maar ook de betekenissen en de uitleg in het Latijn. Dat klinkt niet zo toegankelijk. Nu is dit een beslissing uit de negentiende eeuw, maar er is veel voor te zeggen. Als ze toen hadden besloten het in een moderne taal te maken, zou de keus op het Duits zijn gevallen. Dat zou in de Engelstalige wetenschappelijke wereld van nu ook niet zo prettig gevonden worden. En inmiddels zou dit Duits bovendien verouderd zijn. Latijn veroudert tenminste niet meer. Bovendien verplicht het schrijven van de betekenissen in het Latijn, dat je niet zomaar een vertaling kunt nemen (bijv. “repudiate” voor repudio, of “repeat” voor repeto) maar echt in dezelfde taal moet uitleggen wat een woord betekent. De Thesaurus linguae Latinae is bedoeld voor mensen die zich intensief met Latijn bezig houden, die moeten dus al goed genoeg Latijn kennen.

Om teksten uit de oudheid echt goed te kunnen begrijpen en vertalen is de Thesaurus linguae Latinae nodig. Hier kan een onderzoeker vinden wat een bepaald woord allemaal kan betekenen, in wat voor contexten het gebruikt wordt, wat de ontwikkeling van een woord is, hoe het geschreven werd, met welke woorden het in de handschriften vaak wordt verwisseld. Het is meer een encyclopedie van de woorden dan een woordenboek. En het is hier gratis toegankelijk.

[De reeks “Methode op Maandag” (MoM), waarin vandaag Josine Schrickx aan het woord was, toont wat de oudheidkundige wetenschappen maakt tot wetenschappen. Overzichten van deze en vergelijkbare stukjes zijn hier en daar. De foto’s waren van Michiel Streijger.

Dit stuk wordt gereblogd op #GrondslagenNet, de groepsblog van archeologen, classici en oudhistorici.]

17 gedachtes over “MoM | Thesaurus linguae Latinae

  1. “Nu is er een aantal problemen met deze woordenboeken.”
    Onlangs kwam ik nog iets tegen, wellicht in de Mainzer Beobachter: dergelijke woordenboeken veronderstellen impliciet dat Latijn een statische taal was. Dat is van de gekke. Hieruit volgt niet dat dergelijke woordenboeken waardeloos zijn; een mens moet immers ergens beginnen met het aanleren (passief of actief) van een nieuwe taal.
    Mijn bewondering gaat uit naar iedereen die hier aan heeft meegewerkt.

    1. Rob Duijf

      Het leuke is dat Latijn nog steeds in beweging is! Het wordt wel gezien als dode taal, omdat het niet meer algemeen wordt gesproken, maar er is een internationale society van Latijnsprekers; dat betekent dat aan de Latijnse woordenschat voortdurend nieuwe woorden en begrippen worden toegevoegd en die woordenlijst wordt ook bewaakt.

      Voor een ieder die zijn Latijn of Grieks wil ophalen, of het wil leren, wil ik hier wel even reclame maken voor Addisco Onderwijs in Hilversum:

      https://www.addisco.nl/

  2. Marcel Meijer Hof

    Dit alles speelt zich af in München – ik heb het even opgezocht voor de eenvoudige leek – onder auspiciën [ voortekens -Haruspices ?] van de Bayerische Akademie der Wissenschaften.

    Gedenken wir nebenbei die Geschwister Scholl.

  3. sara

    Voor het grieks is er de amerikaanse Thesaurus Linguae Graecae (Amerikaans). De abridged versie is vrij toegankelijk.

    1. Dirk

      Kijk, zoiets vind ik dus verschrikkelijk interessant en ik loop over van bewondering voor het werk dat deze mensen verzetten.

      1. Huibert Schijf

        Ik ook. Met veel interesse gelezen en geheel nieuw voor mij. Dat het hier om kaartenbakken gaat maakt technisch niets uit, maar is goed herkenbaar. Ik ben zelf als klein radertje weleens bij grote databases betrokken geweest. Daarbij golden altijd twee gouden principes: foutjes moeten flexibel kunnen worden gecorrigeerd en nieuwe informatie moet gemakkelijk kunnen worden toegevoegd. Het project is een uitstekend voorbeeld hoe door gestaag doorwerken vooruitgang kan worden geboekt waarbij systematisering van kennis en toegankelijk maken van die kennis centraal staan.

  4. Robbert

    Geweldig!! Wat een project. En zo helder uitgelegd.
    Maar gevaarlijk als het analoog op 1 plaats in Munchen geschiedt, denk aan Keulen.

  5. Christo

    Heel mooi en informatief verhaal!
    Over de samenstelling van de Oxford English Dictionary is een boek en een film gemaakt (Mel Gibson). Is over dit onderwerp een uitgebreid artikel of boek beschikbaar?

  6. Christo

    Het gebruik van hier benoemde systeemkaartjes zien we ook mooi terug in de Nederlandse archeologie: het oude Loeb-archief. Juffrouw Loeb typte na WOII vele duizenden systeemkaartjes over archeologische vondstlocaties in Nederland. Kaartjes geordend op coordinaten, plaats, vondstcomplex, en dergelijke. Dus een vondstlocatie werd op tenminste vier of vijf manieren ontsloten. Dit archief vormde de basis voor het huidige digitale archeologisch informatiesysteem Archis3. De wat oudere archeologen (45+) kennen het Loeb-archief nog, de nieuwe generaties (helaas) niet meer. Loeb is een van de vele vrouwen die een grote bijdrage heeft geleverd aan de Nederlandse archeologie.

  7. Erik Bouwknegt

    “Het begin is vrij duidelijk: de oudste fragmenten van het Latijn zijn oude wetteksten, de twaalftafelenwet uit ca. 450 v.Chr.”

    Ik vraag me dan toch af hoe er is besloten dat het beroemde zinnetje “Manius heeft me gemaakt voor Numerius” (MANIOS MED FHEFHAKED NVMASIOI) geen Latijn meer mag heten. Ik heb altijd begrepen dat dit de oudste Latijnse tekst is, uit de 6e of 7e eeuw voor Chr. Daarnaast nog een aantal inscripties naar ik meende te weten.

    1. Arnold den Teuling

      Dat is al een aantal (tientallen?) jaren geleden als vervalsing ontmaskerd. Ik heb de details niet paraat.

  8. Opa

    Fascinerend dit woordenboek, ik had er nooit eerder van gehoord, wat een karwei voor ieder die er aan werkt, allen al om er de omvang van te zien, het duizelt mij.

Reacties zijn gesloten.