[Dit is het zesde van acht door Marco Folpmers geschreven blogjes over de mogelijkheid met artificiële intelligentie Plato’s Zevende Brief te analyseren. Het eerste was hier. Hoe pakt een onderzoeker dat aan?]
Een publicatie van de Amerikaanse Harvard-universiteit heeft in 2021 nieuw licht geworpen op de auteursvraag van de Zevende Brief van Plato. Het betreft de scriptie van Jordan Bliss Perry voor “the departments of computer science and the classics” van Harvard.noot J.B. Perry, Examining the Authenticity of Plato’s Epistle VII through Deep Learning (2021; Bachelor’s thesis, Harvard College). Over deze Perry is verder weinig te vinden.
Weliswaar is dit geen officiële publicatie in een journal met peer-review, maar van de andere kant zien de publicatie an sich en de begeleiders er betrouwbaar uit. Ik zal nog terugkomen op de verschijningsvorm van deze studie.
Het berekenen van de prestatie-statistieken gebeurt vaak tweemaal, op twee gescheiden subsets van de totale verzameling van historische data. Bij het vinden van het beste verband tussen input-data en de te verklaren variabele (wanbetaling in het voorbeeld uit het vorige blogje) worden in feite de prestaties van het model geoptimaliseerd. Dat kan soms ook op een gewogen manier zijn, bijvoorbeeld dat de modelleur sensitiviteit belangrijker vindt dan specificiteit.
Deze procedure brengt met zich mee dat het statistische model geoptimaliseerd wordt op de toepassing van de input-data. Maar betekent dit ook dat het model ook in andere gevallen (die niet in de ontwikkel-set zaten) goed werkt? Met andere woorden: is het model generaliseerbaar naar andere gevallen of nieuwere gevallen?
[Dit is het derde van acht door Marco Folpmers geschreven blogjes over de mogelijkheid met artificiële intelligentie Plato’s Zevende Brief te analyseren. Het eerste was hier en we moeten het eens hebben over statistische classificatiemodellen en hun prestaties. Maar eerst een woord over bankieren.]
We moeten het eerst eens hebben over banken. Voor banken is het essentieel om een inschatting te kunnen maken of ze hun verstrekte leningen terugbetaald krijgen of niet. Daarom maken banken voor elke individuele klant (zowel voor bedrijven als voor u en mij) een inschatting van de kans op wanbetaling, vaak aangeduid met de Engelse term “Probability of Default” of PD. Is vastgesteld dat bij een kredietaanvraag iemands PD te hoog is, dan krijgt deze persoon de lening niet, of alleen tegen een hoge rente, of na het verstrekken van voldoende onderpand. Maar aangezien elke lening wel enig risico heeft (de PD is nooit nul) en deze PD’s ook in de tijd kunnen veranderen, nemen banken aanvullende maatregelen. De belangrijkste is dat ze kapitaal aanhouden als buffer om verwachte en onverwachte verliezen op te vangen.
Banken berekenen voor elke klant de PD door een statistisch model toe te passen. Dit model is eerder ontwikkeld aan de hand van historische data. In historische data heb je namelijk het profijt van “kennis achteraf”. Je weet wie er in wanbetaling is gegaan (vaak gedefinieerd als achterstanden die meer dan negentig dagen zijn opgelopen). Er wordt dus eerst data verzameld met mogelijke verklarende variabelen alsmede de te verklaren variabele: in wanbetaling wel/niet geraakt.
Een aardig stuk in De Groene Amsterdammer hekelt de wijze waarop verslag wordt gedaan van het vrouwenvoetbal. Er staat veel zinvols in, maar Rosa van Gool mist de olifant in de kamer, namelijk dat over voetbal überhaupt nooit zinvol verslag wordt gedaan. Het probleem is dat verslaggevers de fictie niet doorbreken willen of kunnen dat voetbal sportief is. Loop even mee.
Stelt u zich een wedstrijd voor, bijvoorbeeld Nederland tegen Italië, en stelt u zich voor dat het in de verlenging na de 118e minuut 1-1 staat. Een Italiaanse spits krijgt de bal, terwijl er tussen haar en het Nederlandse doel maar één verdediger staat. Die weet dat haar tegenstander in deze situatie vrijwel altijd zal scoren en heeft een simpele keuze:
sportief blijven, accepteren dat het 2-1 wordt voor Italië en verantwoordelijk zijn voor de Nederlandse uitschakeling;
de Italiaanse speler neerhalen en rood krijgen, waarna Nederland bij de strafschoppen een kans heeft om door te gaan naar de volgende ronde.
Ik kan me niet voorstellen dat een jonge vrouw uit pakweg de Filipijnen op een ochtend opstaat met het idee “Weet je wat? Ik verhuis naar Amsterdam, ik ga daar werken op De Wallen! Seks met dronken toeristen, dat is zeg maar echt mijn ding!” Doordat ik me dit zo slecht kan voorstellen, ben ik er vrij zeker van dat menige vrouw niet voor haar plezier achter de ramen staat. Ik ben er nog zekerder van dat er vrouwenhandel bestaat, want ik heb ooit een Aziatische vrouw gekend die door een bende aan het werk was gezet. Ik ken meer voorbeelden.
Ik ben er echter óók zeker van dat er vrouwen zijn die bewust voor prostitutie kiezen. In een Duitse hotellobby heb ik wel eens gesproken met zo iemand, tot ze het gesprek afbrak omdat een bloedmooie man binnen kwam lopen in wie ze een potentiële klant zag. Ze had me niet veel verteld, maar het was me voldoende duidelijk dat ze haar werk bepaald niet met tegenzin deed. Ook hiervan ken ik meer voorbeelden.
Je moet ingelogd zijn om een reactie te plaatsen.