MoM | Von Däniken en waarschijnlijkheid

De ouderdom van de Artemidorospapyrus

De spreekwoordelijke pseudowetenschapper is Erich von Däniken, die met Waren de goden kosmonauten niet alleen een batterij onzin de wereld inschoot maar ook een model heeft geschapen om aandacht te genereren. Je verdient geld met leuke weetjes, niet door uit te leggen wat wetenschap eigenlijk is. De feitelijke schade is ontstaan toen wetenschappers dit sensationalisme overnamen: we hebben, zoals u weet, wel boeken over gladiatoren maar geen websites met uitleg van hermeneutiek. En uitleg over archeologie gaat altijd over vondsten, nooit over archeologie.

Is Von Däniken dan een wegbereider voor academische miscommunicatie, veel invloed hebben zijn eigenlijke ideeën over ancient astronauts niet. (Wat aan desinformatie circuleert, komt doordat onderzoekers – hyperspecialisten dus – zich bezighouden met een voorlichting, een typische generalistenactiviteit. Eenmaal buiten hun specialisme vallen ze terug op handboekkennis en die is strijk-en-zet verouderd.) Omdat ancient astronauts dus wat marginaal zijn, was ik verbaasd toen ik een mailtje kreeg waarin iemand me erop wees dat ik genuanceerder had moeten schrijven over Von Däniken. Wetenschappers als ik, zo werd me uitgelegd, moesten dingen niet op voorhand uitsluiten.

Wie me aanspreekt als wetenschapper heeft bij mij gelijk het nadeel van de twijfel. Je kunt, als je me schrijft, even opzoeken wat mijn werk is. De opmerking is niettemin legitiem: onderzoekers moeten alles overwegen, ook het onwaarschijnlijke. Dat brengt ons op de vraag hoe je het waarschijnlijke bepaalt en als voorbeeld neem ik de Artemidorospapyrus: een vervalsing waarover ik nog in wat meer detail zal bloggen. De oplichter had antiek papyrus gebruikt – al sinds de negentiende eeuw gebruiken vervalsers antiek schrijfmateriaal – dus toen onderzoekers er een koolstofdatering op loslieten, waren de resultaten in overeenstemming met wat je verwacht. Zie het plaatje hierboven.

Als een monster “1900 BP ± 45 jaar” wordt gedateerd, is er 68% kans dat het schrijfmateriaal een datering heeft binnen het donkerste deel (eenmaal de onzekerheidsmarge), dus dat het organisme tussen de 1945 en 1855 jaar voor het ijkjaar 1950 (BP) is gestopt met ademen. Er is 95% kans dat het gaat om een moment tussen de 1990 en 1810 jaar voor die datum, ofwel dubbel de marge van vijfenveertig jaar. Er is 99% kans bij een driedubbele marge, en zo voort.

Bij koolstofdateringen is de waarschijnlijkheid dus in een getal uit te drukken. Van de Lijkwade van Turijn weten we dat er 68% kans is dat het doek is vervaardigd tussen 1273 en 1288 en 95% dat het gaat om een wijder interval. Theoretisch is het denkbaar dat de Lijkwade tweeduizend jaar oud is, maar de kans daarop is verwaarloosbaar.

Vaak kan de waarschijnlijkheid echter niet worden uitgedrukt in een percentage. In de jaren tachtig zullen in Amsterdam vast weleens fietsen legaal zijn verkocht voor ƒ25 maar de kans dat een fiets die je voor dat bedrag werd aangeboden gestolen was, zal bijna 100% zijn geweest. Als een papyrussnipper zonder gedocumenteerde provenance opduikt, is de kans bijna 100% dat die óf vals is óf gestolen. Opnieuw geldt: theoretisch is het denkbaar dat die fiets of dat fragment bona fide is, maar de kans daarop is verwaarloosbaar, zelfs als je niet in staat bent die kans in cijfers uit te drukken.

Von Dänikens theorie van de ancient astronauts is een combinatie van deze twee. Voor een deel kunnen we cijfermatig onderbouwen waarom ET geen contact met ons opneemt. Ik heb weleens een stukje over Drake’s Equation geschreven. Voor een ander deel is het een kwestie van “een fiets van ƒ25 zal wel zijn gestolen”: niet cijfermatig te onderbouwen maar wel een goede inschatting. Geen kansberekening maar kansleer.

Laatste punt: het is pertinent niet waar dat de universiteit nooit slechte onderzoeksresultaten levert. Het is geen toeval dat ik net een voorbeeld aanhaalde uit de papyrologie. De ontdekster van het Evangelie van de Vrouw van Jezus ging, toen eenmaal was bewezen dat het een vervalsing was, op zoek naar argumenten waarom die papyrussnipper toch echt zou kunnen zijn, met argumenten die ze nooit zou hebben overwogen als het niet was om een weerlegde theorie te handhaven. Zo is het ook met de ancient astronauts: om deze of gene beschrijving van een antiek hemelverschijnsel te interpreteren als een bezoek van buitenaardse ruimtevaarders, moeten allerlei hulphypothesen worden ingeroepen die je anders niet zou verzinnen. Dat is meestal een aanwijzing dat je op de verkeerde weg bent.

[Geschiedenis is geen amusement, leuk voor een vrijblijvend stukje in een tijdschrift of een item op TV. Het is een wetenschap. In de reeks “Methode op Maandag” (MoM) leg ik uit wat de oudheidkundige wetenschappen, en de historische wetenschappen in het algemeen, maakt tot wetenschappen. Een overzicht van deze en vergelijkbare stukjes is hier.]

47 gedachtes over “MoM | Von Däniken en waarschijnlijkheid

  1. Bert Schijf

    Het gebruik van de normaalverdeling is makkelijk te begrijpen bij een grootheid als lengte van mannen (of vrouwen). Het veronderstelt dat de gemiddelde lengte bekend is. En dat we de standaarddeviatie (een maat voor de spreiding rondom het gemiddelde) ook kennen. Zo is te berekenen hoe groot de kans is dat een man (of vrouw) veel groter of veel kleiner is dan de gemiddelde lengte van mannen (of vrouwen). Erg handig bijvoorbeeld voor de verdeling bij confectiematen voor kleding. Betrouwbaarheidsintervallen worden gebruikt als de populatiegegevens onbekend zijn en er daarom een steekproef wordt genomen om die populatiegrootheden te schatten. Zie het plaatje dat JonaL geeft. Maar hoe zit het met de redenering van JonaL? Hij heeft het over slechts een steekproef van een (1) papyri uit een populatie die normaal verdeeld zou moeten zijn wat dat ook betekent bij papyri. Dan moeten ook de gemiddelde datum en de standaardafwijking nog bekend zijn. Betrouwbaarheidsintervallen zijn dus niet bedoeld voor een redenering bij een steekproef, maar voor een generalisatie naar een populatie. Bij koolstofdateringen ligt het waarschijnlijk anders. Er zullen zoveel dateringen bestaan die extern gecontroleerd kunnen worden dat de betrouwbaarheidsmarges redelijk goed bekend zijn.

    1. FrankB

      “Hij heeft het over slechts een steekproef van een (1) papyri”
      Dit is incorrect. Hij geeft inderdaad maar één voorbeeld, maar het is precies dat – een voorbeeld. Hij kan er vele andere noemen.

      1. Bert Schijf

        Accoord wat betreft het voorbeeld, maar daar gaat het helemaal niet om. Stel ik wil de lengte van een man schatten: 1,80. Het is schatting dus het zou kunnen dat hij twee centimeter langer is of twee centimeter korter. Dat snapt iedereen en er komt geen normaalverdeling aan te pas. JonaL meent dat te moeten uitleggen aan de hand van betrouwbaarheidsintervallen. Maar dat is een oneigenlijke redenering en een overbodig gebruik van de normaalverdeling. Wel zouden we als we de gemiddelde ouderdom en standaardafwijking bij de gevonden papyri kennen, kunnen uitrekenen hoe groot de kans is dat een papyri een bepaalde leeftijd heeft.

        1. Martin

          Daarom is de Bayesiaanse waarschijnlijkheid te gebruiken. Het voorbeeld van de fiets laat het zien: de a priori kans om voor 25 gulden een goede en niet gestolen fiets te kunnen kopen is zo klein dat de conclusie dat de fiets gestolen is een hoge waarschijnlijkheid heeft.

          1. Martin

            Dat geldt ook voor “niet uitsluiten”: de vraag is wat de reden zou zijn om het wel te serieus te nemen. De a priori kans op een platte Aarde is zo klein (nul), dat het idee niet serieus valt te nemen. Zo werkt wetenschap. We kunnen niet zomaar alles serieus gaan nemen. Daarom is ook ongeveer 90% van de exacte wetenschappers niet gelovig.

              1. FrankB

                “Bron?”
                Vermoedelijk zoiets:

                https://www.quora.com/Is-it-true-that-93-of-scientists-in-the-US-are-atheists-Why

                “This is almost certainly based on a survey of members of the National Academy of Sciences (NAS) regarding religious belief conducted in 1998 by Edward J. Larson and Larry Witham, and published in Nature Magazine.”
                Ik heb andere onderzoeksverslagen gezien en het viel me op dat die zich allemaal beperkten tot de VSA. En jawel, er is ook dit:

                https://phys.org/news/2015-12-worldwide-survey-religion-science-scientists.html

              2. Martin

                Ligt ook voor de hand. Een exacte wetenschapper wil empirisch bewijs voor een hypothese. Zomaar wat geloven telt niet, dat doe je met een theorie ook niet.

          2. Martin

            Omdat niet iedereen bekend is met de stelling van Bayes:

            De kans op twee gebeurtenissen A en B is P(A|B)P(B) . Maar dit is hetzelfde als de kans op B en A: P(B|A)P(A).

            Dus P(A|B)P(B)=P(B|A)P(A). Dus P(A|B)=P(B}A)P(A)/P(B). Bij een spel kaarten is dat triviaal. De kans op een harten aas is hetzelfde als de kans op een aas harten, namelijk 1/52.

            Dit toegepast op hypothese H en data D:

            P(H|D)=P(D|H)P(H)/P(D).

            Dat is ook zo met Drake’s vergelijking: als ik een leuke P(H|D) wil hebben, dan moet ik de a priori waarschijnlijkheden P(H) en P(D) een beetje gunstig inschatten. Dat bewijst echter niets, want voor dat soort gevallen hebben we geen idee van P(D) of P(H). Voor onbewezen theorieën (bv string theory) wordt wel vaker Bayes van stal gehaald, omdat daarmee gesuggereerd kan worden dat P(H|D) misschien toch wel de moeite waard zou zijn.

        2. FrankB

          “daar gaat het helemaal niet om”
          Dat had ik begrepen en daarom heb ik er geen commentaar op geleverd.

          1. Bart Schijf: “Stel ik wil de lengte van een man schatten: 1,80. Het is schatting dus het zou kunnen dat hij twee centimeter langer is of twee centimeter korter. Dat snapt iedereen en er komt geen normaalverdeling aan te pas.”

            Misschien snapt iedereen dat een schatting er naast kan zitten, maar niet iedereen snapt dat een meting niets anders is dan een schatting, noch dat iedere meting onnauwkeurig is. Bovendien, snapt lang niet iedereen wat de betekenis is van het begrip nauwkeurigheid en wat de meetfouten en de onzekerheidsintervallen die bij ouderdomsbepalingen opgegeven worden betekenen. Ik heb de indruk het Jona daar om gaat. Dat hij wil uitleggen wat nauwkeurigheid voor iets is (wat het betekent om te zeggen dat een meting onnauwkeurig is, wat die meetfouten betekenen en wat onzekerheidsintervallen zijn).

            En die zaken kun je volgens mij inderdaad alleen maar begrijpen als je snapt dat ze betrekking hebben op de distributie van de uitkomsten van alle mogelijk metingen die volgens dezelfde procedure in dezelfde omstandigheden gedaan kunnen worden. Dat is namelijk wat ‘onnauwkeurigheid’ is: onnauwkeurigheid is in wezen het verschijnsel dat dezelfde procedure in dezelfde omstandigheden en toegepast op objecten die de te meten eigenschap in gelijke mate hebben niet altijd dezelfde uitkomst geeft. De distributie van die uitkomsten kennen we niet, maar we kunnen er wel over theoretiseren en die theorie gebruiken om een schatting te maken van de nauwkeurigheid van een meetprocedure. Daarvoor hebben we begrippen nodig als meetfout en onzekerheidsinterval en moeten we veronderstellingen maken over de distributie van die verschillen. Een meting is een schatting van de werkelijke waarde van een bepaalde eigenschap (lengte, ouderdom) van een object (mens, papyrus) of proces. Een meetfout is het verschil tussen de werkelijke waarde en de gemeten waarde en een onzekerheidsinterval voor een gemeten waarde, is een interval waarvoor geldt dat het gegeven de uitkomst van de meting hoogst waarschijnlijk is dat de werkelijke waarde van de gemeten eigenschap in dat interval ligt.

            1. Oeps. Verkeerde plaats. Bovenstaande reactie was bedoelt als aanvullen op mijn eigen reactie van FEBRUARI 25, 2020 OM 12:23 AM (hieronder), niet als reactie op FrankB’s commentaar van EBRUARI 24, 2020 OM 4:12 PM

            2. Martin

              Er wordt onderscheid gemaakt tussen systematic en random errors. Als je een lineaal gebruikt dan kan een lengte tussen twee streepjes vallen, en dan besluit je 10,2 of 10,3, dan heb je een random error.

              Maar als je lineaal niet goed gecalibreerd is dan krijg je systematische fouten. Bij oude objecten gaat het om calibratie en niet om een distributie.

              1. “Bij oude objecten gaat het om calibratie en niet om een distributie”

                Volgens de “Encyclopedia of Quarterny Science” betreft een opgave van het onzekerheidsinterval de random error (de precisie) en niet

              2. Martin, wat is je bron? De door mij geraadpleegde Encyclopedia of Quarterny Science meldt expliciet dat de opgegeven meetfout de precisie na calibrator (dus de randomly error) betreft en niet de accuraatheid van de calibratie (de systematische error). De auteur tekent daarbij aan dat de opgegeven meetfout mogelijk te klein is omdat de distributie na calibratie niet meer normaal is.

        3. “Stel ik wil de lengte van een man schatten: 1,80. Het is schatting dus het zou kunnen dat hij twee centimeter langer is of twee centimeter korter. Dat snapt iedereen en er komt geen normaalverdeling aan te pas”

          Om de nauwkeurigheid waarmee je schat te bepalen hoef je inderdaad geen veronderstellingen te maken betreffende de verdeling van de lengte in een populatie van mensen, maar je moet wel degelijk veronderstellingen maken betreffende de verdeling van de meetfouten (d.w.z. van van de verdeling van de uitkomsten van metingen volgens dezelfde procedure van personen die feitelijk dezelfde lengte hebben). Zie mijn eerdere commentaar ergens hieronder.

          In het voorbeeld dat ik daar geef van een procedure om iemands lengte te meten, trek ik de dikte van het plankje af van de afstand van vloer tot streepje. Als beide afstanden met een nauwkeurigheid van 0.5 cm gemeten worden en de meetfout normaal verdeeld is, is de nauwkeurigheid van het resultaat van deze berekening 1 cm. Als de meetfout niet normaal verdeeld is, is de nauwkeurigheid van het resultaat nog minder.

          “Wel zouden we als we de gemiddelde ouderdom en standaardafwijking bij de gevonden papyri kennen, kunnen uitrekenen hoe groot de kans is dat een papyri een bepaalde leeftijd heeft.”

          De standaardafwijkingen en gemiddelde ouderdom van de papyri zijn niet van belang. Het gaat om de distributie en de standaardafwijking van uitkomsten van metingen met dezelfde procedure toegepast op papyri die feitelijk even oud zijn! Van die distributie wordt veronderstelt dat ze normaal verdeeld is en die veronderstelling wordt gebruikt om de nauwkeurigheid van de procedure in te schatten.

          Volgens de encyclopedie die ik in mjn eerdere bijdragen noem is de distributie van de meetfouten na calibratie niet normaal, waardoor de meetfout groter is dan berekend (dit omdat de berekening die standaard toegepast wordt gebaseerd is op de veronderstelling dat de meetfouten normaal verdeeld zijn).

          1. Martin

            Als je de oudheid van een object wilt schatten, dan moet je eerst de meest waarschijnlijke ouderdom bepalen. Daarna kan je er een onzekerheidsinterval omheen zetten. Bij de getoonde Gaussiaan is de vraag: waar komt de centrale waarde (mu) vandaan? Is iets ongeveer 2000 jaar oud, of ongeveer 2500 jaar of ongeveer 3000 jaar? Als je dat niet weet dan heeft zo’n Gaussiaan ook geen zin.

            1. Martin

              Dit gaat over het verschil tussen frequentistische statistiek en Bayesiaanse statistiek. De frequentistische is als: stel u heeft een zuivere dobbelsteen, wat is dan de kans op …. Maar in de praktijk weet je niet of de dobbelsteen zuiver is. Je kunt wel doen alsof je een exacte mu hebt, maar dat is onzin. De verwarring is dat de mu gegokt wordt, waarna die gok als exacte centrumwaarde van de distributie wordt geaccepteerd. Dat is niet logisch coherent.

            2. Martin, de vergelijking tussen C14 bepaling van de ouderdom van een papyrus en de test of een dobbelsteen zuiver is gaat volgens mij niet op omdat de ouderdomsbepaling een meting van een niet-stochastische eigenschap betreft en het in het dobbelsteenvoorbeeld gaat om een oordeel over een stochastische eigenschap op basis van een steekproef.

              De ouderdomsmeting lijkt meer op het vaststellen van het aantal ogen op de naar boven gekeerde zijde van een geworpen dobbelsteen dan op het trekken van conclusies over zuiverheid op basis van een aantal worpen.

              Met het verschil tussen klassieke en Bayesiaanse statistiek heeft dit weinig of niets te maken

              Aan de ouderdomsmeting komt geen statistiek te pas (wel wat waarschijnlijkheidsrekening). Je bepaald de radioactiviteit van een monster van het object waarvan je de ouderdom wilt bepalen (Am) en vergelijkt dit met de huidige radioactiviteit van een levend iets (A0). De ongecalibreerde ouderdom is dan gelijk aan ln(A0/Am) * (halfwaarde tijd van C14).

              Nadat je de ouderdom hebt bepaald rijst de vraag: wat is de nauwkeurigheid van de bepaling?

              Die nauwkeurigheid wordt aangegeven door middel van een interval. Ik citeer Jona’s post:

              “Van de Lijkwade van Turijn weten we dat er 68% kans is dat het doek is vervaardigd tussen 1273 en 1288”

              Volgens de eerder geciteerde *Encyclopedia of Quaternary Science* hebben de laboratoria die de datering doen in overleg met een of andere relevante wetenschappelijke commissie afgesproken een 95% interval te hanteren, maar dat maakt verder niet uit. Het is eenvoudig te berekenen dat een 68% interval van 1283-1288 overeenstemt met een 95% interval van 1262-1384 (1304 ± 43)

              Het is belangrijk te beseffen dat de relevante distributie niet de distributie is van de kans dat de lijkwade uit 1304 dateert, maar de distributie van de kans dat de meting het juiste resultaat oplevert. Specifieker: de kans dat als de toepassing van een bepaalde meetprocedure op een bepaald object de waarde ’n jaar oud’ oplevert, het object n jaar oud is.

              Laat e de gemiddelde meetfout zijn van een meting onder dezelfde omstandigheden. De waarschijnlijkheidsrekening leert dan dat als de meetfout normaal verdeeld is, de gezochte kans 68% is voor het interval en 95 procent voor het interval .

              Merk op dat de gemiddelde meetfout (anders dan de ouderdom) een stochastische grootheid is. Het schatten van de gemiddelde meetfout is daarom wel vergelijkbaar met het bepalen van de zuiverheid van een dobbelsteen.

              Er bestaan twee typen methodes om de zuiverheid van een dobbelsteen in te schatten: statistische en analytische. Bij statistische methoden voer je een experiment uit waarop je een statistische analyse loslaat. Bijvoorbeeld: je gooit een dobbelsteen een groot aantal keren en stelt de kans dat de dobbelsteen n-ogen gooit gelijk aan het aantal malen dat je n ogen gooide gedeeld door het aantal worpen.

              Je kunt (soms) ook analytische methoden gebruiken: je kijkt eerst of de dobbelsteen overal dezelfde afmetingen heeft, vervolgens zaag je hem in gelijke plakken en legt deze op de weegschaal. Als ze allemaal hetzelfde gewicht hebben is de dobbelsteen zuiver.

              Hetzelfde geldt voor de schatting van de meetfout.

              Je zou statistische methoden kunnen gebruiken, Je zou bijvoorbeeld een bepaling meermalen uitvoeren en op basis daarvan de meetfout schatten. Zulke soort experimenten zijn (op zeer beperkte schaal) gedaan.

              Als ik de al vaker genoemde *Encyclopedia of Quarternary Science* goed begrijp zijn de schattingen die de laboratoria opgeven doorgaans analytische: ze gebruiken vuistregels m.b.t. de bepaling van de radioactiviteit en laten daar een ‘error propagation formula’ op los.

              1. Oeps – “De waarschijnlijkheidsrekening leert dan dat als de meetfout normaal verdeeld is, de gezochte kans 68% is voor het interval en 95 procent voor het interval ” moet zijn::

                De waarschijnlijkheidsrekening leert dan dat als de meetfout normaal verdeeld is, de gezochte kans 68% is voor het interval >w+e, w-e< en 95 procent voor het interval .>w+2e,w-2e<

                HTML probleempje.

              2. Martin

                In de techniek wordt vaak verondersteld dat de ruis AWGN is, additive white Gaussian noise. Dan is de verwachtingswaarde van de ruis gelijk aan nul, en dan is de meetwaarde unbiased.

                Die error propagation begrijp ik wel, want je neemt de logaritme.

                Dus ik neem aan dat het bekend is dat in dit geval de meetfout zich als AWGN van een bepaalde spreiding gedraagt? Door de logaritme ligt de gerapporteerde waarde dan niet exact in het midden.

    2. Bert Schijf schrijft: “Hij [Jona] heeft het over slechts een steekproef van een (1) papyri uit een populatie die normaal verdeeld zou moeten zijn wat dat ook betekent bij papyri.”

      Ik heb vroeger (eerst bij het natuurkundepracticum tijdens mijn biologiestudie en later bij het bijvak ‘methoden en technieken van het sociaal-wetenschappelijk onderzoek’ tijdens mijn filosofiestudie) wat meettheorie gehad. Dat was meer dan 40 jaar geleden en die kennis is behoorlijk weggezakt, dus de kans dat ik me vergis is groot, maar ik waag het er toch maar op: ik denk dat deze conclusie op een verwarring van meettheorie en steekproeftheorie berust.

      Ik zou denken dat het dateren van een monster op 1900 BP ± 45 jaar niet vergeleken moet worden met het bepalen van de gemiddelde lengte van mannen of vrouwen, maar met het meten van de lengte van één man of vrouw. Jona heeft het zoals ik het lees, niet over het vaststellen van een betrouwbaarheidsinterval op basis van een steekproef van één, maar over een meting met een zekere precisie.

      Als ik na mijn buurman gemeten te hebben constateer dat diens lengte 1.68 m ± 1 cm is, betekent dat dat ik op mijn buurman een procedure toegepast heb waarmee ik iemands lengte met een nauwkeurigheid van 1 cm kan meten en dat de uitkomst daarvan 1.68 m is.

      Die procedure zou bijvoorbeeld iets kunnen zijn als: laat iemand z’n schoenen uittrekken en vraag hem/haar zijn voeten plat op de grond te drukken met de hielen tegen de muur en laat hem/haar vervolgens zijn/haar billen, rug en achterhoofd tegen de muur drukken, terwijl zijn/haar benen zoveel mogelijk gestrekt zijn; leg een plankje dat overal even dik is op zijn/haar hoofd en trek langs de bovenkant van het plankje met potlood een streepje op de muur; meet de afstand tussen het streepje en de vloer met een centimeter; meet de dikte van het plankje met een lineaal; trek de dikte van het plankje af van de afstand tussen vloer en het streepje. De uitkomst is de gemeten lengte van de persoon op wie deze procedure toegepast werd.

      Als een koolstof-14 bepaling resulteert in een datering van 1900 BP ± 45 jaar betekent dit dat er een procedure toegepast is waarmee de ouderdom met een nauwkeurigheid van 45 jaar te bepalen is en die toepassing de utikomst 1900 BP opleverde.

      Om de nauwkeurigheid van een meetprocedure te bepalen kan het soms nodig zijn om een steekproeven te doen.

      In het geval van de lengte gaat het dan echter niet om een steekproef uit een bepaalde *populatie mensen*, maar om een steekproef uit de populatie *metingen met de beschreven methode* die de uitkomst 1.68 m opleveren”. De claim dat iemand 1.68 m ± 1 cm is betekent immers zoiets als ‘het is hoogstwaarschijnlijk dat iemand bij wie de uitkomst van deze meetprocedure 1.68 m is in feite tussen de 1.65 m en 1.70 m lang is.’

      Het is de verdeling van de uitkomst van deze procedure in de populatie *metingen met de beschreven methode die een uitkomst van 1.68 m opleveren” (en niet van de lengte van de mensen in een bepaalde populatie) waarvan aangenomen wordt dat ie normaal-verdeeld is met een gemiddelde van 1.68 m.

      Merk op dat met een procedure waarvan de uitkomsten normaal verdeeld zijn, heel goed de lengte van mensen bepaald kan worden in een populatie waarin die lengte niet normaal verdeeld.

      Net zo bij Carbon-14 datering. Ik heb het nagezocht in de *Encyclopedia of Quarternary Science* (2007). Daar las ik op p. 2918:

      The interpretation of a single measured 14C age and its associated error, is as follows: we assume that the measured 14C age (an age estimate) is a realization of a random Gaussian process with a ‘true but unknown 14C age’ and 􏰀 equal to the quoted error. The best estimate of the true 14C age is the measured 14C age, but the true value is highly (95%) likely to lie in the range: estimated radiocarbon age 􏰂 ± 2 x􏰃 quoted error:

      In iets begrijpelijker Nederlands staat hier: ‘onze C14 meting wijst uit dat dit monster dateert uit 1900 BP ± 45 jaar’ betekent ‘wij hebben een C-14 meting toegepast op dit monster; de uitkomst van de meting is 1900 BP en de procedure die we toepasten is zodanig dat een meting van 1900 BP betekent dat het monster met een waarschijnlijkheid van 95% dateert uit de periode tussen 1990 en 1855 BP’.

        1. Martin

          Het voorbeeld van de Lijkwade van Turijn is Bayesiaans; wat betekent een kans van 68% bij een enkele Lijkwade?

          1. “Het voorbeeld van de Lijkwade van Turijn is Bayesiaans”

            1) Wat in het voorbeeld is Bayesiaans?

            2) Bron?

            “wat betekent een kans van 68% bij een enkele Lijkwade?”

            Zie mijn poging tot uitleg hierboven

            1. Martin

              Er is maar een enkele lijkwade van Turijn. Daar kun je dus geen relatieve frequenties voor hebben. Dat is net als bij het weerbericht: wat is de kans op regen voor morgen? Er is maar een enkele morgen. Dus dat soort beweringen gaat over waarschijnlijkheid, maar niet in de zin van relatieve frequenties, bv dat het in 35% van de morgens zal regenen. Likelihood in de zin van een weddenschap, dus. Zullen wij er voor 1 Euro om wedden dat het morgen in de provincie Utrecht zal regenen? Als ik denk dat de kans op regen groter is dan 50% en jij denkt dat die kans kleiner is dan 50%, dan kunnen we de weddenschap aangaan. Dat heet subjectieve waarschijnlijkheid, wat niet zeer formeel klinkt, maar toch nemen wij zo beslissingen.

              In de jaren 1930 is de statistiek geformaliseerd door Kolmogorov, met distributies waarvan je samples neemt, etc. Alleen is dat niet hoe de wetenschap werkt. De stelling van Bayes is elementaire logica. In de normaalverdeling is mu een parameter, en geen stochastische grootheid. Toch probeert men dan weer een foutinterval voor mu te bepalen, alsof mu een stochastische grootheid is. Het is vaak niet zo wij met een distributie beginnen en daaruit een sample nemen. Het is ook vaak zo dat wij incomplete informatie over iets hebben, dan nemen we een beslissing op de basis van de informatie die wij hebben. Daarom wordt Bayes tegenwoordig vaak gebruikt om alle beschikbare informatie optimaal te gebruiken voor het bereiken van de optimale conclusie.

              Als er een distributie is, zoals bij een pak kaarten, dan levert Bayes dezelfde resultaten op, omdat je dan je a priori waarschijnlijkheden exact kent.

              Maar als je het aantal C14 atomen in een object telt, wat is dan de distributie? Ik heb toch niet 1000 realisaties van hetzelfde object?

              1. Martin

                En ja, als je meerdere metingen aan hetzelfde object (bv elektrische weerstand) doet, bv met ruis, dan kun je een sigma bepalen, maar alleen als de meting gecalibreerd is. Waar komt de mu van de Gaussiaan vandaan?

              2. Martin, het lijkt me niet te lukken mezelf tegenover jouw duidelijk te maken. Ik heb echter de indruk dat we het grotendeels eens zijn. Een laatste poging.

                Er is maar een enkele lijkwade van Turijn. Daar kun je dus geen relatieve frequenties voor hebben.

                Helemaal mee eens. Vandaar dat je de meting volgens mij niet als een steekproef moet zien en er dus geen statistiek te bedrijven valt. De lijkwade heeft geen distributie, geen variantie, geen gemiddelde ouderdom. De datering 1340 is dan ook geen gemiddelde.

                Het is vaak niet zo wij met een distributie beginnen en daaruit een sample nemen

                Precies. Zoals ik herhaaldelijk benadrukt heb, is dat het geval met de ouderdomsbepaling van de lijkwade en andere objecten: de meting is geen steekproef.

                Je kunt echter wel relatieve frequenties hebben m.b.t. tot mogelijke herhalingen van ouderdomsmetingen aan hetzelfde object in dezelfde omstandigheden. Het gaat dan dus niet over de spreiding van de ouderdom, maar over de spreiding in de meting.

                Jij lijkt hierboven te suggereren dat er alleen van een distributie sprake is als die metingen ook werkelijk uitgevoerd zijn. Als je dat inderdaad zo is ben ik het niet met je eens.

                Ik ken het argument voor die stelling (je geeft er in het commentaar waarop ik reageer en eerder ook al versies van): uitspraken over oneindige reeksen van mogelijke uitkomsten zijn niet empirisch te toetsen.

                De conclusie dat we slechts over waarschijnlijkheid in een uiterst subjectieve zin kunnen spreken is echter ook problematisch. Als de kans waarover gesproken wordt louter subjectief is hoe kun je dan wetenschap bedrijven? Je kunt met het weddenschapsmodel bepalen welke waarschijnlijkheid iemand aan een bepaalde uitkomst toekent, maar wat heb je daaraan? Wat zegt dat? Als je de ouderdom laat bepalen ben je niet geïnteresseerd in de weddenschappen die het laboratorium dat de bepaling uitvoert bereid is af te sluiten, maar wil je weten hoe nauwkeurig de meting is. Nog anders gezegd: je wilt weten niet weten welke subjectieve waarschijnlijkheid het laboratorium toekent aan de gemeten waarde, maar je wil een inschatting van de rationele waarschijnlijkheid in het licht van alles wat bekend is over dit soort metingen van de kans dat de gevonden waarde de juiste waarde is.

                Howson en Urbach betogen in hun *Scientific Reasoning: The Bayesian Approach* (1993) (een aanrader!!) dat beide problemen opgelost worden door Von Mises’ frequentistische uitwerking van objectieve waarschijnlijkheid in te bedden in een Bayesiaans framework om uitspraken over objectieve waarschijnlijkheid te evalueren.

                Ik las dit boek kort nadat het verscheen en het heeft mij overtuigd van de waarde van een Bayesiaanse benadering. Ik zie,echter na de studie van dit boek geen enkele reden om onzekerheidsintervallen als iets anders te zien dan de beste schatting van de kans dat de ware ouderdom in dat interval ligt.

                Zoals ik eerder uitgelegd heb kan dat op twee manieren; analytisch en statistisch.

                Dat is net als bij het weerbericht: wat is de kans op regen voor morgen? Er is maar een enkele morgen. Dus dat soort beweringen gaat over waarschijnlijkheid, maar niet in de zin van relatieve frequenties, bv dat het in 35% van de morgens zal regenen.

                De vergelijking met het weerbericht gaat volgens mij net zo min op als de dobbelsteen vergelijking, dit keer omdat het weerbericht een voorspelling is en de ouderdomsbepaling een meting.

                Ik wil er echter wel op wijzen dat de waarschijnlijkheden in de weerberichten wel degelijk relatieve frequenties betreffen: men gaat uit van een bepaald model, waarmee gegeven een bepaalde input (temperatuur op verschillende tijdstippen en plaatsen, windkracht en weet ik niet wat allemaal) het weer voor de volgende dag berekend kan worden. Men laat een computer met als input de situatie vandaag een groot aantal mogelijke uitkomsten voor het weer van morgen bepalen. Die uitkomsten worden verkregen door kleine wijzigingen in de parameters van het model (stel dat de temperatuur iets meer stijgt dan bij de vorige run, wat gebeurt er dan). De kans op regen is dan de frequentie van het aantal keren dat de verwachte uitkomst regen is gedeeld door het totaal aantal uitkomsten.

            2. Martin

              Re je reactie hieronder:

              Het wordt subjectieve waarschijnlijkheid genoemd omdat de a priori waarschijnlijkheden je huidige informatietoestand beschrijven. Die schatting krijgt dan een update door nieuwe data. Zo is het leerproces. Bij een willekeurige dobbelsteen is de a priori waarschijnlijkheid voor een bepaalde uitkomst 1/6. Die kan ik later aanpassen als de empirische statistiek afwijkt van die van een zuivere dobbelsteen.

              Als je bij een enkele meting een sigma veronderstelt dan is dat blijkbaar een standaardwaarde voor dit soort meting, dat zou kunnen. De discussie was vast eenvoudiger geweest als formules waren gebruikt.

    3. Eh nee, de normaalverdeling bij een C14-datering wordt gevormd door een meting van het aantal C14 atomen in een monster, in verhouding tot het aantal C12 atomen. Die meting wordt uitgedrukt in het ‘aantal C14 jaren BP’.
      Maar in wezen gaat het dus om een telling van atomen in een monster: hoeveel heb je er geteld (dat is het gemiddelde) en hoe groot is de kans dat het er in werkelijkheid meer of minder waren (en dat resulteert in een normaalverdeling)
      Het zijn namelijk heul veul C-atomen die je telt: 50.184.500.000.000.000.000.000 atomen in 1 gram, waarvan 50.184.500.000 radioactief (plus of min een foutenmarge uiteraard…) en dan geldt de wet van de grote getallen.

      1. Martin

        De wet van de grote aantallen: als je veel samples neemt van een normale verdeling dan convergeert het gemiddelde naar mu.

        Maar hoe bepaal je dan sigma, als je maar 1 meting hebt? Je hebt alleen een variantie bij meerdere metingen.

        1. Martin

          Ik snap die normaalverdeling bij de C14 datering niet. Als je maar 1 meting doet, dan heb je niets aan de wet van de grote aantallen (niet: getallen). Het feit dat het enige getal groot is doet niet ter zake.

          In het Engelse citaat hierboven staat dat de gemeten waarde een realisatie is van een random Gaussian process. Welk random process? Ik vermoed dat dit weer de verwarring is doordat men een Gaussische verdeling wil hebben om een betrouwbaarheidsinterval te kunnen citeren.

  2. Daniel

    Von Däniken, the guy we all love to hate.
    En dat komt eigenlijk in de eerste plaats doordat hij liegt, hij weet dat hij op talloze plaatsen onzin verkoopt. Dat maakt het nog zoveel erger dan iemand die uit ongeïnformeerdheid onzin verkoopt.
    Hij weet dat de Maya koning zweeft tussen leven en dood met onder hem de levensboom. Maar nee, het moet zo nodig als een astronaut in een raket worden gezien. Dat die “astronaut” geen beschermende kleding aan heeft, maar iets wat nog het meeste lijkt op een kort broekje, is een detail wat we maar moeten negeren.

    Zijn ongelijk is zo vaak bewezen op zoveel vlakken, Occam’s razor is er inmiddels bot van geworden.

    Helaas blijkt zijn gelieg wel een goede bron van inkomsten voor hem. Verandering hoeven we dus niet te verwachten.

    1. FrankB

      “the guy we all love to hate.”
      Helemaal niet. Ik vind Von Däniken vrijwel totaal oninteressant. Hij is gewoon de zoveelste clown die een theorie als omgekeerde piramide opbouwt met als belangrijkste methode het zuigen op zijn dikke duim. Op soortgelijke wijze kun je volhouden dat de Amerikaanse Indianen één van de twaalf verloren stammen uit Israel zijn en de Maja’s hun cultuur van Romeinen hebben overgenomen, die de oceaan zijn overgestoken.
      Ik word juist gefascineerd door Platte Aarde Klanten. Die proberen hun onzin een stevig theoretisch fundament te geven door er Moderne Natuurkunde bij te halen:

      https://theflatearthsociety.org/home/index.php/blog/einsteins-relativity-proves-earth-flat

      De titel lezen is genoeg; de rest is hoogst amusant voor hen die enigszins bekend zijn met Relativiteit.
      En ze verzinnen er experimenten bij, zoals bv. Samuel Rowbotham in de 19e eeuw. Zie ook Mad Mike, die deze week bij een even heroische als hopeloze als klungelige poging om zijn Platte Aarde gelijk te bewijzen het leven liet. Ter zijner ere en nagedachtenis:

      1. Jeroen

        Nou… ik ziet toch echt niet in waarom Von Däniken alles uitzijn duim zou zuigen, maar Flat-Earthers bezig zouden zijn met het zoeken naar een “stevig theoretisch fundament”.

        De manier waarop beide partijen hun verhaal onderbouwen is vrijwel inwisselbaar, volgens mij… waarbij ik eerlijk gezegd “ik zie er een astronaut in” misschien dan nog wel minder belachelijk vind dan “de zon gaat niet onder… nee, dat is perspectief, net zoals een vliegtuig op een gegeven moment verdwijnt” ( ja… dat laatste wordt met droge ogen beweerd..)

        Beide oer-vermakelijk? Ja… en misschien is dat wel de echte vraag; waarom kan ik er minutenlang geamuseerd naar kijken? Leedvermaak?

        1. FrankB

          Het sleutelwoord is “zoeken”.
          Ik beweer niet dat de zoektocht van Platte Aarde Klanten enige kans van slagen heeft; integendeel, precies daarom plaatste ik dat filmpje.
          Von Däniken, net als creationisten en Jezusmythologen, doet nooit enige vergelijkbare moeite. Zij praten alleen maar en herhalen eindeloos dezelfde drogredenen.

          “nee, dat is perspectief, net zoals een vliegtuig op een gegeven moment”
          Met een beetje creativiteit kun je daar nog wel een wiskundig model op los laten ook. Moet je wel eerst Ockham’s Scheermes in de prullenbak gooien, maar dat doen ze evengoed wel.

          “misschien dan nog wel minder belachelijk vind”
          Dat is het fijne van deze blog, u mag vinden wat u wil. Het verandert er niets aan de PAKkers verwijzen naar de Relativiteitstheorie en mallote experimenten bedenken.

          “ik ziet toch echt niet in”
          U zou kunnen proberen beter te kijken, of mij uit te leggen waar Von Däniken iets vergelijkbaars doet.

  3. FrankB

    “dingen niet op voorhand uitsluiten.”
    Oh heerlijk, Teach the Controversy. Dan berijd ik ook mijn stokpaardje: Platte Aarde Theorie op school bij aardrijkskunde en natuurkunde.
    Tenzij dit voorbeeld gebruikt wordt om te laten zien hoe wetenschappelijke conclusies bereikt worden en sommige weer verworpen. Alleen kan dat niet genuanceerd. Fout is fout, weerlegd is weerlegd, flauwekul is flauwekul en kwak is kwak.
    Simpele vuistregel: zet op een rijtje hoeveel beweringen niet bevestigd worden door empirische data. Hoe meer, relatief gesproken, hoe hoger de waarschijnlijkheid dat de dikke duim de grootste informatiebron is geweest. Probeert bovendien de theoreticus zijn/haar aannames te verdoezelen en presenteert alleen welvallige feiten dan kunnen we inderdaad dingen op voorhand uitsluiten.

    “Voor een deel kunnen we cijfermatig onderbouwen waarom ET geen contact met ons opneemt.”
    Je hebt er Drake’s Equation niet voor nodig in het geval van Von Däniken. Eén van zijn impliciete aannames (hij zwijgt er zorgvuldig over) is dat de Antieke Astronauten de problemen rond ruimtereizen zoals opgeworpen door de Relativiteitstheorie hebben omzeild. Kwestietje dikke duim, dus.

  4. Dirk

    @FrankB: het is een detail, maar er zijn maar 10 stammen van Israël waarvan we niet meer weten waar we ze laatst gelegd hebben.

    Ik was laatst op een kwis waarin een vraag werd gesteld over de Nazcalijnen. Quizmaster: “Lange tijd werd aangenomen dat de lijnen door aliens zijn gemaakt.”

  5. Ben Spaans

    Is ‘pseudowetenschapper’ niet wat veel eer voor Von Däniken? Toegewijde autodidact met extreme tunnelvisie beschrijft hem misschien beter.

    Het zogenaamde ‘History Channel’ (History HD, digitaal kanaal 28 bij Ziggo) blijft maar doorgaan met reeksen ‘Ancient Aliens’. (En met jagen op Hitler in Zuid-Amerika, en nu ook weer ‘The Unexplained’ met Captain Kirk).

    1. FrankB

      Sinds wanneer is “pseudowetenschapper” ook maar enigszins een eervolle kwalificatie? In mijn woordenboek is de term veel negatiever dan “toegewijde autodidact” (en ja, ik heb opgemerkt dat uw toevoeging duidelijk maakt dat u evenmin positief over Von Däniken denkt).
      Het Demarcatie Probleem (zie oa Popper) onoplosbaar is en er is geen sluitende definitie van de term pseudowetenschap te geven. Dat komt doordat de overgang van pseudowetenschap naar wetenschap vloeiend is; psychologie is daar een voorbeeld van.
      We kunnen wel enkele kenmerken benoemen. De duidelijkste is misschien wel de dubbele standaard. Pseudowetenschappers zijn extreem sceptisch jegens de theorie die ze willen verwerpen (historische Jezus, evolutietheorie, piramides zijn door mensen gebouwd) maar blazen elke gevonden strohalm op tot gigantische proporties als deze hun “alternatief” lijken te bevestigen (aan synthese, zo normaal in wetenschap, doen ze niet). Dat heeft te maken met de sterke neiging om de eigen theorie te immuniseren voor welke empirische data ook en dus een veel te groot vertrouwen in de kwaliteit van de eigen argumenten dan wetenschapsfilosofisch te rechtvaardigen valt. Dat resulteert in het opstapelen van hulphypotheses, waar JonaL zo vaak op wijst; Ockham’s Scheermes verdwijnt in de prullenbak. Met welk lastig feit de pseudowetenschapper ook wordt geconfronteerd, er is altijd wel een reden te vinden waarom de pseudowetenschappelijke theorie niet verworpen hoeft te worden. Het gevolg daarvan is weer dat pseudowetenschappers onderling geen consensus kunnen bereiken, behalve tav de theorie die ze verwerpen.
      Mij lijkt dat Von Däniken hier met vlag en wimpel aan voldoet. Zijn antwoord op mijn bezwaar betreffende de Relativiteitstheorie kan ik uittekenen.

      Piramides bewijzen de hand van Antieke, Buitenaardse Astronauten en hun superieure wetenschappelijke en technologische kennis. Ze zijn daarom in staat de beperkingen die de Relativiteitstheorie oplegt (die van menselijke afkomst is) te overwinnen. Het feit dat ze dat kunnen bevestigt dat ze de Aarde bezocht hebben.

      Daarmee is zijn pseudotheorie vakkundig geïmmuniseerd. Wel zal hij dit antwoord uitbreiden tot verscheidene pagina’s vol van interessant klinkende terminologie. Hiermee is ook duidelijk waarom wetenschappers niet in het openbaar moeten debatteren met pseudowetenschappers; door de immunisatie en de dubbele standaard kunnen ze het niet winnen, terwijl wetenschappers zelf door hun methode aan handen en voeten gebonden zijn. Ze kunnen veel beter blogstukjes schrijven.
      Maar ik ben een amateur en mag dezelfde vuile trucs uithalen als pseudowetenschappers. Daarmee zal ik hen evenmin overtuigen, maar het is af en toe wel hoogst amusant en meelezende twijfelaars worden misschien beïnvloed.

  6. Eh nee, de normaalverdeling bij een C14-datering wordt gevormd door een meting van het aantal C14 atomen in een monster, in verhouding tot het aantal C12 atomen. Die meting wordt uitgedrukt in het ‘aantal C14 jaren BP’.
    Maar in wezen gaat het dus om een telling van atomen in een monster: hoeveel heb je er geteld (dat is het gemiddelde) en hoe groot is de kans dat het er in werkelijkheid meer of minder waren (en dat resulteert in een normaalverdeling)
    Het zijn namelijk heul veul C-atomen die je telt: 50.184.500.000.000.000.000.000 atomen in 1 gram, waarvan 50.184.500.000 radioactief (plus of min een foutenmarge uiteraard…) en dan geldt de wet van de grote getallen.

  7. Ben Spaans

    Het sarcasme over ‘pseudowetenschapper’ lijkt me duidelijk. Maar EvD heeft zelfs geen enkele formele scholing in welk enigszins hoger onderwijs dan ook. (En kijk hoever je het daarmee nog brengt…😁).

    Ik moet zeggen dat ik mezelf ook steeds meer zie als feiten en gegevens persoon dan als ‘wetenschapper’. Ik bakte vroeger zelf niets van Wiskunde A destijds dus ik kan zelf niets met veel bovenstaande commentaren.

Reacties zijn gesloten.