De Wet van Zipf

Als je een taal wilt leren, zou het dan niet het makkelijkst zijn om eerst de honderd meest voorkomende woorden te leren?  Het lijkt logisch, maar daarin kun je je behoorlijk vergissen. Deze woorden hebben namelijk vaak op zich weinig betekenis. In het Nederlands vinden we hier lidwoorden, voorzetsels, voegwoorden (zoals ‘en’), en vormen van het werkwoord ‘zijn’.

De website SUBTLEX heeft de meest gebruikte woorden uit Nederlandse filmondertitels onderzocht. Nu is er een verschil tussen woorden en lemmata. De woorden ‘is’ en ’ben’ zijn beide vormen van het lemma ‘zijn’. Alle vormen van een lemma staan in deze lijst apart opgesomd. Het eerste zelfstandig naamwoord vinden we op plaats 102 en is ‘man’.

Lees verder “De Wet van Zipf”