4.17 - Stratificatie
Stratificeren is het opsplitsen van de populatie in verschillende groepen of lagen (stratum = laag) op basis van criteria die voor het onderzoek relevant zijn. Dit kan alleen wanneer men van tevoren van elk object kan bepalen tot welke groep het behoort. Zo ontstaat een gestratificeerde (gelede) steekproef. De reden om te stratificeren is dat de steekproefuitkomst nauwkeuriger wordt. Of andersom: dat bij gelijke nauwkeurigheid een kleinere steekproef volstaat.
CASUS
De Hypercardhouders zijn geregistreerd op basis van de samenstelling van hun huishouden:
categorie 1 1 persoon (28% van de Hypercardhouders)
categorie 2 meer dan 1 persoon (72% van de Hypercardhouders)
Matini weet dat 1-persoons-huishoudens een heel ander boodschappen-gedrag hebben als meer-persoons-huishoudens. Als Matini een steekproef trekt van 1000 Hypercardhouders, moet hij maar afwach¬ten of inderdaad 28% daarvan in categorie 1 hoort. Als hij stratificeert, vormt hij als het ware twee subpopulaties. Deze zijn voor te stellen als twee ‘kaartenbakken’, voor elke categorie één. Trekt hij vervolgens uit ‘kaartenbak 1’ 28% van 1000 = 280 eenheden, en uit 'kaartenbak 2' de overige 720 eenheden, dan is de steek¬proef in elk geval wat dit betreft representatief.
CASUS
Voor een illustratie van de toegenomen nauwkeurigheid door stratificatie, gaan we uit van een kleine populatie (4 personen) en een nog kleinere steekproef (2 personen), zoals in tabel 4.7.
Tabel 4.7 Gegevens ongestratificeerde en gestratificeerde steekproef Categorie Persoon
(Hyper-
kaart-
houder)Jaar-
bestedingGemiddelde
jaarbesteding
per categorieGem. jaarbest. alle persoen 1
1persoonshuishoudens
28% van populatieA
B€ 300
€ 400350 850 2
meerpersoonshuis-
houdens
72% van populatieC
D€ 900
€ 18001350
Mogelijke uitkomsten van een ongestratificeerde steekproef van 2 personen zijn:
A + B = 300 + 400 = 700 / 2 = 350
A + C = 300 + 900 = 1200 / 2 = 600
A + D = 300 + 1800 = 2100 / 2 = 1050
B + C = 400 + 900 = 1300 / 2 = 650
B + D = 400 + 1800 = 2200 / 2 = 1100
C + D = 900 + 1800 = 2700 / 2 = 1350
De maximale afwijking tussen het gemiddelde in de steekproef en het werkelijke gemiddelde (850) beloopt 500 Euro (check dat zelf). Dat is nogal een onnauwkeurige steekproefuitkomst!
Bij een een gestratificeerde steekproef van 2 personen trekken we 1 proefpersoon uit elke categorie. De mogelijke uitkomsten van de gestratificeerde steekproef zijn dan:
A + C = 300 + 900 = 1200 / 2 = 600
A + D = 300 + 1800 = 2100 / 2 = 1050
B + C = 400 + 900 = 1300 / 2 = 650
B + D = 400 + 1800 = 2200 / 2 = 1100
De maximale afwijking van het werkelijke gemiddelde (850) beloopt nu 250 Euro. Dat is de helft van daarnet! Deze verbetering in nauwkeurigheid is een direct gevolg van het stratificeren op basis van een criterium dat van elk object in het kader bekend was, namelijk aantal personen. Matini kan ook voor 1-persoonshuishoudens andere conclusies trekken dan voor meer-persoons-huishoudens.
Verdeling van de steekproefgrootte over de strata
Als men stratificeert, is de volgende vraag die aan de orde komt: hoe verdelen we de totale steekproefomvang over de verschillende strata? Hierbij heeft men twee mogelijkheden:
- proportionele (gestratificeerde) steekproef;
- disproportionele (gestratificeerde) steekproef.
Bij de proportionele steekproef is de steekproefgrootte per stratum evenredig aan het deel dat ieder stratum uitmaakt van de populatie.
CASUS
Voor het trekken van een proportionele steekproef trekt Matini 28% uit categorie 1 en de resterende 72% uit categorie 2. Zo verkrijgt hij een goede afspiegeling van kleine en grote klanten in de steekproef.
Bij de disproportionele (niet-¬proportionele) steekproef is de steekproefgrootte per stratum niet evenredig aan het deel dat ieder stratum uitmaakt van de totale populatie. Men gebruikt de disproportionele steekproef om twee redenen:
- eenheden in bepaalde strata zijn relatief (op het geheel van de populatie bezien) van weinig betekenis; deze strata blijven ondervertegenwoordigd in de steekproef,
- om ook over kleine groepen voldoende betrouwbare uitspraken te kunnen doen, trekt men uit deze groepen relatief veel objecten.
TIP: Voordat je conclusies over de totale populatie kunt trekken, moet je de steekproefuitkomsten natuurlijk herwegen met de juiste verhoudingen.
CASUS
Voor het trekken van een disproportionele steekproef trekt Matini 50% uit categorie 1 en de resterende 50% uit categorie 2. Hij heeft daarvoor reden 2: hij wil ook over de kleinere groep 1-persoonshuishoudens betrouwbare uitspraken kunnen doen. Voor uitspraken over alle Hypercardhouders telt hij de uitkomsten van categorie 1 voor 28% en van categorie 2 voor 72% mee.
Meer weten over dit onderwerp? Zie:
Er zijn nog geen reacties.Meld je aan met LinkedIn om te reageren