4.18 - Clustersteekproef
Voor een clustersteekproef (trossteekproef) splitst men het steekproefkader in groepen (clusters). Daarna trekt men een aselecte steekproef uit de clusters. Vervolgens ondervraagt men elk element uit de getrokken clusters (eentrapssteekproef). Of men trekt uit de elementen van elk getrokken cluster weer een aselecte steekproef (tweetrapssteekproef).
Allereerst een speciale toepassing van een eentrapssteekproef: de area steekproef (gebiedssteekproef). Het steekproefkader bestaat uit een kaart van een gebied. Bepaalde deelgebieden (bijv. stadswijken) vormen de willekeurig gekozen clusters. Binnen elk gekozen cluster moet de enquêteur zo veel mogelijk alle adressen afgaan.
Een speciale toepassing van een tweetrapssteekproef is de random-walk-methode (startadressenmethode, random route steekproef).
Uit een kader trekt men huis- of bedrijfsadressen. Deze dienen als startadres voor de enquêteur, die op basis van instructies verder willekeurige adressen gaat bezoeken.
TIP: Geef een enquêteur altijd glasheldere instructies voor alle mogelijke situaties. Het is namelijk van belang voor het onderzoek dat alle elementen op dezelfde wijze worden getrokken. Ook moeten alle metingen op dezelfde wijze worden gedaan. Voor de random-walk-methode luidt de instructie bijvoorbeeld: loop richting het eersthogere nummer, ga de eerste straat links, neem daar het derde huisnummer, of bij weigering / niet thuis etcetera het volgende.
De redenen voor het trekken van een clustersteekproef kunnen zijn:
- het direct trekken van individuele eenheden is niet mogelijk; als de populatie van een onderzoek over examenfraude bijvoorbeeld bestaat uit alle HBO-studenten, is daarvan niet een compleet kader beschikbaar; trekt men eerst een clustersteekproef van alle HBO-instellingen, dan kan men vervolgens de directies van de getrokken HBO's benaderen om hen een steekproef te laten trekken uit hun studentenbestand,
- het direct trekken van individuele eenheden leidt tot hoge onderzoekskosten; voor een voorbeeld: zie onderstaand kader.
CASUS
Ferco Matini wil 500 Hypercardhouders uit een bestand van 255.280 kaarthouders laten interviewen. Hyper beschikt over 400 winkels, elk met zijn eigen verzorgingsgebied. Stel dat hij de 500 klantenkaarthouders aselect uit het bestand trekt. De kans is dan groot dat de interviewer naar (bijna) alle 400 winkels moet om er één, twee of heel misschien meer kaarthouder(s) te ondervragen. Dat wordt een dure en tijdrovende affaire. Daarom trekt Matini eerst uit alle 400 verzorgingsgebieden aselect 20 gebieden. Daarna trekt hij per verzorgingsgebied een cluster van 25 kaarthouders. Ook dit doet hij aselect. Zo verkrijgt hij een clustersteekproef van n = 500 (20 gebieden × 25 kaarthouders).
Meer weten over dit onderwerp? Zie:
Er zijn nog geen reacties.Meld je aan met LinkedIn om te reageren