Resampling |
Top Vorige Volgende |
Resampling betekent dat de oorspronkelijke dataset gebruikt wordt om nieuwe steekproeven te genereren, waarvan de resultaten kunnen worden geanalyseerd. Bootstrap en randomisatie zijn beide voorbeelden van resampling methoden
Bootstrap Bij de bootstrap wordt uit de originele data een steekproef getrokken met teruglegging. De omvang van de steekproef is de omvang van de originele data. In de onderstaande figuur wordt het aantal keer dat een object wordt gekozen getoond door de breedte van de rand. Iedere steekproef levert een nieuw gemiddelde of mediaan.
De bootstrap wordt gebruikt bij bepalen betrouwbaarheidsinterval voor gemiddelde, voor proportie, voor verschil twee gemiddeldes, voor verschil twee proporties, en voor de richtingscoëfficiënt bij regressie. Bootstrap is een heel algemene methode die in veel situaties toepasbaar.
Randomisatie-toets Een toets gaat over een research vraag. En voorbeeld van een type research vraag is: Zijn er echte verschillen tussen twee groepen of kan het verschil verklaard worden door toeval? Het lid zijn van de groep is dan de verklarende variabele. Als de aanname klopt dat het lid zijn van de groep geen invloed heeft op de waargenomen variabele, kan de toewijzing aan de groep random zijn. De randomisatie-toets doet deze random toewijzing een groot aantal keren en op die manier kun je inzicht krijgen in de verwachte afwijking.
Voor veel situaties zijn ook traditionele toetsen zoals de t-toets beschikbaar. Het voordeel van deze resampling methoden is didactisch gezien, dat het niet nodig is om een aantal concepten zoals verdeling uitvoerig te bespreken voordat de begonnen wordt met betrouwbaarheidsinterval en toetsen. De methodes zijn heel robuust .
|