Resampling regressie

Top  Vorige  Volgende

Regressie is een manier om het effect tussen twee variabelen te onderzoeken.

 

De bootstrap dient om een betrouwbaarheidsinterval voor de correlatiecoëfficiënt of de helling te bepalen.

 

In het bovenste gedeelte van het scherm staan de oorspronkelijke steekproef. Zowel een lijst als een dotplot. Op de eerste rij van de lijst staan de namen van de variabelen. Op de volgende regels staan per regel twee getallen. De gegevens in deze lijst kunnen worden gewijzigd door getallen erbij te typen of een ander getallen bestand in de lijst te plakken. Zowel decimale punt als decimale komma zijn toegestaan. Ook is een lijst van voorbeeldbestanden met bijbehorende informatie beschikbaar.

 

 

De bootstrap bestaat uit het vele malen doen van een steekproef uit de oorspronkelijke steekproef met terugleggen. Het middelste scherm laat stap voor stap zien hoe iedere keer weer de steekproef ontstaat uit de originele steekproef.

Om de snelheid van steekproef trekken te regelen wordt het tempotool gebruikt

 

Op het onderste deel van het scherm staat de steekproevenverdeling van de correlatiecoëfficiënt ,helling, verdeling van het voorspelde gemiddelde bij een bepaalde waarde en de voorspelde ywaardes bij een bepaalde x-waarde   . Bij voldoende steekproeven (minimaal 1000) ontstaat een indruk van de mogelijke spreiding van deze grootheden. Met de schuiven kunnen de percentages nauwkeuriger worden afgelezen. Door het aantal steekproeven te vergroten kan het betrouwbaarheidsinterval nauwkeuriger worden bepaald. Het betrouwbaarheidsinterval geeft een interval aan waarin de correlatiecoëfficiënt in de populatie waar de oorspronkelijke steekproef uitgetrokken, ligt, Deze procedure werkt niet altijd, maar in een bepaald percentage van de gevallen.

 

Om een goede schatting te krijgen van het voorspellingsinterval bij een specifieke x-waarde, wordt de voorspelde waarde genomen van de bootstrap-regressie lijn. Voor de afwijking van het gemiddelde wordt getrokken uit de gehele verzameling punten. Dit punt wordt aangegeven door een rode stippellijn in het bovenste scherm. De afwijking van de regressie lijn wordt aangegeven door een stukje dikke rode lijn. Dit zelfde rode stukje wordt ook getekend bij de x-waarde waar met het voorspellingsinterval wil vaststellen.

 

.