Shared Flashcard Set

Details

Title

Inleiding in statistiek

Description

Inleiding in statistiek

Total Cards

229

Subject

Psychology

Level

Post-Graduate

Created

02/08/2022

Click here to study/print these flashcards.

Create your own flash cards! Sign up here.

Additional Psychology Flashcards

Cards Return to Set Details

Term

Afhankelijke tt-toets

Definition

de afhankelijke tt-toets is een andere naam voor de gepaarde tt-toets.

Term

Afhankelijke variabele, afhankelijke

Definition

de afhankelijke variabele in een onderzoek is een variabele waarvan de onderzoeker verwacht dat deze (deels) wordt bepaald door een onafhankelijke variabele. In experimenteel onderzoek is dit effect causaal; in observationeel onderzoek kan over causaliteit niets gezegd worden. het zou dan net zo goed kunnen dat de afhankelijke variabele de onafhankelijke variabele veroorzaakt, of dat beide veroorzaakt worden door een derde variabele. De termen ‘onafhankelijke variabele’ en ‘afhankelijke variabele’ hebben dus betrekking op de verwachtingen van de onderzoekers, niet noodzakelijk op de opzet van de studie of de conclusies die getrokken kunnen worden. Bij observationeel onderzoek, waarbij dus geen variabele wordt gemanipuleerd, is het onderscheid tussen onafhankelijke en afhankelijke variabelen vrij arbitrair; alle variabelen hebben dan namelijk vaak dezelfde rol in het design van de studie.

Term

Alpha

Definition

in de nulhypothese-significantietoetsing is alpha, oftewel het significantieniveau, de kritieke pp-waarde. Dit betekent dat als de kans op een gegeven uitkomst onder de aanname van de nulhypothese (dat is, de pp-waarde) lager is dan deze alpha, de nulhypothese wordt verworpen. De conventie is om een alpha van .05.05 (oftewel 5%5%) te hanteren, maar onderzoekers kiezen deze zelf voordat ze de studie uitvoeren en zijn vrij om een andere waarde te kiezen als ze dit kunnen onderbouwen.

Term

Analyse

Definition

in de statistiek is een analyse de naam voor een set van één of meer bewerkingen die op één of meer datareeks(en) wordt of worden uitgevoerd met als doel uitspraken over die datareeks(en) te faciliteren. Voorbeelden zijn berekeningen van beschrijvingsmaten (centrummaten, spreidingsmaten en verdelingsmaten), die het mogelijk maken datareeksen efficiënt samen te vatten, en van effectgroottes, die de sterkte van het verband tussen twee (of meer) variabelen samenvatten

Term

Analysescript

Definition

een bestand, meestal in platte tekst, dat een reeks commando’s voor statistische analyses bevat, al dan niet in combinatie met commentaren om deze toe te lichten. Voorbeelden zijn R-scripts voor R en syntax voor SPSS

Term

Anker

Definition

schaaluiteinde: bij een zevenpuntsschaal waarbij de antwoordopties “zeer onprettig”, “onprettig”, “een beetje onprettig”, “neutraal”, “een beetje prettig”, “prettig” en “zeer prettig” zijn, zijn de ankers “zeer onprettig” en “zeer prettig”.

Term

Artikel, artikelen

Definition

een artikel is een rapportage over een wetenschappelijk onderzoek dat wordt gepubliceerd in een wetenschappelijk journal. Artikelen hebben meestal de vier secties inleiding (de onderbouwing van de onderzoeksvragen en/of hypothesen), methode (de informatie die nodig is om de studie te kunnen repliceren), resultaten (een beschrijving van de uitkomsten van de studie) en discussie (de interpretatie van de uitkomsten).

Term

Aselecte steekproef, aselect, aselecte

Definition

een steekproef waarbij elk lid van de populatie evenveel kans maakt om geselecteerd te worden. Een aselecte steekproef wordt ook wel een ‘random’ of ‘willekeurige’ steekproef genoemd. Als een steekproef aselect is, is het mogelijk om te generaliseren van de steekproef naar de populatie. Een aselecte steekproef is een vorm van een probability sample.

Term

Attritie

Definition

attritie is uitval van onderzoekseenheden (meestal deelnemers) tussen de verschillende meetmomenten in een longitudinale studie.

Term

Beschrijvingsmaten

Definition

getallen die kenmerken van een datareeks en dus van een variabele beschrijven: centrummaten, spreidingsmaten en verdelingsmaten.

Term

Betrouwbaarheid, betrouwbaar

Definition

de mate waarin een operationalisatie van een construct bij herhaling dezelfde uitkomsten geeft. Als een meetinstrument elke keer een andere uitkomst geeft, terwijl datgene dat wordt gemeten stabiel blijft, is het een erg onbetrouwbaar meetinstrument. Betrouwbaarheid is het complement van de niet-systematische meetfout. Samen met validiteit bepaalt betrouwbaarheid de kwaliteit van een operationalisatie.

Term

Betrouwbaarheidsinterval, betrouwbaarheidsintervallen

Definition

een interval om een schatter heen dat in een gegeven percentage van de steekproeven de betreffende populatiewaarde bevat. Voor een 95%-betrouwbaarheidsinterval van het gemiddelde bevat dat interval bij 95% van de steekproeven het populatiegemiddelde. Het is belangrijk dit niet te interpreteren als een interval waarbij de kans, dat het populatiegemiddelde er in ligt, 95%95% is! Natuurlijk is dat wel waar over oneindig veel steekproeven heen, maar bij één willekeurige steekproef ligt het populatiegemiddelde of wél, of níét in het interval. Het betrouwbaarheidsinterval is dus beter als volgt te interpreteren: stel dat je een steekproef oneindig vaak zou herhalen, dan zou in 95%95% van de gevallen het populatiegemiddelde in het betrouwbaarheidsinterval vallen. Tegelijkertijd zijn betrouwbaarheidsintervallen uitermate bruikbaar: ze geven een duidelijke indicatie van hoe accuraat de inschatting van een mogelijke schatter is. De breedte van een betrouwbaarheidsinterval hangt van twee dingen af. Ten eerste van de ‘betrouwbaarheid’: een 99%99%-betrouwbaarheidsinterval is breder dan een 95%95%-betrouwbaarheidsinterval. Een puntschatting heeft een betrouwbaarheid van 0%0%. Ten tweede van de standaardfout, die weer afhankelijk is van de nauwkeurigheid van de meting en van de steekproefgrootte.

Term

Bias

Definition

een verstoring, vertekening, bij het meten van een variabele of een proces. Biases komen ook voor in onderzoek; als een variabele gebiased is, is de validiteit aangetast. Stel dat deelnemers in de experimentele conditie verteld wordt dat zij een nieuwe behandeling krijgen, terwijl deelnemers in de controleconditie verteld wordt dat zij de controleconditie zijn. Die informatie kan tot verwachtingen leiden die de onderzoeksresultaten verstoren en dus bias introduceren. Confounders leiden ook tot bias in een studie. Verder lijden mensen zelf aan vertekeningen in de informatieverwerking (wat ook biases zijn), waardoor ze niet goed zijn in introspectie.

Term

Bimodale verdeling, bimodale, bimodaal

Definition

een verdeling met twee toppen (twee ’modi).

Term

Binaire variabele, binaire

Definition

zie dichotome variabele

Term

Bivariate analyse, bivariaat, bivariate

Definition

een analyse waarbij het verband tussen twee variabelen wordt geanalyseerd, zoals de correlatie, Cohen’s dd en de tt-toets, en eenweg-variantieanalyse.

Term

Bivariate correlatie

Definition

de correlatie tussen twee variabelen. Regressieanalyse kan worden opgevat als een multivariate correlatieanalyse, omdat er meer dan twee variabelen bij betrokken zijn. Als er in een regressieanalyse maar één voorspeller is, en dat geldt altijd binnen de cursus Onderzoekspracticum inleiding onderzoek, dan is de gestandaardiseerde regressiecoëfficiënt van die voorspeller altijd gelijk aan de bivariate correlatiecoëfficiënt.

Term

Blinderen, blindering

Definition

blinderen is het afschermen van elementen van een studie voor deelnemers, onderzoekers (proefleiders) of beiden (dat heet dubbel blinderen).

Term

Categorische variabele

Definition

een variabele op het nominale of ordinale meetniveau.

Term

Causale opvatting van validiteit

Definition

opvatting om de validiteit van een test te bepalen, waarbij een test om een bepaald construct te meten als valide wordt gezien als het construct bestaat en als verschillen tussen (of binnen) mensen op het construct tot verschillende uitkomsten op het meetinstrument leiden. Bij deze opvatting van validiteit wordt ervan uitgegaan dat je pas goed kunt nagaan of een meetinstrument valide is, als je weet hoe een meetinstrument werkt, dus als je weet welke processen worden aangesproken die uiteindelijk in een bepaalde testscore resulteren.

Term

Causaliteit, causaal

Definition

causaliteit, oftewel oorzakelijkheid, is de wet van oorzaak en gevolg. In wetenschappelijk onderzoek is men meestal niet alleen geïnteresseerd in de samenhang tussen twee variabelen, maar is het juist interessant om uit te vinden of de ene variabele de andere veroorzaakt. Als de ene variabele de ander veroorzaakt, heet dat een causaal verband. Samenhang tussen twee variabelen (een substantiële correlatie bijvoorbeeld) impliceert niet dat er ook een causaal verband is. Alleen samenhang tussen twee variabelen waarvan er één gemanipuleerd is, kan informatie geven over causaliteit, en dus over de vraag of een variabele een andere variabele beïnvloedt. Met andere woorden: zonder experimenteel design kunnen geen uitspraken gedaan worden over causaliteit.

Term

Centreren

Definition

centreren is een transformatie waarbij van elk datapunt in een datareeks een centrummaat (meestal het gemiddelde, heel soms de mediaan) wordt afgetrokken. Het gemiddelde van de resulterende datareeks is dan gelijk aan 00. Centreren is de eerste stap bij standaardisatie van een variabele.

Term

Centrummaat, centrummaten

Definition

maten die een indicatie geven van de centrale tendentie van een datareeks, oftewel, waar de meeste datapunten in de datareeks zich bevinden. In deze cursus worden het gemiddelde, de mediaan en de modus besproken.

Term

Centrale limietstelling

Definition

het fenomeen dat de steekproevenverdeling van gemiddelden altijd normaal is verdeeld, tenzij de steekproef uitzonderlijk klein is. Met uitzonderlijk klein worden steekproefomvangen bedoeld van dermate weinig onderzoekseenheden (meestal deelnemers) dat de studie underpowered is. Dergelijke studies worden vaak niet goedgekeurd tijdens ethische toetsing.

Term

Cohen’s dd

Definition

Een effectmaat wordt die gebruikt om het verschil tussen twee gemiddelden uit te drukken op een manier die onafhankelijk is van de schaal waarop de afhankelijke variabele gemeten is. Cohen’s dd is gedefinieerd als het verschil tussen twee gemiddelden, gedeeld door de standaarddeviatie. De tentatieve kwalitatieve labels die worden gebruikt om Cohen’s dd waarden te duiden, zijn:

triviaal: tussen −.20−.20 en .20.20

klein / zwak: tussen −.20−.20 en −.50−.50 of tussen .20.20 en .50.50

middelgroot / middelsterk: tussen −.50−.50 en −.80−.80 of tussen .50.50 en .80.80

groot / sterk: tussen −.80−.80 en −1.30−1.30 of tussen .80.80 en 1.301.30

zeer groot / zeer sterk: kleiner dan −1.30−1.30 of groter dan 1.301.30

Term

Confirmatie

Definition

confirmatie is het bevestigen van een hypothese. In de wetenschap kan iets nooit worden bewezen, maar er kan wel sterke evidentie worden gevonden dat een bepaalde hypothese klopt. Dit heet confirmatie. Het omgekeerde is falsificatie.

Term

Confounder, confounders

Definition

een confounder is een verstorende variabele. Als een onderzoeker een uitspraak wil doen over een verband tussen twee variabelen, vooral over een causaal verband, moeten alle confounders zijn uitgeschakeld. Dit kan alleen door middel van een experiment. Als een experimenteel design niet mogelijk is, kan een onderzoeker proberen in kaart te brengen wat mogelijke confounders zijn, en deze meten, zodat ervoor gecorrigeerd kan worden in de analyses. Maar het is niet mogelijk uit te sluiten dat er nog onbekende confounders resteren. Uitspraken over causaliteit vereisen daarom altijd een experimenteel design.

Term

Conditie, condities

Definition

de waarde van een variabele in een manipulatie. Als bijvoorbeeld “blootstelling aan geweld in de media” wordt gemanipuleerd zoals in het klassieke experiment van Bandura met de Bobo-doll, kan die variabele twee waarden hebben: “geen blootstelling” en “wel blootstelling”. Elk van deze waarden correspondeert vervolgens met een conditie in de manipulatie die de operationalisatie van die variabele is.

Term

Construct, constructen

Definition

een construct is een psychologische variabele waarvan de definitie is afgeleid van theorie en waarbij die definitie specificeert wat wel en wat niet tot constructvalidering wordt voor empirische evidentie veelal teruggevallen op correlaties, een maat voor samenhang tussen variabelen en/of items. Constructvalidering bestaat een bepaalde variabele behoort.

Term

Constructvaliditeit

Definition

Opvatting om de validiteit van een test te bepalen waarbij gekeken wordt in hoeverre de interpretaties van de testscores ondersteund worden door theorie en empirisch bewijs voor het gebruik van deze test bij een bepaalde doelgroep. Bij bijvoorbeeld uit het bepalen van de samenhang van items en schalen onderling (bijvoorbeeld of items van de sensation-seekingschaal voldoende met elkaar samenhangen) en samenhang met andere variabelen en uitkomsten (zijn deze relaties zoals verwacht wordt op basis van theorie en eerder onderzoek).

Term

Continu, continue, Continu meetniveau, Continue variabele

Definition

een variabele op het interval of ratio meetniveau.

Term

Controleconditie

Definition

in een experiment is een controleconditie een conditie waarin er geen manipulatie plaatsvindt. De inhoud van de controleconditie wordt daarom zo vastgesteld dat deze gematched is met de experimentele condities, in alle aspecten behalve de te manipuleren onafhankelijke variabele(n).

Term

Convenience sampling

Definition

bij deze vorm van steekproeftrekking worden deelnemers gekozen op basis van een aantal praktische criteria, zoals dat ze gemakkelijk toegankelijk zijn (denk aan het werven van deelnemers binnen je kennissenkring), geografische locatie (denk aan het benaderen van scholen in de buurt zodat leerlingen die je wilt testen niet te ver hoeven te fietsen), de bereidheid van deelnemers zichzelf aan te melden voor onderzoek (denk aan het posten van een oproep op sociale media) etc. Convenience sampling is meestal weinig systematisch. Er wordt meestal niet nagedacht over welke kenmerken de deelnemers uit de steekproef moeten hebben en er wordt niet nagedacht hoe deze steekproef het beste bereikt kan worden. Het verkrijgen van data die representatief is voor de populatie staat niet centraal. Een convenience sample is een vorm van een non-probability sample.

Term

Correlatieanalyse

Definition

de analysetechniek waarmee de correlatiecoëfficiënt wordt berekend.

Term

Correlatie, correlaties, correlatiecoëfficiënt

Definition

een maat voor samenhang tussen twee continue variabelen. Als over correlatie in het algemeen wordt gesproken, wordt meestal Pearson’s correlatie bedoeld, gesymboliseerd door r, en berekend door de covariantie van twee variabelen te delen door het product van hun standaarddeviaties. Omdat de standaarddeviaties afhankelijk zijn van de schaal waarop een variabele is gemeten, wordt de covariantie hierdoor gecorrigeerd voor de schaal waarop beide variabelen zijn gemeten. De correlatie loopt daarom altijd van -1 (een volledig negatief verband) via 0 (volledige onafhankelijkheid) naar 1 (een volledig positief verband). Het kwadraat van de correlatie geeft weer hoeveel procent van elkaars variantie de twee variabelen delen. Een correlatie van .40 correspondeert dus met een middelsterk effect, waarbij de variabelen 16% van elkaars variantie verklaren (.402=.16). De variantie van elke variabele is dan ongeveer zes keer zo groot als de covariantie (de gedeelde variantie). De correlatie is ook een effectmaat met de volgende tentatieve kwalitatieve labels:

Term

Correlatie, correlaties, correlatiecoëfficiënt

Definition

Term

Correlatiematrix

Definition

Een tabel met in de rijen en kolommen variabelen en in de cellen de correlatie tussen die twee variabelen. Correlatiematrices zijn vaak symmetrisch, met dezelfde variabelen in de rijen en de kolommen.

Term

Covariantie

Definition

covariantie is dat deel van de variantie dat een variabele deelt met een andere variabele. De covariantie kan gestandaardiseerd worden door deze te delen door het product van de standaarddeviaties van beide variabelen. Hiermee wordt gecorrigeerd voor de meetschalen van beide variabelen, waardoor de resulterende gestandaardiseerde covariantie te vergelijken is tussen studies. Dit heet de correlatie.

Term

Covariaat, covariaten

Definition

covariaat kan twee betekenissen hebben. Binnen deze cursus wordt vooral de betekenis gebruikt van onafhankelijke variabele in de context van regressieanalyse (de afhankelijke variabele wordt dan vaak het criterium genoemd). Een covariaat kan ook een variabele zijn die wordt meegenomen in een meerweg (multivariate) variantieanalyse om te corrigeren voor een variabele op het continue meetniveau.

Term

Criterium

Definition

binnen de context van regressieanalyse wordt criterium gebruikt om de afhankelijke variabelen aan te duiden. De onafhankelijke variabelen worden dan vaak covariaten genoemd.

Term

Criteriumvaliditeit

Definition

criteriumvaliditeit (Engels: criterion validity) heeft betrekking op de mate waarin de uitkomsten van een meetinstrument samenhangen met die op een ander meetinstrument of uitkomstmaat. Van een intelligentietest wordt bijvoorbeeld verwacht dat deze samenhangt met schoolcijfers. Tegenwoordig worden geen verschillende soorten validiteit meer onderscheiden, hoewel deze termen nog wel voorbijkomen in de literatuur. Validiteit wordt gezien als een unitair construct, waarbij naar verschillende informatie gekeken kan worden om uitspraken te doen over de validiteit van een operationalisatie.

Term

Cross-sectioneel onderzoek, cross-sectioneel design, cross-sectionele opzet, cross-sectioneel

Definition

in een cross-sectionele studie is er maar één meetmoment. Alle data wordt dus min of meer gelijktijdig verzameld, dus in dezelfde sessie, zonder dat er noemenswaardig veel tijd verstrijkt tussen de metingen.

Term

Curvilineair

Definition

als twee variabelen een curvilineair verband vertonen, is de toe- of afname in de ene variabele wel systematisch, maar niet evenredig afhankelijk van de toe- of afname in de andere variabele. Als twee variabelen wel samenhangen, maar geen lineair verband vertonen, is er vaak sprake van een curvilineair verband. Exponentiële verbanden zijn bijvoorbeeld curvilineair.

Term

Data

Definition

een verzameling van één of meer datapunten, meestal getallen, die zijn verzameld bij één of meer onderzoekseenheden, meestal deelnemers.

Term

Datamanagementplan

Definition

in dit plan leggen onderzoekers uit hoe ze de data en metadata in hun onderzoek opslaan en verwerken.

Term

Datapunt, datapunten

Definition

een klein stukje informatie dat volgt uit een meting of manipulatie van een variabele. Dit kan een getal zijn, zoals een score van 6.3 op extraversie of een score van 8.2 op zelfvertrouwen, of een categorie, zoals “blauw” als lievelingskleur. Elke deelnemer in een studie levert meestal minimaal twee, maar vaak veel meer datapunten. Wanneer een operationalisatie (bijvoorbeeld een IQ-test) bij meerdere mensen wordt afgenomen, volgt daaruit voor elke persoon tenminste één datapunt (bijvoorbeeld een IQ-score). Als meerdere mensen worden onderzocht, vormt de reeks van deze datapunten (hier IQ-scores) een datareeks. Deze representeert vaak een variabele. Bij statistische analyses worden datapunten vaak geanalyseerd in een datafile, waarbij deelnemers de rijen bepalen, datareeksen de kolommen (die daarom ook variabelen worden genoemd), en elke cel een datapunt bevat.

Term

Datareeks, datareeksen

Definition

als bij meerdere mensen (of op meerdere momenten) dezelfde operationalisatie wordt afgenomen (bijvoorbeeld een IQ-test), vormt de reeks datapunten die deze operationalisatie oplevert (bijvoorbeeld IQ-scores) een datareeks. Een datareeks is een verzameling van een of meer datapunten van dezelfde operationalisatie.

Term

Deciel, decielen

Definition

de decielen zijn de kwantielen die samen een datareeks in 1010 gelijke delen splitsen. Een deciel is een punt uit een datareeks waar precies een tiental percentages van de datareeks onder valt. Het tweede deciel is die waarde waar 20%20% van de datapunten in een datareeks onder valt. Het vijfde deciel is die waarde waar 50%50% van de datapunten in een datareeks onder valt, oftewel, de mediaan. Zie ook percentielen.

Term

Dichotome variabele (ook wel binaire variabele)

Definition

een dichotome variabele of operationalisatie kan slechts twee mogelijke meetwaarden aannemen. Deze kan daardoor zowel als nominale, ordinale of intervalvariabele worden gezien en kan dus als categorisch of continu worden opgevat. Omdat er maar twee mogelijke waarden zijn, maakt het voor statistische analyses namelijk niet uit hoe deze twee waarden ten opzichte van elkaar worden geordend. Bovendien is er maar één interval tussen de twee waarden. Alle intervallen tussen opeenvolgende meetwaarden zijn dus altijd even groot (want er is maar een interval). Hoewel dichotome variabelen dus erg veelzijdig zijn, hebben ze ook de minste power.

Term

Dichotoom, dichotome

Definition

dichotoom betekent dat iets maar twee waarden aan kan nemen. Het is een synoniem van binair. Zie ook dichotome variabele.

Term

Diptest

Definition

een analyse om te bepalen of de verdeling van een datareeks, en dus een variabele, eentoppig is of multimodaal.

Term

Discrete variabele

Definition

een discrete variabele is een ander woord voor een categorische variabele.

Term

Distribution

Definition

distribution is het Engelse woord voor verdeling.

Term

Doelstelling, doelstellingen

Definition

de doelstelling van een onderzoek betreft het uiteindelijke doel. Het primaire doel van een studie is om de relevante onderzoeksvraag of -vragen te beantwoorden, maar om toestemming te krijgen van de ethische commissie moet die onderzoeksvraag of -vragen ook ergens toe leiden. Iets onderzoeken omdat het nu eenmaal wel grappig lijkt, is namelijk meestal geen verstandige besteding van de schaarse onderzoeksmiddelen. Doelstellingen van onderzoek verschillen soms per veld. Onderwijskwaliteit verbeteren is een algemeen geaccepteerde uiteindelijke doelstelling in de onderwijswetenschappen, productiviteit verhogen in de arbeids- en organisatiepsychologie, en gezondheid en welzijn verhogen in de gezondheids- en klinische psychologie. Doelstellingen zijn meestal specifiekere versies van dit soort uiteindelijke ‘globale doelstellingen’. Uit de doelstelling van een onderzoek volgen een of meer onderzoeksvragen.

Term

Dubbel Blinderen, dubbelblind

Definition

er is sprake van dubbele blindering als zowel de deelnemers als de onderzoekers (proefleiders) niet weten welke condities worden onderzocht, in welke conditie de deelnemers zitten, en/of welke theoretische verwachtingen er zijn over condities. Dubbele blindering is een manier om invloed van verwachtingen te minimaliseren, en het liefst te voorkomen.

Term

Dubieuze onderzoekspraktijken

Definition

er zijn zeer veel dubieuze onderzoekspraktijken mogelijk. Een gemene deler bij dubieuze onderzoekspraktijken is dat de dataverzameling, -analyse of -rapportage (al dan niet bewust) gebaseerd is op het verkrijgen van gewenste resultaten. Het gaat bijvoorbeeld om zaken zoals

·       het selectief rapporteren van variabelen of condities in een studie (bijvoorbeeld alleen de variabelen of condities die het gewenste effect laten zien)

·       flexibiliteit bij de data-analyse: op basis van de uitkomsten van de data-analyse besluiten om wel of niet een extra variabele in de analyse te betrekken of bepaalde afwijkende scores wel of niet in de dataset te laten

·       selectiviteit of flexibiliteit bij het opstellen van de hypotheses: op basis van de uitkomsten van het onderzoek bepaalde* hypotheses* achterwege laten of achteraf aanpassen zodat deze beter aansluiten bij de gevonden resultaten

·       flexibiliteit bij de dataverzameling: op basis van de resultaten besluiten om extra data te verzamelen (omdat voorlopige data-analyse nog niet de gewenste effecten laat zien) of juist eerder stoppen met de dataverzameling (omdat voorlopige data-analyse al het gewenste effect laat zien).

Term

Eentoppige verdeling, eentoppig

Definition

een verdeling met één top.

Term

Eenweg-variantieanalyse

Definition

bivariate variantieanalyse, waarbij het verband tussen twee variabelen wordt onderzocht en er dus maar één onafhankelijke variabele is.

Term

Effect

Definition

een effect is een verband tussen variabelen. Afhankelijk van de context kan de implicatie zijn dat dat verband causaal is of niet. In de context van statistische analyses is een effect van xx op yy simpelweg het verband tussen xx en yy waarbij impliciet is dat xx de onafhankelijke variabele is en yy de afhankelijke variabele. Hierbij wordt dus niet geïmpliceerd dat een eventueel verband (effect) causaal is. Buiten de statistische context wordt met de term ‘effect’ wel vaak een causaal verband bedoeld. Als dan gesteld wordt dat x een effect heeft op yy, dan wordt gesteld dat als xx verandert, daardoor yy ook verandert.

Term

Effectgrootte, effectgroottes

Definition

een getal dat de sterkte van het verband tussen twee variabelen weergeeft. Door middel van een effectmaat zoals Pearson’s rr, Cohen’s dd of ω2ω2 kan de effectgrootte uitgedrukt worden.

Term

Effectmaat

Definition

een maat die de sterkte van het verband tussen twee variabelen, oftewel de effectgrootte, uitdrukt. In deze cursus worden de effectmaten Pearson’s rr, Cohen’s dd en ω2ω2 (omega²) besproken. Bovendien wordt η2η2 (eta²) besproken en afgeraden.

Term

Effectvariantie

Definition

in de context van variantieanalyse is de effectvariantie dat deel van de variantie in de afhankelijke variabele dat wordt verklaard door de factor (de onafhankelijke variabele). De effectvariantie van alle factoren samen wordt wel de modelvariantie genoemd.

Term

Empirische onderzoekscyclus

Definition

de iteratieve opvolging van de volgende fasen in wetenschappelijk onderzoek:

·       de formulering van een onderzoeksvraag

·       het ontwerp van een studie

·       de verzameling van data

·       de analyse van de verzamelde data

de rapportage over dit proces en de uitkomsten Hoewel verzameling van data pas mag starten nadat de onderzoeksvraag en het ontwerp van de studie vastliggen en ethische toetsing van het onderzoek heeft plaatsgevonden, lopen de stadia in de praktijk soms door elkaar. Zo vereist ethische toetsing poweranalyses en worden er dus al analyses uitgevoerd voordat er data zijn verzameld (hoewel die analyses natuurlijk niet worden uitgevoerd op de verzamelde data). Ook moeten onderzoeksvragen vaak bijgesteld worden als blijkt dat het niet mogelijk is om een studie te ontwerpen die de oorspronkelijke onderzoeksvragen kan beantwoorden, of realiseren onderzoekers zich vaak tijdens de rapportage dat ze extra analyses willen draaien.

Term

Error

Definition

de error of ruis in een variabele is alle spreiding (variatie) in een variabele die wordt veroorzaakt door variabelen waar de onderzoeker niet in geïnteresseerd is. Voorbeelden zijn individuele verschillen tussen deelnemers zoals persoonlijkheid, factoren zoals het weer, en meetfouten.

Term

Errorvariantie

Definition

in de context van variantieanalyse is de errorvariantie of residuele variantie dat deel van de variantie in de afhankelijke variabele dat niet wordt verklaard door een factor (een onafhankelijke variabele).

Term

Experiment, experimenten, experimenteel design

Definition

in een experiment wordt de onafhankelijke variabele geoperationaliseerd door middel van een of verschillende manipulatie(s) . Vervolgens worden de onderzoekseenheden (meestal deelnemers) gerandomiseerd in verschillende condities, waarbij in elke conditie andere manipulaties worden toegepast. Hierna wordt de afhankelijke variabele gemeten. Deze opzet maakt het mogelijk om een *causaal** verband* tussen de onafhankelijke variabele en de afhankelijke variabele te onderzoeken.

Term

Externe validiteit

Definition

de mate waarin de uitkomsten van de studie gegeneraliseerd kunnen worden naar de doelpopulatie. Wetenschappelijk onderzoek wordt vaak uitgevoerd in kunstmatige omstandigheden, zoals een laboratorium. Externe validiteit gaat in op de vraag in hoeverre de gevonden patronen ook buiten de onderzochte context gelden. Tegenwoordig worden geen verschillende soorten validiteit meer onderscheiden, hoewel deze termen nog wel voorbijkomen in de literatuur. Validiteit wordt gezien als een unitair construct, waarbij naar verschillende informatie gekeken kan worden om uitspraken te doen over de validiteit van een operationalisatie.

Term

FF, FF-waarde

Definition

de FF-waarde is het quotient van de effectvariantie (MS_effect) en de errorvariantie (MS_error) in de context van variantieanalyse. Deze FF-waarde is verdeeld volgens de FF-verdeling die het mogelijk maakt om voor een gegeven FF-waarde en de beide bijbehorende vrijheidsgraden de pp-waarde uit te rekenen.

Term

FF-verdeling

Definition

De verdeling van de F-waarde, bepaald door beide vrijheidsgraden van de F-waarde. De F-waarde die wordt berekend in een steekproef is per definitie afkomstig uit deze verdeling. Deze steekproevenverdeling kan gebruikt worden om de kans op een gegeven F-waarde te berekenen onder aanname van de nulhypothese (dat is, de pp-waarde). Deze verdeling ziet er als volgt uit.
[image]
Figuur W.2: De FF-verdeling voor drie groepen en 100 deelnemers als er in de populatie geen verband is (grijs), als er een zwak verband is (ω2=.01ω2=.01, rood), als er een middelsterk verband is (ω2=.06ω2=.06, oranje) en als er een sterk verband is (ω2=.14ω2=.14, groen).

Term

Factor, factoren

Definition

een factor is in de context van variantieanalyse een categorische onafhankelijke variabele. In de context van designs is een factor een variabele die in een experiment wordt gemanipuleerd.

Term

Falsificatie, falsifieren

Definition

een theorie wordt (deels) gefalsifieerd als er voldoende bewijs verzameld is dat er waarschijnlijk één of meer hypothesen van de theorie niet kloppen. Een belangrijke eis waaraan wetenschappelijke theorieën moeten voldoen, is dat duidelijk moet zijn hoe ze te falsifiëren zijn. Als niet duidelijk is welke observaties kunnen leiden tot falsificatie van een theorie, kan namelijk nooit geverifieerd worden of de theorie klopt: slechts confirmatie volstaat niet.

Term

Frequenties, frequentie

Definition

frequenties zijn de aantallen datapunten binnen een gegeven meetwaarde (oftewel categorie). Frequenties worden vaak gepresenteerd in frequentietabellen en zijn alleen zinnig voor categorische variabelen.

Term

Frequentietabel, frequentietabellen

Definition

een frequentietabel is een tabel waarin voor elke mogelijke meetwaarde de frequenties staan. Omdat alleen categorische variabelen een beperkt aantal meetwaarden hebben, worden alleen voor categorische variabelen frequentietabellen gegenereerd.

Term

Frequentieverdeling, frequentieverdelingen

Definition

een frequentieverdeling is de combinatie van mogelijke meetwaarden en frequentie per meetwaarde van een variabele. Frequentieverdelingen zijn hoe verdelingen van categorische variabelen zich manifesteren.

Term

Full disclosure

Definition

openheid is in wetenschappelijk onderzoek erg belangrijk. Full disclosure betekent dat onderzoekers bij hun onderzoek alle informatie meepubliceren die nodig is om het onderzoek te kunnen repliceren. Denk aan data en analysescripts voor statistische analyses, zoals R-scripts of SPSS-syntax, om de analyses te kunnen herhalen.

Term

Gemiddelde, gemiddelden

Definition

een centrummaat om een datareeks van continue data te beschrijven, verkregen door alle datapunten op te tellen en het resulterende getal te delen door het aantal datapunten.

Term

Generaliseren, generalisatie, generaliseerbaar, gegeneraliseerd, generaliseert

Definition

het doen van uitspraken over een populatie op basis van onderzoek uitgevoerd in een steekproef. Generalisatie is toegestaan bij aselecte steekproeven, maar wordt moeilijker als een steekproef niet aselect getrokken is.

Term

Gepaarde tt-toets, gepaard

Definition

de gepaarde tt-toets is een tt-toets waarbij twee datareeksen vergeleken worden waarin elke datapunt in de ene datareeks te koppelen is aan precies één datapunt in de andere datareeks. Dit gebeurt als beide datareeksen niet onafhankelijk (maar afhankelijk, of gepaard) zijn, bijvoorbeeld als ze herhaalde metingen betreffen bij dezelfde onderzoekseenheden (zoals dezelfde deelnemers), of als de onderzoekseenheden in de twee datareeksen met elkaar in verband te brengen zijn, bijvoorbeeld als ze uit hetzelfde gezin komen.

Term

Gepoolde

Definition

een gepoolde standaarddeviatie is een gemiddelde standaarddeviatie tussen meerdere steekproeven op een manier waarbij grotere steekproeven ook zwaarder worden gewogen.

Term

Gestandaardiseerd, gestandaardiseerde

Definition

als een datareeks of variabele gestandaardiseerd is, betekent dit dat alle datapunten zijn omgezet in een z-score. Als een regressiecoëfficiënt gestandaardiseerd is, betekent dat dat deze is berekend uit een regressieanalyse waarin eerst alle voorspellers zijn gestandaardiseerd. Als een covariantie gestandaardiseerd is, is het de correlatie. Zie ook standaardiseren.

Term

Gestratificeerde aselecte steekproef

Definition

bij het trekken van een gestratificeerde aselecte steekproef wordt de populatie eerst opgedeeld in een aantal subpopulaties aan de hand van bepaalde kenmerken die relevant zijn voor de onderzoeksvariabele, waarbij wordt bepaald welk aandeel elk van deze subpopulaties hebben in de totale populatie. Daarna wordt uit elke subpopulatie een aselecte steekproef getrokken, waarbij ervoor gezorgd wordt dat de verhouding tussen de subpopulaties in de steekproef gelijk is aan die in de populatie. Een gestratificeerde steekproef wordt ook wel een gelaagde steekproef genoemd. Als een steekproef aselect is, is het mogelijk om te generaliseren van de steekproef naar de populatie. Een aselecte steekproef is een vorm van een probability sample.

Term

Helling, hellingscoëfficiënt

Definition

de hellingscoëfficiënt drukt uit hoe steil een lijn in een grafiek stijgt. De helling is de toename in de variabele op de y-as (meestal, maar niet altijd, de afhankelijke variabele) als de variabele op de x-as met 1 toeneemt. Deze helling kan ook negatief zijn. In dat geval is de toename in de variabele op de y-as dus een afname, oftewel, de variabele op de y-as neemt met een bepaald getal af als de variabele op de x-as met 1 toeneemt. Binnen regressieanalyse geldt dat de regressiecoëfficiënten de hellingscoëfficiënten zijn die corresponderen met de voorspellers, behalve de eerste regressiecoëfficiënt, het intercept.

Term

Homoscedastiteit

Definition

homoscedastiteit wordt gebruikt in de context van variantieanalyse, en geldt als de varianties van alle groepen gelijk zijn. Het antoniem is heteroscedastiteit: de situatie waarin verschillende groepen verschillende spreiding vertonen.

Term

Indicator, indicatoren

Definition

een variabele die rechtstreeks wordt gemeten bij onderzoekseenheden (meestal deelnemers). Operationalisaties van constructen bestaan uit een of meer indicatoren, die dan ook wel stimuli of items worden genoemd. De antwoorden van deelnemers op vragen in een vragenlijst zijn bijvoorbeeld indicatoren. In een meetmodel worden indicatoren weergegeven in rechthoeken.

Term

Indruksvaliditeit

Definition

indruksvaliditeit (Engels: face validity) heeft betrekking op hoe valide een operationalisatie op het eerste gezicht overkomt. Tegenwoordig worden geen verschillende soorten validiteit meer onderscheiden, hoewel deze termen nog wel voorbijkomen in de literatuur. Validiteit wordt gezien als een unitair construct, waarbij naar verschillende informatie gekeken kan worden om uitspraken te doen over de validiteit van een operationalisatie.

Term

Inhoudsvaliditeit

Definition

inhoudsvaliditeit (Engels: content validity) heeft betrekking op de mate waarin de inhoud van een operationalisatie overeenkomt met de inhoud van het te meten of te manipuleren construct.

Term

Intercept

Definition

in de context van regressieanalyse is het intercept de waarde die de afhankelijke variabele heeft als de onafhankelijke variabele de waarde 0 heeft. Het is de eerste term in het regressiemodel: β0 (in de populatie, of als gestandaardiseerde regressiecoëfficiënt), B0 of b0 (als ruwe oftewel ongestandaardiseerde *regressiecoëfficiënt).

Term

Interkwartielafstand (IKA, ook interquartile range, IQR):

Definition

een spreidingsmaat: de afstand tussen het eerste en derde kwartiel.

Term

Interval

Definition

interval kan twee dingen betekenen. Ten eerste is een interval een gebied tussen twee getallen in. Een betrouwbaarheidsinterval is hiervan een voorbeeld. Ten tweede wordt de term gebruik om een meetniveau te beschrijven waarbij het interval tussen twee opeenvolgende meetwaarden altijd even groot is (zie het intervalniveau).

Term

Intervalniveau, intervalvariabele, intervalmeetniveau

Definition

een continu meetniveau waarbij de verschillende meetwaarden niet alleen ten opzichte van elkaar geordend kunnen worden, maar waarbij bovendien geldt dat het interval (de afstand) tussen twee opeenvolgende meetwaarden altijd even groot is. Bijna alle psychologische variabelen hebben het intervalniveau, zoals self-efficacy en need for cognition. Bovendien hebben variabelen op het intervalniveau meer power dan categorische variabelen. In psychologisch en onderwijswetenschappelijk onderzoek worden variabelen daarom bij voorkeur op het intervalniveau geoperationaliseerd.

Term

Kurtosis

Definition

Term

Kurtosis

Definition

de kurtosis van een verdeling is de spitsheid. De normaalverdeling heeft een kurtosis van 0; een platykurte (platte) verdeling heeft een negatieve kurtosis en een leptokurte (spitse) verdeling heeft een positieve kurtosis.

Term

Kwalitatief Onderzoek, kwalitatief:

Definition

onderzoek waarbij rijke kwalitatieve data verzameld en geanalyseerd worden, bijvoorbeeld getranscribeerde interviews. Waar kwantitatief onderzoek vaak als doel heeft relaties tussen variabelen te onderzoeken, heeft kwalitatief onderzoek als doel het perspectief van de deelnemers te inventariseren en begrijpen. Dataverzameling bij kwalitatief onderzoek is minder gestandaardiseerd dan bij kwantitatief onderzoek. De analyse van deze data ligt niet op voorhand vast, maar wordt deels bepaald op basis van wat tijdens de analyse naar voren komt.

Term

Kwantitatief Onderzoek, kwantitatief

Definition

onderzoek waarbij theoretische constructen en andere variabelen door middel van operationalisaties worden gekwantificeerd. Data worden verzameld in een steekproef, waarna statistische analyses gebruikt worden om op basis hiervan uitspraken te doen over de populatie.

Term

Kwantiel, kwantielen

Definition

kwantielen zijn een soort ‘breekpunten’ om een datareeks in gelijke delen te splitsen. De mediaan is een voorbeeld van een kwantiel: de mediaan splitst de datareeks precies in twee even grote delen. Andere bekende kwantielen zijn de drie kwartielen die de dataset precies in vier delen splitsen. Verder worden de negen decielen, die de datareeks is tien delen splitsen, en de 9999 percentielen, die de datareeks in 100100 delen splitsen, vaak gebruikt.

Term

Kwartiel, kwartielen

Definition

zoals de mediaan een datareeks in twee even grote delen splitst, splitsen de drie kwartielen (het eerste kwartiel, het tweede kwartiel en het derde kwartiel) een datareeks in vier even grote delen. De mediaan is dus het tweede kwartiel. De afstand tussen het eerste en derde kwartiel wordt de interkwartielafstand genoemd en is een spreidingsmaat.

Term

Latente variabele

Definition

dit is een variabele in een reflectief meetmodel die niet rechtstreeks wordt gemeten, maar waarvan verondersteld wordt ten grondslag te liggen aan de scores op de indicatoren.

Term

Leptokurt, leptokurte

Definition

als een variabele leptokurt is, heeft die variabele een grotere spitsheid dan de normaalverdeling. Deze spitse verdeling heeft een positieve kurtosis.

Term

Lineair

Definition

als twee variabelen lineair samenhangen, is toe- of afname in de ene variabele evenredig aan toe- of afname in de andere variabele. Als twee variabelen wel samenhangen, maar geen lineair verband vertonen, is er vaak sprake van een curvilineair verband. Exponentiële verbanden zijn bijvoorbeeld curvilineair.

Term

Linksscheef, linksscheve

Definition

een verdeling waarbij de top rechts ligt en de staart links: de meeste datapunten liggen dus boven het gemiddelde. Een linksscheve verdeling heeft een negatieve skewness.

Term

Longitudinaal onderzoek, longitudinaal design, longitudinale opzet, longitudinaal, longitudinale

Definition

in een longitudinale studie zijn meerdere meetmomenten. Er zijn dus meerdere sessies waarin operationalisaties van constructen gemeten worden Het kan ook zijn dat er maar één sessie is met daarin meerdere meetmomenten. Hierbij is er reden om aan te nemen dat de te meten variabele tussen de meetmomenten veranderd is, bijvoorbeeld met een noemenswaardige hoeveelheid tijd of een manipulatie tussen de meetmomenten.

Term

Manipulatie, manipulaties, manipuleren

Definition

een manipulatie is de beïnvloeding van een variabele of construct door de onderzoekers, zodat deze voor verschillende deelnemers verschillende waarden aanneemt. Bij een manipulatie worden deze waardes condities genoemd., Bij een manipulatie zitten de deelnemers dus in verschillende condities. Net als meetinstrumenten zijn manipulaties operationalisaties van variabelen, maar anders dan een meetinstrument levert een manipulatie geen data op. De waarde van de manipulatie wordt wel voor elke deelnemer opgeslagen in de dataset, om aan te geven in welke conditie een deelnemer zat, met andere woorden: welke manipulatie een deelnemer ontvangen heeft.

Term

Matching

Definition

matching is de algemene term voor het streven naar equivalentie van verschillende condities of deelnemers in verschillende condities. In een experiment is het bijvoorbeeld cruciaal dat de condities uitsluitend verschillen op de te manipuleren variabele. Als de condities ook op een andere manier verschillen, kunnen deze verschillen namelijk ook verantwoordelijk zijn voor eventuele verschillen in de afhankelijke variabele. Het zo gelijk mogelijk houden van de condities, behalve op de te manipuleren variabele, heet het matchen van de condities. Bovendien is het bij een experiment belangrijk dat de deelnemers in alle condities gemiddeld genomen hetzelfde zijn. Selectie van deelnemers om dit te bereiken heet ook matching.

Term

Maximum

Definition

de hoogste waarde in een datareeks.

Term

Mediaan

Definition

een centrummaat die simpelweg het middelste datapunt in een datareeks aangeeft. Als er een even aantal datapunten is, is de mediaan het gemiddelde van de middelste twee datapunten. Net als de modus is de mediaan minder gevoelig voor outliers dan het gemiddelde.

Term

Meertoppige verdeling, meertoppig

Definition

zie multimodale verdeling.

Term

Meetfout

Definition

het verschil tussen de werkelijke waarde en de gemeten waarde als gevolg van een verstoring in het meetresultaat. Zie ook systematische en niet-systematische meetfout.

Term

Meetmodel, meetmodellen

Definition

een meetmodel is een grafische weergave van een operationalisatie waarbij de indicatoren weergegeven worden in rechthoeken en het construct in een ovaal. In deze cursus wordt uitgegaan van een reflectief meetmodel waarbij de pijltjes van het construct naar de indicatoren lopen.

Term

Meetinstrument, meetinstrumenten

Definition

Term

Meetniveau, meetniveaus

Definition

het meetniveau van een operationalisatie beschrijft de aard van de data die die operationalisatie oplevert. Er zijn twee hoofdsoorten meetniveaus: categorisch en continu. Categorische operationalisaties kunnen het nominale of het ordinale meetniveau hebben. Continue operationalisaties hebben het interval- of het rationiveau, hoewel het onderscheid tussen die laatste twee bij de toepassing van statistiek niet relevant is. Tot slot zijn er nog dichotome variabelen: deze kunnen slechts twee meetwaarden aannemen. Operationalisaties op het continue meetniveau hebben meer power dan categorische operationalisaties die om deze reden zoveel mogelijk vermeden moeten worden.

Term

Meetschaal, meetschalen

Definition

de meetschaal is de schaalverdeling waarop een variabele wordt gemeten. Bij een liniaal of meetlint kan de meetschaal bijvoorbeeld in millimeters, in centimeters of in meters zijn.

Term

Meetwaarde, meetwaarden

Definition

een waarde die een operationalisatie van een variabele kan aannemen. Voor leeftijd is dit bijvoorbeeld een geheel getal, als leeftijd in gehele jaren wordt gemeten. Voor opgewektheid zou dit een score van 1-7 kunnen zijn, als dit op een 7-puntsschaal wordt gemeten. Voor geslacht is het ‘man’ of ‘vrouw’, als geslacht dichotoom is geoperationaliseerd. Zie ook meetniveau.

Term

Metadata

Definition

data over data, bijvoorbeeld data die aangeven wanneer en hoe data zijn verzameld.

Term

Meting, metingen

Definition

Een meting is de handeling van het meten, oftewel het toepassen van een meetinstrument, dat als doel heeft op consistente wijze een variabele te kwantificeren (te representeren in een datareeks van getallen).

Term

Minimum

Definition

de laagste waarde in een datareeks.

Term

Modaliteit

Definition

het aantal toppen van een verdelingsvorm. Deze kan bijvoorbeeld unimodaal (eentoppig), bimodaal (tweetoppig) of multimodaal (meertoppig) zijn.

Term

Modus, modi

Definition

een centrummaat die simpelweg het meest voorkomende datapunt in een datareeks weergeeft. Net als de mediaan is de modus minder gevoelig voor outliers dan het gemiddelde. Let op: in de context van verdelingsvormen staat modus voor ‘top’ en is het hoogste getal in vergelijking met de omringende getallen.

Term

Multilevel aselecte steekproef

Definition

als de onderzoekseenheden (mogelijke deelnemers) in de populatie in groepen georganiseerd zijn, zoals scholieren in klassen en scholen, wordt vaak een multilevel aselecte steekproef getrokken. Hierbij wordt bijvoorbeeld eerst een aselecte steekproef van scholen getrokken, waarna per school een aselecte steekproef van klassen wordt getrokken. Vervolgens worden alle scholieren uit de geselecteerde klassen onderzocht. Een multilevel steekproef wordt ook wel een clustersteekproef genoemd. Als een steekproef aselect is, is het mogelijk om te generaliseren van de steekproef naar de populatie. Een aselecte steekproef is een vorm van een probability sample.

Term

Multimodale verdeling, multimodaal

Definition

een verdeling met meerdere toppen (‘modi’). Een verdeling met één top is unimodaal, en heeft maar één modus. Let op: een modus in deze betekenis betreft niet de gebruikelijke definitie van modus (de meetwaarde die het meeste voorkomt). In de context van verdelingsvormen staat modus voor ‘top’ en is het hoogste getal in vergelijking met de omringende getallen.

Term

Multipele correlatie

Definition

in de context van regressieanalyse is de multipele correlatie RR, oftewel de correlatie van alle voorspellers samen met de afhankelijke variabele. Bij enkelvoudige regressieanalyse, met maar één voorspeller, is de multipele correlatie gelijk aan de bivariate correlatie. Als er meerdere voorspellers in het regressiemodel zitten (dit valt buiten de stof van Onderzoekspracticum inleiding onderzoek) kan RR berekend worden door het regressiemodel in te vullen voor elke onderzoekseenheid en de resulterende voorspellingen voor de afhankelijke variabele op te slaan. RR is dan gelijk aan de correlatie van die voorspellingen (y^y^) met de geobserveerde waarde van de afhankelijke variabele (yy). Door RR te kwadrateren (R2R2), wordt de proportie verklaarde variantie berekend.

Term

Multiple testing

Definition

als er meer dan één verband wordt geschat, neemt de kans op type 1-fouten toe. Binnen de nulhypothese-significantietoetsing (NHST) worden p-waarden berekend en wordt besloten of variabelen samenhangen op basis van die p-waarden. De kans op minimaal één type 1-fout kan berekend worden met de volgende formule: Pminimaal 1 type 1-fout=1−(1−α)kPminimaal 1 type 1-fout=1−(1−α)k waarbij α staat voor het significantieniveau en k voor het aantal p-waarden dat wordt berekend. Als er dus bijvoorbeeld in een onderzoek 28 p-waarden worden berekend en er wordt het standaard significantieniveau van .05. gehanteerd, dan is de kans op minimaal één type 1-fout gelijk aan 1−(1−.05)²⁸1−(1−.05)²⁸, oftewel 76%. Dit is praktisch een garantie dat er minimaal één fout wordt gemaakt. Om die reden moet in de poweranalyses rekening gehouden worden met het aantal verbanden dat berekend gaat worden om deze negatieve gevolgen van multiple testing tegen te gaan.

Term

Multivariaat, multivariate, Multivariate analyses

Definition

de term multivariate analyses kan voor twee dingen gebruikt worden. Ten eerste wordt de term multivariaat gebruikt voor analyses waar meer dan twee variabelen tegelijk in zitten. Deze betekenis complementeert de termen univariaat, voor analyses waar maar één variabele in zit, en bivariaat, voor analyses waar twee variabelen in zitten. Ten tweede wordt de term multivariate analyse gebruikt voor analyses met meerdere afhankelijke variabelen tegelijk. Deze analyses worden niet in dit curriculum behandeld.

Term

Nameting

Definition

als een design meerdere meetmomenten omvat, wordt het meetmoment na de manipulatie ook wel de nameting genoemd. Het meetmoment voor de manipulatie wordt in dit verband ook wel de voormeting genoemd en eventuele vervolgmetingen follow-upmetingen.

Term

Negatief scheve verdeling

Definition

een verdeling met een negatieve skewness: een linksscheve verdeling.

Term

Niet-systematische meetfout

Definition

de niet-systematische meetfout (Engels: random measurement error) is een vorm van toevallige verstoring van het meetresultaat. Hoe kleiner de niet-systematische meetfout bij het meten van een bepaalde variabele, hoe meer betrouwbaar de betreffende operationalisatie van die variabele is. Zie ook systematische meetfout.

Term

Nominaal, nominale, nominale variabelen

Definition

het nominale meetniveau is een meetniveau waarin de verschillende meetwaarden die een variabele aan kan nemen slechts te onderscheiden zijn met hun naam. Die meetwaarden representeren dan categorieën die niet te ordenen zijn. Voorbeelden zijn woonplaats en geslacht. Het meetniveau van een variabele is een keus van de onderzoeker en wordt vastgelegd in de operationalisatie. Zo kan in psychologisch onderzoek geslacht bijvoorbeeld ook gemeten worden op een ordinaal of zelfs intervalniveau. Variabelen op het nominale meetniveau hebben minder power dan variabelen op het ordinale meetniveau, die weer minder power hebben dan variabelen op het intervalniveau.

Term

Non-probability sample, non-probability sampling

Definition

er zijn verschillende methoden van steekproeftrekking (of ‘sampling methods’) om deelnemers te werven voor onderzoek. De verschillende steekproeven die dit kan opleveren kunnen onderverdeeld worden in probability samples en non-probability samples. Bij een non-probability sample weet je niet wat de kans is dat een bepaald lid van de populatie opgenomen wordt in de steekproef.

Term

Normaalverdeling, normale verdeling, normaal:

Definition

een symmetrische, eentoppige verdeling, waarbij het gemiddelde, de mediaan en de modus allemaal gelijk zijn, en waarvoor geldt dat twee derde van de datapunten binnen één standaarddeviatie van het gemiddelde ligt en 95% binnen twee standaarddeviaties. Voor alle, behalve uitzonderlijk kleine, steekproeven geldt dat de steekproevenverdeling van het gemiddelde normaal verdeeld is. Dit fenomeen heet de centrale limietstelling.

Term

Normaalverdeling, normale verdeling, normaal

Definition

Term

Nulhypothese

Definition

de hypothese, ook wel H0, die in NHST wordt getoetst. Deze betreft bijna altijd de hypothese dat er geen verband is, oftewel dat de effectgrootte gelijk is aan 0. Bijvoorbeeld: de correlatie in de populatie is 0; het verschil tussen twee gemiddelden is 0 in de populatie; de varianties van de drie groepen zijn in de populatie aan elkaar gelijk.

Term

Nulhypothese-significantietoetsing

Definition

vroeger werden in de psychologie en onderwijswetenschappen onderzoeksvragen en hypothesen enkel beantwoord door middel van nulhypothese-significantietoetsing, waarbij dichotome beslissingen worden genomen op basis van p-waarden. Tegenwoordig is bekend dat er meerdere problemen zijn met deze aanpak, waardoor de nadruk is verschoven naar de schatting van effectgroottes.

Term

Omega2 (ω2)

Definition

de effectmaat die het verband aangeeft tussen een categorische variabele, meestal met drie of meer categorieën, en een continue variabele. Deze effectmaat wordt berekend als een variantieanalyse wordt uitgevoerd. Net als R2, de gekwadrateerde multipele correlatie in regressieanalyse, drukt ω2 de proportie verklaarde variantie uit. De volgende tentatieve kwalitatieve labels worden gebruikt om ω2 waarden te duiden:
• triviaal: lager dan .01
• klein / zwak: tussen .01. en .06
• middelgroot / middelsterk: tussen .06 en .14
• groot / sterk: groter dan .14
• zeer groot / zeer sterk: hier is geen richtlijn voor bij ω2

Term

ω2-verdeling (Omega2-verdeling)

Definition

de verdeling van ω2, bepaald door beide vrijheidsgraden van ω2. De ω2-waarde die in een steekproef wordt berekend is per definitie afkomstig uit deze verdeling. Deze steekproevenverdeling kan gebruikt worden om de kans op een gegeven ω2-waarde* te berekenen onder aanname van de nulhypothese (dat is, de p-waarde). Deze verdeling ziet er als volgt uit.

Figuur W.3: De ω2-verdeling voor drie groepen en 100 deelnemers als er geen effect is (grijs), als er een klein effect is (ω2=.01ω2=.01, rood), als er een middelsterk effect is (ω2=.06ω2=.06, oranje) en als er een sterk effect is (ω2=.14ω2=.14, groen).

Term

Onafhankelijke t-toets

Definition

De onafhankelijke t-toets is een t-toets die wordt uitgevoerd op twee datareeksen die niet aan elkaar te koppelen zijn. Dit is bijna altijd het geval, maar soms zijn de datapunten in de ene datareeks te koppelen aan corresponderende datapunten in de andere datareeks, bijvoorbeeld als de twee datareeksen herhaalde metingen betreffen. In dat geval wordt de gepaarde t-toets gebruikt.

Term

Onafhankelijke variabele

Definition

de onafhankelijke variabele in een onderzoek is een variabele waarvan de onderzoeker een effect verwacht op een afhankelijke variabele. In experimenteel onderzoek is dit effect causaal; in observationeel onderzoek kan over causaliteit niets gezegd worden. Het is mogelijk dat de afhankelijke variabele de onafhankelijke variabele veroorzaakt. De termen ‘onafhankelijke variabele’ en ‘afhankelijke variabele’ hebben dus betrekking op de verwachtingen van de onderzoekers, niet noodzakelijk op de opzet van de studie of de conclusies die getrokken kunnen worden.

Term

Onafhankelijkheid, onafhankelijk

Definition

twee variabelen zijn onafhankelijk als ze niet samenhangen.

Term

Onderzoek

Definition

het systematisch verzamelen van data om een of meer onderzoeksvragen te beantwoorden.

Term

Onderzoeksprotocol, onderzoeksprotocollen

Definition

het onderzoeksprotocol is een gedetailleerde beschrijving van de procedures die gevolgd moeten worden in een studie. De protocollen bevatten bijvoorbeeld de letterlijke uitspraken van de proefleider(s) en eventuele andere betrokkenen bij het onderzoek, richtlijnen voor de afstand tussen de ogen van de deelnemers en het beeldscherm en de procedure voor de debriefing waarmee deelnemers na afloop van de studie opgevangen worden en eventueel volledig geïnformeerd worden over de studie.

Term

Onderzoeksvraag, onderzoeksvragen

Definition

een onderzoeksvraag is bijna altijd de vraag naar het verband tussen twee variabelen, bijvoorbeeld hoe sterk extraversie en sociale steun samenhangen. Heel soms betreft een onderzoeksvraag de vraag naar de waarde van een variabele, bijvoorbeeld de gemiddelde mate van extraversie in een populatie.

Term

Onzuiverheid

Definition

in de statistiek worden schatters berekend om met behulp van een steekproef uitspraken te kunnen doen over bepaalde kenmerken van een populatie. Als een schatter bij het nemen van oneindig veel steekproeven en het middelen van deze steekproefschattingen gemiddeld de verwachtingswaarde heeft van de bijbehorende populatiewaarde, is de schatter zuiver. Het gemiddelde in een steekproef is bijvoorbeeld een zuivere schatter van het populatiegemiddelde, omdat als er oneindig veel steekproeven getrokken zouden worden, en alle gemiddelden uit al die steekproeven weer gemiddeld zouden worden, de uitkomst het populatiegemiddelde zou zijn. Een ander voorbeeld is de standaarddeviatie. De standaarddeviatie in de steekproef is een zuivere schatting van de standaarddeviatie in de populatie, omdat als je oneindig veel steekproeven zou trekken en de gevonden standaarddeviaties zou middelen, zou de gemiddelde standaarddeviatie de waarde van de standaarddeviatie in de populatie zijn. Als de standaarddeviatie uitgerekend zou worden zonder Bessel’s correctie en dus door de variatie te delen door n in plaats van door n−1, is die standaarddeviatie een onzuivere schatter. In dat geval is de gemiddelde standaarddeviatie van oneindig veel steekproeven altijd te laag in vergelijking met de standaarddeviatie in de populatie.

Term

Operationalisatie, operationalisaties

Definition

een operationalisatie vormt de vertaling van de definitie van het theoretische construct naar een meetinstrument of manipulatie. Elke operationalisatie heeft een meetniveau. Manipulaties hebben bijna altijd een categorisch meetniveau en meetinstrumenten bijna altijd een continu meetniveau, maar dit hoeft niet noodzakelijkerwijs. Deze meetniveaus worden gekozen door de onderzoeker.

Term

Opzet

Definition

de opzet of het design van een studie betreft de operationalisaties en hoe deze zich tot elkaar verhouden. Een studie kan bijvoorbeeld kwalitatief of kwantitatief zijn; correlationeel of experimenteel; en cross-sectioneel of longitudinaal.

Term

Ordinaal meetniveau, ordinaal, ordinale

Definition

een variabele op het ordinale meetniveau heeft meetwaarden die ten opzichte van elkaar te ordenen zijn (wat niet het geval is voor nominale variabelen), maar waarvoor geldt dat de afstand tussen twee opeenvolgende meetwaarden onbekend of mogelijk ongelijk is (wat niet het geval is voor intervalvariabelen). Omdat de meetwaarden dus alleen geordend kunnen worden, heten deze variabelen ordinale variabelen. Ordinale variabelen hebben meer power dan nominale variabelen, maar (beduidend) minder power dan intervalvariabelen.

Term

Orthogonaal

Definition

orthogonaal is een synoniem van onafhankelijk.

Term

Outlier, outliers

Definition

een outlier (of uitschieter) is een datapunt dat dermate extreem is, dat het vaak een artefact is van de dataverzameling. Bij een reactietijdentaak is een reactietijd van een halve milliseconde bijvoorbeeld dermate laag dat het niet waarschijnlijk is dat deze een reactietijd representeert. Omgekeerd zal een reactietijd van twaalf seconden waarschijnlijk betekenen dat de deelnemer was afgeleid, bijvoorbeeld doordat er op de deur van de onderzoeksruimte werd geklopt. Ook in dat geval representeert dat datapunt geen werkelijke reactietijd. Outliers liggen vaak ver van de rest van de datapunten af en zijn op die manier dus zichtbaar in histogrammen. Tegelijkertijd zijn niet alle datapunten die ver van de rest van de datapunten afliggen noodzakelijkerwijs outliers: sommige deelnemers scoren nu eenmaal hoog of laag. Bij online vragenlijstonderzoek kunnen data bijvoorbeeld niet verkeerd worden ingevoerd en kunnen er dus ook geen artefact van de dataverzameling zijn.

Term

Overschrijdingskans

Definition

overschrijvingskans is een synoniem voor p-waarde.

Term

p-waarde

Definition

de p-waarde is de kans dat een verband wordt gevonden dat minstens zo sterk is als het verband dat in een gegeven steekproef is gevonden, uitgaande van de aanname dat er in de populatie geen verband bestaat – dus onder aanname van de nulhypothese).

Term

Pearson’s r

Definition

deze lineaire correlatiecoëfficiënt, vaak gewoon ‘correlatie’ genoemd, is een effectmaat die het verband tussen twee continue variabelen weergeeft. Een correlatie kan een waarde tussen de −1 en de 1 hebben, waarbij een correlatie van 0 staat voor volledige onafhankelijkheid, en −1 en 1 voor volledige negatieve, respectievelijk positieve, afhankelijkheid/samenhang. De volgende tentatieve kwalitatieve labels worden gebruikt om de correlatie te duiden:
• triviaal: tussen −.10 en .10
• klein / zwak: tussen −.10 en −.30 of tussen .10 en .30
• middelgroot / middelsterk: tussen −.30 en −.50 of tussen .30 en .50
• groot / sterk: tussen −.50 en −.70 of tussen .50 en .70
• zeer groot / zeer sterk: kleiner dan −.70 of groter dan .70

Term

Percentiel, percentielen

Definition

de percentielen zijn de kwantielen die samen een datareeks in 100 gelijke delen splitsen.

Term

Platykurt, playtykurte

Definition

een platykurte variabele heeft een mindere spitsheid dan de normaalverdeling, en is dus relatief afgevlakt. Deze vlakke verdeling heeft een negatieve kurtosis.

Term

Populatie, populaties

Definition

een populatie is een theoretische groep onderzoekseenheden, die gedefinieerd wordt door een aantal kenmerken. Een populatie kan bijvoorbeeld “alle mensen” zijn, maar ook “jongeren in achterstandswijken”, “eenoudergezinnen” of “leraren op middelgrote scholen”. Naast deze korte titel hebben populaties een gedetailleerde beschrijving, waarin precies wordt aangegeven wat “jongeren” zijn (bijvoorbeeld “iedereen tussen de 16 en 20 jaar”) en wat “achterstandswijken” zijn. Populaties zijn geen momentopname, maar omvatten ook onderzoekseenheden in het verleden en de toekomst, zodat de resultaten uit de data nog steeds waarde hebben nadat de dataverzameling is afgerond. Mensen verhuizen en veranderen namelijk voortdurend. De mensen die op dit moment in de groep “jongeren” vallen zijn andere mensen dan die over een week in die groep vallen, onder andere door verjaardagen. Hierdoor worden populaties als oneindig groot gezien.

Term

Populatieverdeling

Definition

de verdeling van een variabele in de populatie. Deze verdeling bepaalt de vorm van de verdeling van steekproefscores, en, samen met de steekproefomvang, de steekproevenverdeling.

Term

Populatiewaarde, populatiewaarden:

Definition

de waarde van een bepaalde maat in de populatie, zoals het populatiegemiddelde of de standaarddeviatie in de populatie. Populatiewaarden zijn altijd onbekend. Tenminste, in elk situatie waarin een steekproef wordt getrokken. Als de populatiewaarde bekend was, was het namelijk niet nodig geweest om een steekproef te trekken.

Term

Power

Definition

de kans om een verband van een gegeven sterkte te detecteren, aangenomen dat dit verband bestaat in de populatie, bij een gegeven onderzoeksdesign, met een gegeven steekproefomvang. Een power van 90% staat gelijk aan een kans van 90% om het gegeven verband te detecteren, aangenomen dat het verband in de populatie bestaat. Om 90% power te bereiken voor een middelsterke Pearson’s r (r =.30) zijn 112 deelnemers nodig. Om 90% power te bereiken voor een middelsterke Cohen’s d (d =.50) zijn 170 deelnemers nodig (twee keer 85). Om 90% power te bereiken voor een middelsterke ω2 zijn 207 deelnemers nodig (drie keer 69). De power is dus afhankelijk van het specifieke design van de studie. Daarnaast geldt dat meer deelnemers nodig zijn om kleine verbanden aan te tonen dan om grotere verbanden aan te tonen.

Term

Poweranalyses

Definition

dit zijn analyses waarmee kan worden uitgerekend hoeveel deelnemers in een studie nodig zijn om een gegeven kans te hebben een verband aan te tonen (dat is, de power). Deze kunnen uitgevoerd worden in R met het package pwr, of met het software programma GPower. Als richtlijn staan hieronder de effectgroottes* en benodigde steekproefomvangen voor kleine en middelsterke effecten en een power van 80% of 90%. Grote of sterke effecten zijn in psychologisch en onderwijswetenschappelijk onderzoek niet realistisch. Als een studie wel dermate sterke effecten vindt, is dat meestal omdat de studie zelf underpowered is (een te kleine steekproef heeft) en betreft het gevonden verband een type 1-fout.
Tabel W.1: Een kleine powertabel voor bivariate analyses. Schattingen voor ω2ω2 zijn gebaseerd op 33 groepen. Zie de studietaken voor uitgebreide tabellen.
EFFECT SIZE KLEIN EFFECT,
POWER = .80 KLEIN EFFECT,
POWER = .90 MIDDELSTERK EFFECT,
POWER = .80 MIDDELSTERK EFFECT,
POWER = .90
Pearson’s r r=.1, n=782 r=.1, n=1046 r=.3, n=85 r=.3, n=112
Cohen’s d d=.2, n=788 d=.2, n=1054 d=.5, n=128 d=.5, n=172
ω2 (omega2) ω2=.01, n=957 ω2=.01, n=1269 ω2=.06, n=156 ω2=.06, n=204
Zoals in de tabel hierboven te zien is, is een richtlijn van minimaal 100 deelnemers aan een studie aan de optimistische kant. Bovendien worden in onderzoek vaak meerdere verbanden geschat en met elk verband dat wordt geschat, neemt de kans op type 1-fouten toe (zie multiple testing). In de praktijk zijn dus honderden deelnemers nodig om met enige zekerheid conclusies te kunnen trekken. Voor studies met tientallen deelnemers, die ook nog eens meerdere p-waarden berekenen, zullen veel van de significante p-waarden type 1-fouten representeren. Tegelijk heeft de studie te weinig power heeft om daadwerkelijk bestaande effecten te detecteren. De kans op type 2-fouten is dus ook aanzienlijk.

Term

Predictor, predictoren

Definition

met de term predictor of voorspeller wordt gebruikelijk naar onafhankelijke variabelen verwezen in de context van regressieanalyse. Het is belangrijk om te beseffen dat deze termen niet impliceren dat er sprake is van een causaal verband. In tegendeel: voor de analyse van data uit experimenten wordt vaak juist variantieanalyse gebruikt, terwijl data uit observationele studies eerder met regressieanalyse worden geanalyseerd.

Term

Probability sample

Definition

er zijn verschillende methoden van steekproeftrekking (of ‘sampling methods’) om deelnemers te werven voor onderzoek. De verschillende steekproeven die dit kan opleveren, kunnen onderverdeeld worden in probability samples en non-probability samples. Bij een probability sample heeft elk lid van de populatie een bepaalde, bekende kans (probability) om opgenomen te worden in de steekproef (sample).

Term

Proportie verklaarde variantie

Definition

de proportie verklaarde variantie is de proportie van de variantie in de afhankelijke variabele die wordt verklaard door de voorspeller(s). Binnen de context van regressieanalyse wordt hiernaar verwezen met R2 (de gekwadrateerde multipele correlatie), binnen de context van variantieanalyse wordt hiernaar verwezen met ω2, en binnen de context van correlatieanalyse wordt hiernaar verwezen met het kwadraat van de bivariate correlatie, r2.

Term

Puntschatting, puntschattingen

Definition

een puntschatting is een schatting van een populatiewaarde die, in tegenstelling tot een betrouwbaarheidsinterval, is uitgedrukt als een enkel getal. Een puntschatting is dus te beschouwen als een 0%-betrouwbaarheidsinterval: een interval waar in 0% van de steekproeven de populatiewaarde in ligt. Omdat puntschattingen zo weinig informatief zijn, is het belangrijk om altijd betrouwbaarheidsintervallen te rapporteren naast, of in plaats van, puntschattingen. Een voorbeeld van een puntschatting is het steekproefgemiddelde.

Term

Purposive sampling

Definition

vorm van non-probability sampling. Bij deze selectieve vorm van steekproeftrekking worden deelnemers weloverwogen geselecteerd op basis van bepaalde kenmerken. Deze vorm van steekproeftrekking wordt vaak bij kwalitatief onderzoek gebruikt.

Term

Q-Q-plot

Definition

een Q-Q-plot is een grafiek waarin de geobserveerde kwantielen in een datareeks op de y-as worden geplot en de theoretische kwantielen die je zou verwachten als de datareeks normaal verdeeld is, op de x-as. Als de verdeling van de datareeks normaal is, liggen alle punten dus op een rechte diagonale lijn. Deze lijn wordt meestal ook getekend in een Q-Q-plot.

Term

Quota sampling

Definition

het idee en de procedure van deze vorm van steekproeftrekking is vergelijkbaar met het trekken van een gestratificeerde aselecte steekproef. Maar er worden nu geen* aselecte steekproeven* getrokken, maar selecte steekproeven door bijvoorbeeld convenience sampling of snowball sampling toe te passen. Quota sampling is een vorm van non-probability sampling.

Term

r-verdeling

Definition

de verdeling van r, de Pearson correlatiecoëfficiënt. De correlatie (r) die wordt berekend in een steekproef is per definitie afkomstig uit deze verdeling. Deze steekproevenverdeling kan gebruikt worden om de kans op een gegeven r te berekenen onder aanname van de nulhypothese (dat is, de p-waarde). Deze verdeling ziet er als volgt uit.

Figuur W.4: De verdeling van Pearson’s r voor n=100 als er in de populatie geen verband is (r=0, grijs), als er een zwak verband is (r=0.10, rood), als er een middelsterk verband is (r=0.30, oranje) en als er een sterk verband is (r=0.50, groen).

Term

R, RR

Definition

statistisch programma (R); of de multipele correlatie in de context van regressieanalyse (RR).

Term

Definition

het kwadraat van de multipele correlatie in regressieanalyse. Dit is de proportie verklaarde variantie.

Term

Randomisatie

Definition

het proces waarmee onderzoekseenheden (meestal deelnemers aan een studie) willekeurig worden verdeeld over twee of meer condities. Als het aantal onderzoekseenheden voldoende groot is, resulteert dit proces in equivalente groepen.

Term

Range

Definition

het verschil tussen het maximum en minimum van een datareeks. De range kan gezien worden als spreidingsmaat, maar deze moet nooit in zijn eentje als spreidingsmaat gebruikt worden omdat eventuele outliers grote invloed hebben op de range. De geobserveerde range is niet altijd hetzelfde als de theoretisch haalbare range. Dat een vraag beantwoord kan worden op een zevenpuntsschaal van 1−7 betekent niet dat er ook daadwerkelijk iemand 1 of 7 antwoordt. De geobserveerde range kan dus kleiner zijn dan de range van het meetinstrument.

Term

Rationiveau, ratiovariabele, ratio:

Definition

een variabele op het rationiveau is een continue variabele waarbij niet alleen, zoals ook voor intervalvariabelen geldt, de afstand tussen verschillende meetwaarden altijd even groot is, maar waarbij bovendien een absoluut nulpunt bestaat, zodat de getallen ook in verhouding tot elkaar betekenis hebben. In de praktijk van de psychologie en onderwijswetenschappen wordt geen onderscheid gemaakt tussen interval- en ratiovariabelen.

Term

Rechtsscheef, rechtsscheve

Definition

een variabele is rechtsscheef verdeeld als de meeste datapunten in de datareeks een relatief lage score hebben. De staart van de verdeling ligt dan aan de rechterkant in een histogram en het zwaartepunt aan de linkerkant. Een rechtsscheve verdeling heeft een positieve skewness.

Term

Reflectief meetmodel

Definition

in een reflectief meetmodel lopen er lijnen van het construct, oftewel de latente variabele, naar de indicatoren. De richting van de pijl is hier belangrijk. Deze richting van construct naar de indicatoren veronderstelt dat het construct (bijvoorbeeld iemands mate van neiging tot nadenken) bepaalt hoe een persoon scoort op de indicatoren (dus bepaalt hoe de vragen op de need-for-cognitionschaal beantwoord worden).

Term

Regressieanalyse

Definition

een statistische analyse waarbij een regressiemodel wordt geschat waarin een of meer predictoren een afhankelijke variabele voorspellen.

Term

Regressiemodel

Definition

het regressiemodel is de verzameling van alle regressiecoëfficiënten in een regressieanalyse. Om voor een gegeven combinatie van waarden van de voorspellers de beste voorspelling van de afhankelijke variabele te krijgen, worden deze waarden in het regressiemodel ingevuld, waardoor die beste voorspelling berekend kan worden.

Term

Regressiecoëfficiënt, regressiecoëfficiënten

Definition

het intercept en de hellingscoëfficiënten van de voorspellers in een regressieanalyse. De hoogte van de regressiecoëfficiënten geeft aan hoeveel de afhankelijke variabele (het criterium) toe- of afneemt als de voorspeller waar de regressiecoëfficiënt bij hoort met 1 toeneemt. Als de regressiecoëfficiënten gestandaardiseerd zijn, betreft dit niet de toename van 1 eenheid op de schaal waarop de voorspeller is gemeten, maar drukt de regressiecoëfficiënt uit hoeveel standaarddeviaties de afhankelijke variabele toeneemt als de betreffende voorspeller met 1 standaarddeviatie toeneemt. Regressiecoëfficiënten kunnen zowel positief als negatief zijn en hun waarde is niet begrensd. Dus ook gestandaardiseerde regressiecoëfficiënten kunnen kleiner zijn dan −1 of groter dan 1.

Term

Representatief, representatieve

Definition

representativiteit van een steekproef betreft de mate waarin de steekproef gegeneraliseerd kan worden naar de populatie. Een voorwaarde voor representativiteit is dat de steekproef aselect uit de populatie gekozen wordt. Als een steekproef niet willekeurig (random) wordt gekozen uit de populatie, hangt de kans dat een onderzoekseenheid in de steekproef belandt af van bepaalde variabelen. Kortom, de steekproef is dan geworven uit een subpopulatie, waarvan niet precies bekend is hoe die subpopulatie zich verhoudt tot de bedoelde populatie. Uitspraken op basis van die steekproef hoeven in dat geval niet op te gaan voor de populatie, maar gelden uitsluitend voor de (onbekende) subpopulatie.

Term

Ruis

Definition

ruis is een andere term voor de error bij de meting van een variabele: alle bronnen van variatie (spreiding) waar de onderzoeker niet in geïnteresseerd is.

Term

Samenhang, samenhangen

Definition

twee variabelen hangen samen als er een verband tussen die twee variabelen bestaat. In dit geval zijn de variabelen niet orthogonaal of onafhankelijk: het is mogelijk om de waarde van de ene variabele te voorspellen uit de waarde van de andere variabele. Een voorbeeld is de samenhang tussen gewicht en lengte: naarmate mensen langer zijn, wegen ze ook meer. Uit gewicht kan dus, met een zekere voorspellingsfout, lengte worden voorspeld en vice versa. Samenhang betekent niet noodzakelijk dat er ook een causaal verband bestaat tussen twee variabelen: correlatie impliceert geen causatie.

Term

Scatterplot, scatterplots

Definition

een scatterplot is een grafiek waarbij het verband tussen twee variabelen wordt verbeeld. De ene variabele, meestal de gehypothetiseerde onafhankelijke variabele, staat op de x-as, en de andere variabele, meestal de gehypothetiseerde afhankelijke variabele, staat op de y-as. Elke onderzoekseenheid (meestal deelnemer) wordt gerepresenteerd door een punt die geplaatst wordt afhankelijk van de waarden van de datapunten van die onderzoekseenheid op de beide variabelen. Als de meeste deelnemers in een studie hoog scoren op beide variabelen, dan liggen de meeste stipjes rechtsboven in de grafiek. Een scatterplot beeldt het verband uit dat wordt uitgedrukt door een correlatie.

Term

Schaal of schaalverdeling

Definition

de schaal waarop een variabele wordt gemeten is een kenmerk van de operationalisatie van dat construct en kan uitgedrukt worden als het verschil tussen de maximaal en minimaal mogelijke meetwaarden die datapunten in die operationalisatie kunnen krijgen. Als optimisme bijvoorbeeld gemeten wordt met een vragenlijst met vier vragen waar mensen een antwoord geven op een schaal van 1 tot 5, en als die vier getallen vervolgens voor elke deelnemer worden gemiddeld om de optimisme score te verkrijgen, dan loopt de schaal van optimisme dus van 1 tot 5. Als de vragen in plaats daarvan opgeteld zouden worden, dan zou de schaal van 4 tot 20 lopen. Een meetinstrument met tien vragen die beantwoordt worden met “nee”, gescoord als 0, of met “ja”, gescoord als 1, heeft een schaal van 0 tot 10.

Term

Schatter, schatters

Definition

een schatter is een getal dat indicatief is voor een bepaalde waarde in een populatie, maar deels op basis van toeval tot stand komt. Alles dat wordt berekend op basis van een steekproef is dus een schatter. Omdat in de wetenschap nooit volledige populaties gemeten kunnen worden, zijn alle waardes die over een dataset berekend kunnen worden dus schatters, zoals gemiddelden, standaarddeviaties, effectgroottes en p-waarden. Elke schatter neemt in elke steekproef willekeurig één waarde aan uit de bijbehorende steekproevenverdeling.

Term

Skewness

Definition

een maat voor de scheefheid van een verdeling. Een symmetrische verdeling heeft een skewness van 0; een linksscheve verdeling heeft een negatieve, en een rechtsscheve verdeling een positieve scheefheid.

Term

Select, selecte, selecte steekproef

Definition

een selecte steekproef is een steekproef die niet willekeurig is gekozen uit de populatie. Of een bepaalde onderzoekseenheid uit de populatie in de (selecte) steekproef belandt, wordt bepaald door een systeem. Op basis van selecte steekproeven kan niet gegeneraliseerd worden naar de populatie. Een voorbeeld van een selecte steekproef is het werven van deelnemers uit de vrienden- en kennissenkring.

Term

Significant, significante

Definition

een effectgrootte (de kwantificatie van een verband) wordt binnen de nulhypothese-significantietoetsing ‘significant’ genoemd als de kans op zo’n extreme effectgrootte, aangenomen dat de nulhypothese waar is, kleiner is dan de gespecificeerde alpha (meestal .05, oftewel 5%). Als een verband ‘significant’ is, wordt gesteld dat er reden is om aan te nemen dat er niet alleen in de steekproef een verband bestaat, maar ook in de populatie. Hoe sterk dat verband vervolgens is, moet nog vastgesteld worden met een betrouwbaarheidsinterval. Er is veel kritiek gekomen op deze manier van redeneren (nulhypothese-significantietoetsing) en daarom is het beter om ook naar betrouwbaarheidsintervallen te kijken.

Term

Snowball sampling

Definition

bij deze vorm van steekproeftrekking wordt nagedacht over de kenmerken die de deelnemers uit de steekproef moeten hebben. ‘Snowballing’ start met een klein aantal weloverwogen gekozen deelnemers, de zogenaamde ‘seeds’. Deze eerste deelnemers wordt vervolgens gevraagd om vrienden en kennissen uit te nodigen die voldoen aan bepaalde eisen. Snowballing vereist dus een plan, zoals nadenken over de kenmerken waaraan deelnemers moeten voldoen, het weloverwogen kiezen van ‘seeds’, in tegenstelling tot convenience sampling. Snowball sampling wordt veel gebruikt bij moeilijk te bereiken groepen, zoals sekswerkers in een land waar sekswerk illegaal is, of gebruikers van illegale middelen. Snowball sampling is een vorm van non-probability sampling.

Term

Spreiding

Definition

de afstand van datapunten in een datareeks tot de centrummaten.

Term

Spreidingsmaat, spreidingsmaten

Definition

een maat die de hoeveelheid spreiding in een reeks datapunten, dus de spreiding van een variabele, representeert. In deze cursus worden de standaarddeviatie, variantie, variatie en interkwartielafstand behandeld.

Term

Staart

Definition

de staart van een verdeling is het meer extreme deel van de verdeling, dus uit de buurt van de centrummaten. Een normale verdeling heeft twee staarten; een linksscheve verdeling heeft de staart links liggen en een rechtsscheve verdeling heeft de staart rechts liggen.

Term

Standaarddeviatie, standaarddeviaties

Definition

de standaarddeviatie is een spreidingsmaat die van een reeks datapunten de gemiddelde afwijking van het gemiddelde uitdrukt. De standaarddeviatie wordt berekend door de wortel te nemen van de variantie en is afhankelijk van de schaal waarop een variabele gemeten wordt. Als bijvoorbeeld lengte gemeten wordt in centimeters is de standaarddeviatie 100 keer groter dan als lengte gemeten wordt in meters). Het delen van datapunten door de bijbehorende standaarddeviatie is daarom een onderdeel van het standaardiseren van een variabele.

Term

Standaarddeviatie, standaarddeviaties

Definition

Term

Standaardfout, standaardfouten:

Definition

de standaarddeviatie van een steekproevenverdeling heet de standaardfout in plaats van de standaarddeviatie. Dit omdat het een indicator is van hoe accuraat de schatter is, waar de steekproevenverdeling de verdeling van is. Als de steekproevenverdeling van een schatter heel breed is en dus een grote standaardfout heeft, is de verdeling niet erg accuraat en is de rol van steekproeffout en meetfout dus groot. Als de standaardfout klein is, is de verdeling smal en de schatter dus accuraat.

Term

Standaardiseren, standaardisatie, standaardisering

Definition

het omzetten van datapunten naar hun corresponderende z-score door van elk datapunt het gemiddelde af te trekken (centreren) en dat verschil vervolgens te delen door de standaarddeviatie. De resulterende datapunten worden ook wel z-scores genoemd en de resulterende datareeks heeft een gemiddelde van 0 en een standaarddeviatie van 1. Als die datareeks normaal verdeeld was, is de datareeks na standaardisatie gelijk aan de standaardnormale verdeling.

Term

Standaardnormale verdeling, standaardnormale

Definition

een normaalverdeling met een gemiddelde van 0 en een standaarddeviatie van 1.

Term

State

Definition

in onderzoek in de psychologie en onderwijswetenschappen worden state-variabelen onderscheiden van trait-variabelen. Dit schijnbare onderscheid representeert in werkelijkheid een dimensie die loopt van volledig stabiel over tijd tot veranderlijk van moment tot moment. Trait-variabelen representeren het stabielere uiteinde van deze dimensie en state-variabelen het meer veranderlijke uiteinde. Humeur is een voorbeeld van een state-variabele, want humeur kan erg veranderlijk zijn van moment tot moment. Persoonlijkheidskenmerken zijn een voorbeeld van trait-variabelen: deze veranderen bijna niet over de tijd.

Term

Statistische analyse

Definition

de toepassing van één of meer berekeningen op data om patronen in kaart te brengen, vaak om te ontdekken hoe aannemelijk het is dat patronen in de steekproef ook bestaan in de populatie, of, in andere woorden, om te schatten hoe sterk variabelen samenhangen in de populatie.

Term

Steekproef, steekproeven

Definition

een selectie van onderzoekseenheden uit een populatie. Bij kwantitatief onderzoek is een steekproef ideaal gezien random oftewel aselect, maar deze kan ook select zijn. Bij kwalitatief onderzoek wordt meestal weloverwogen gekozen voor selecte steekproeven.

Term

Steekproeffout

Definition

omdat populaties gedefinieerd zijn als oneindig groot, kunnen deze uitsluitend onderzocht worden door een steekproef te trekken. De steekproeffout is de ruis of verstoring die geïntroduceerd wordt door het trekken van een steekproef. Om een representatieve steekproef te verkrijgen is het noodzakelijk om de steekproef aselect (volkomen random oftewel willekeurig) uit de populatie te trekken. Dit proces betekent dat de uiteindelijke samenstelling van de steekproef deels tot stand komt door toeval. Dat betekent dat het mogelijk is dat een steekproef toevallig relatief veel mannen bevat, of relatief veel jongeren. Kortom, de steekproef kan op willekeurige variabelen afwijken van de populatie. Deze afwijkingen zijn de steekproeffout. Hoe groter de steekproef, hoe kleiner de steekproeffout, omdat de schatters dan berekend worden over meer datapunten waardoor afwijkingen uitmiddelen.

Term

Steekproefgemiddelde

Definition

de waarde van de schatter voor het populatiegemiddelde in een gegeven steekproef.

Term

Steekproefomvang

Definition

het aantal onderzoekseenheden in een gegeven steekproef. Meestal is de steekproefomvang dus het aantal deelnemers in een studie.

Term

Steekproefwaarde

Definition

de waarde die een schatter aanneemt in een gegeven steekproef. Elke steekproefwaarde is per definitie afkomstig uit de corresponderende steekproevenverdeling.

Term

Steekproevenverdeling, steekproevenverdelingen

Definition

een steekproevenverdeling is de theoretische verdeling waar een schatter uit afkomstig is. De steekproevenverdeling is in te beelden als de verdeling die je zou krijgen als je een steekproef van een gegeven omvang oneindig vaak zou herhalen en steeds de betreffende schatter zou berekenen. Omdat de resulterende verdeling per definitie alle mogelijke waarden bevat die de schatter kan aannemen, kun je zeggen dat als je een willekeurige steekproef neemt van die omvang, de waarde die de schatter in die steekproef aanneemt per definitie uit die steekproevenverdeling komt. De verdelingsvorm van de meeste steekproevenverdelingen is bekend: zo is het gemiddelde verdeeld volgens de t-verdeling. Omdat deze steekproevenverdelingen bekend zijn, kan deze voor een gegeven schatter in een steekproef van een gegeven omvang worden opgesteld, als er tenminste een aanname wordt gedaan over de populatiewaarde waar de schatter bij hoort (bijvoorbeeld het gemiddelde in de populatie of de correlatie in de populatie). Met die steekproevenverdeling kan bijvoorbeeld de kans worden uitgerekend op een gegeven waarde voor de schatter. Als de steekproevenverdeling gebaseerd is op een nulhypothese, is die kans de pp-waarde. Meestal betreft de nulhypothese de aanname dat een effectmaat, zoals r, d of ω2, gelijk is aan 0). Een steekproevenverdeling die gecentreerd is rondom de steekproefwaarde van de schatter wordt gebruikt om betrouwbaarheidsintervallen te berekenen

Term

Super-

Definition

super- is een prefix die gebruikt wordt om aan te geven dat iets ergens boven valt. Een supervariabele is bijvoorbeeld een variabele die uit meerdere kleine variabelen bestaat, zoals een operationalisatie die uit meerdere stimuli en registraties van reacties bestaat.

Term

Systematische meetfout

Definition

de systematische meetfout, ook wel bias genoemd, is een systematische vertekening van het meetresultaat. Vertekeningen van het meetresultaat als gevolg van een niet-valide meetinstrument, vallen onder de systematische meetfout. Zie ook niet-systematische meetfout.

Term

t, t-waarde

Definition

ook wel Student’s t genoemd; de toetsingsgrootheid die gebruikt wordt om de p-waarde van Cohen’s d te berekenen. De t-waarde is verdeeld volgens de t-verdeling.

Term

t-toets

Definition

een toets die gebruikt kan worden binnen de nulhypothese-significantietoetsing om de p-waarde te berekenen voor het verband tussen een dichotome variabele en een continue variabele.

Term

t-verdeling

Definition

een specifieke verdeling; een variatie op de normaalverdeling die rekening houdt met de extra onzekerheid wanneer de data uit een steekproef afkomstig zijn. De t-waarde die berekend wordt in een steekproef is per definitie afkomstig uit deze verdeling. Deze steekproevenverdeling kan gebruikt worden om de kans op een gegeven t te berekenen onder aanname van de nulhypothese. Deze verdeling ziet er als volgt uit.

Figuur W.5: De verdeling van Student’s t als er in de populatie geen verband is (d=0, grijs), als er een zwak verband is (d=0.20, rood), als er een middelsterk verband is (d=0.50, oranje) en als er een sterk verband is (d=0.80, groen).

Term

Trait

Definition

in onderzoek in de psychologie en onderwijswetenschappen worden trait-variabelen onderscheiden van state-variabelen. Dit schijnbare onderscheid representeert in werkelijkheid een dimensie die loopt van volledig stabiel over tijd tot veranderlijk van moment tot moment. Trait-variabelen representeren het stabielere uiteinde van deze dimensie en state-variabelen het meer veranderlijke uiteinde. Humeur is een voorbeeld van een state-variabele, want humeur kan erg veranderlijk zijn van moment tot moment. Persoonlijkheidskenmerken zijn een voorbeeld van trait-variabelen: deze veranderen bijna niet over de tijd.

Term

Transformeren, transformatie

Definition

een transformatie is de toepassing van dezelfde berekening op alle datapunten in een datareeks. Centreren en standaardiseren zijn voorbeelden van transformaties.

Term

Type 1-fout

Definition

de type 1-fout is een concept uit de nulhypothese-significantietoetsing (NHST). De type 1-fout is de kans dat bij toepassing van de NHST-procedure de nulhypothese ten onrechte wordt verworpen. De kans op een type 1-fout bepalen de onderzoekers zelf en is gelijk aan de gehanteerde alpha.

Term

Type 2-fout

Definition

de type 2-fout is een concept uit de nulhypothese-significantietoetsing (NHST). De type 2-fout is de kans dat bij toepassing van de NHST-procedure de nulhypothese ten onrechte niet wordt verworpen, oftewel, dat een studie er niet in slaagt een verband aan te tonen als dat verband in werkelijkheid wel bestaat in de populatie. De kans op een type 2-fout is het complement van de power: samen zijn ze precies 1. De kans op een type 2-fout, en dus de power van een studie, bepalen de onderzoekers zelf door een steekproefomvang te kiezen. Hoe groter de steekproefomvang, hoe groter de power en hoe kleiner de kans op een type 2-fout. Een andere methode om de kans op een type 2-fout te verlagen is zo accuraat mogelijk meten. Net als verhoging van de steekproefomvang resulteert accurate meting in een smallere steekproevenverdeling omdat er minder meetfout is en dus een kleinere standaardfout.

Term

Underpowered

Definition

een studie die underpowered is, heeft een te kleine steekproefomvang, dat wil meestal zeggen te weinig deelnemers, om een verband te kunnen detecteren, aangenomen dat er een verband bestaat in de populatie. Omdat de standaarddeviatie van de steekproevenverdeling (dat is, de standaardfout) afneemt naarmate een steekproef groter is, is de steekproevenverdeling van een underpowered studie zo breed dat betrouwbaarheidsintervallen die berekend worden erg breed zijn. Hierdoor kan op basis van de steekproef bijna niets gezegd worden over mogelijke populatiewaarden – deze zouden van alles kunnen zijn. Hoewel het tegenintuïtief is, is het zo dat de kans om grote effecten te vinden juist relatief groot in een underpowered studie. Dit komt namelijk door die brede steekproevenverdeling: de kans op een effectgrootte die extreem afwijkt van de effectgrootte in de populatie is relatief groot. Vaak stellen onderzoekers dat als ze in een steekproef een groot effect hebben gevonden, ze dus niet underpowered zijn. De redenering is dat als ze voor de dataverzameling poweranalyses uitgevoerd zouden hebben met die grote effectgrootte, er een lage benodigde steekproefomvang uitgekomen zou zijn. Als een effect in de populatie groot is, zijn er namelijk maar weinig datapunten (deelnemers) nodig om die effectgrootte te detecteren. Omdat de kans op extreme waarden voor een effectgrootte juist in underpowered studies groot is, zelfs als de effectgrootte in de populatie 0 is, is deze redenering fout. Het is onmogelijk om conclusies te trekken op basis van een underpowered studie. De uitkomsten zullen van steekproef tot steekproef fors verschillen vanwege die brede steekproevenverdeling en de uitkomsten in een gegeven steekproef zijn dus niet interessant.

Term

Uniforme verdeling, uniforme

Definition

een verdeling waarbij alle mogelijke waarden even vaak voorkomen. Uniforme verdelingen hebben een lage spitsheid (kurtosis), maar zijn wel symmetrisch (dus niet scheef).

Term

Unimodale verdeling, unimodaal, unimodale

Definition

een verdeling met één top (één modus).

Term

Univariate analyse, univariaat, univariate

Definition

een analyse waarbij slechts één variabele betrokken is, zoals de berekening van de beschrijvingsmaten (zoals het gemiddelde, de standaarddeviatie en de scheefheid van een variabele). Naast univariate analyses zijn er ook bivariate en multivariate analyses. Overigens wordt de term univariaat soms ook gebruikt als multivariate analysemethoden worden toegepast maar er toch slechts één voorspeller wordt geanalyseerd. Tot slot hebben de termen univariaat, bivariaat en multivariaat niet alleen betrekking op het aantal voorspellers in de analyse. De term multivariate analyses wordt ook gebruikt voor analyses met meerdere afhankelijke variabelen tegelijk. Dit wordt niet in dit curriculum behandeld.

Term

Validiteit, validity

Definition

een operationalisatie is valide als deze verschillen de daadwerkelijke verschillen, tussen en binnen personen, in een construct reproduceert in de data. Een intelligentietest is dus valide als deze daadwerkelijke intelligentieverschillen tussen personen reproduceert in verschillen in IQ-scores tussen deze mensen. Validiteit is een kenmerk van de toepassing van een operationalisatie (een meetinstrument of een manipulatie) in een gegeven steekproef.

Term

Variabele

Definition

een variabele is iets dat kan variëren. Hierbij wordt enerzijds gedoeld op variabelen in datasets die vaak bestaan uit reeksen datapunten of kolommen in een datafile. Anderzijds wordt gedoeld op theoretische constructen waarvan de definitie is afgeleid uit theorie en waarbij die definitie specificeert wat wel en niet tot een bepaalde variabele behoort. Elke operationalisatie heeft tot doel zo’n theoretische construct te meten (als de operationalisatie een meetinstrument is) of te beïnvloeden (als de operationalisatie een manipulatie is). De mogelijke waarden die toegekend kunnen worden zijn de meetwaarden van de operationalisatie. Zo kan de variabele “geslacht” geoperationaliseerd worden met twee meetwaarden, bijvoorbeeld “man” en “vrouw”. De aard van de mogelijke meetwaarden bepaalt het meetniveau van de operationalisatie.

Term

Variantie

Definition

de variantie oftewel mean squares (wat staat voor mean sum of squares) is een spreidingsmaat die berekend wordt uit de variatie (oftewel de sum of squares) door deze te delen door de bijbehorende vrijheidsgraden.

MS=Σ(x×i−x¯¯¯)2n−1=Σ(x×i−x¯¯¯)2DfMS=Σ(x×i−x¯)2n−1=Σ(x×i−x¯)2Df
De wortel van de variantie is de standaarddeviatie.

Term

Variantieanalyse:

Definition

een analysetechniek om het verband tussen een categorische variabele met meer dan twee mogelijke meetwaarden en een continue variabele te analyseren. Bij variantieanalyse wordt de effectmaat omega2 berekend en wordt de F-verdeling gebruikt om de corresponderende p-waarde te berekenen.

Term

Variatie

Definition

de variatie oftewel sum of squares (SS) is een spreidingsmaat die bestaat uit de optelsom van de gekwadrateerde afwijkingen van alle datapunten van hun gemiddelde.

SS=Σ(xi−x¯¯¯)2SS=Σ(xi−x¯)2
Het nadeel van de variatie is dat deze hoger wordt naarmate er meer datapunten zijn. Om die reden wordt deze meestal door het bijbehorende aantal vrijheidsgraden gedeeld om de variantie te verkrijgen.

Term

Verdeling, verdelingen, verdeeld

Definition

een verdeling is het geheel van datapunten in een datareeks, samengevat door de centrummaten, spreidingsmaten en verdelingsvorm. De verdeling van steekproefscores is indicatief voor de verdeling in een populatie. De centrale limietstelling beschrijft het fenomeen dat steekproevenverdelingen van gemiddelden altijd normaal verdeeld zijn, behalve bij steekproeven die uitzonderlijk klein zijn.

Term

Verdelingsmaten

Definition

getallen die een verdelingsvorm van een datareeks, en dus een variabele, beschrijven. In deze cursus worden de scheefheid, de spitsheid en de modaliteit (vast te stellen via de diptest) besproken.

Term

Verdelingsvorm, verdelingsvormen

Definition

een verdelingsvorm beschrijft de manier waarop de datapunten in een datareeks zich tot elkaar en het gemiddelde verhouden. Als elke mogelijke meetwaarde even vaak voorkomt, wordt gesproken van een uniforme verdeling. Een andere bekende verdeling is de normaalverdeling: een symmetrische unimodale verdeling. Een verdeling kan ook linksscheef of rechtsscheef zijn. De verdeling van steekproefscores is indicatief voor de verdeling in een populatie. De centrale limietstelling beschrijft het fenomeen dat steekproevenverdelingen van gemiddelden altijd normaal zijn verdeeld, behalve bij steekproeven die uitzonderlijk klein zijn.

Term

Verdeling van steekproefscores

Definition

de verdeling van de datareeks van een variabele in een steekproef.

Term

Verwachtingswaarde

Definition

de waarde die een toevalsvariabele (een variabele die z’n waarde door toeval krijgt) aanneemt na oneindig veel herhalingen. Als we 1 euro zouden krijgen voor elke keer dat we ‘kop’ zouden gooien, maar niets zouden krijgen voor elke keer dat we ‘munt’ zouden gooien, dan zou de verwachtingswaarde een halve euro zijn. We gooien namelijk, als we oneindig vaak gooien, de helft van de tijd kop en de helft van de tijd munt.

Term

Verwerpen

Definition

binnen de nulhypothese-significantietoetsing (NHST) wordt de nulhypothese verworpen als de pp-waarde die correspondeert met de betreffende effectgrootte lager is dan het vooraf vastgestelde significantieniveau. Dit betekent dat er geconcludeerd wordt dat de nulhypothese niet klopt, wat meestal betekent dat er wordt aangenomen dat er een verband bestaat in de populatie. Om iets zinnigs te zeggen over dat verband moet er eerst een betrouwbaarheidsinterval berekend worden. Verwerping van de nulhypothese is dus op zichzelf niet interessant of informatief. Het is belangrijk om te beseffen dat binnen een NHST-kader uitsluitend de nulhypothese verworpen zou kunnen worden. Een alternatieve hypothese, bijvoorbeeld dat er wel een verband bestaat, kan nooit worden verworpen, zelfs niet als de pp-waarde veel groter is dan het significantieniveau. Dit komt omdat de alternatieve hypothese niet wordt getoetst.

Term

Voormeting

Definition

als een design meerdere meetmomenten omvat, wordt het meetmoment voor de manipulatie ook wel de voormeting genoemd. Het meetmoment na de manipulatie wordt ook wel de nameting genoemd en eventuele vervolgmetingen follow-upmetingen.

Term

Voorspeller, voorspellers

Definition

de term voorspeller wordt vaak gebruikt als synoniem voor een onafhankelijke variabele, vooral in de context van regressieanalyse. De term voorspeller wordt soms ook iets breder gebruikt, namelijk voor een variabele waaruit een andere variabele voorspeld kan worden. Een afhankelijke variabele kan dus ook een voorspeller zijn van een onafhankelijke variabele. In een studie waarin de onafhankelijke variabele niet gemanipuleerd is, is er geen implicatie dat een voorspeller ook een causaal effect heeft op de afhankelijke variabele.

Term

Vrijheidsgraden

Definition

het aantal vrijheidsgraden van een datareeks is het aantal datapunten - 1 (n−1). Vrijheidsgraden drukken uit hoeveel van de datapunten ‘vrij’ kunnen veranderen zonder het gemiddelde van de datareeks te veranderen. De datareeks 1, 2, 3 en 4 heeft drie vrijheidsgraden, omdat als er drie datapunten worden veranderd, daardoor het vierde datapunt noodzakelijkerwijs vast ligt, omdat het gemiddelde anders zou veranderen. Het gemiddelde van deze datareeks is
x¯¯¯=1+2+3+44=2.5x¯=1+2+3+44=2.5
Stel dat we de eerste drie getallen veranderen. We zetten ze bijvoorbeeld alle drie op 0. De datareeks wordt dan 0, 0, 0 en ? – want dat laatste datapunt moeten we nog kiezen. De vierde observatie moet 10 zijn om het een gemiddelde van 2,5te behouden. Maar als we een ander datapunt kiezen dan 10, verandert ons gemiddelde en verandert onze hele datareeks dus in essentie. De individuele datapunten in een datareeks zijn meestal niet van belang: die variëren sowieso door steekproeffout en meetfout. Het aantal vrijheidsgraden geeft aan hoeveel van deze datapunten we ook echt vrij kunnen veranderen zonder de essentie van de datareeks aan te tasten.

Term

z-score

Definition

een datapunt uitgedrukt in het aantal standaarddeviaties dat dat datapunt van het gemiddelde af ligt. Als een deelnemer bijvoorbeeld een score van 88 heeft op extraversie de gemiddelde extraversie is 55 en de standaarddeviatie is 22, dan is de zz-score van die deelnemer
z=8−52=32=1.5z=8−52=32=1.5
Als een variabele wordt gestandaardiseerd, betekent dit dat elke score wordt omgezet naar de corresponderende z-score.

Term

z-verdeling

Definition

de standaardnormale verdeling.

Term

Zuivere schatter

Definition

een zuivere schatter is een schatter waarvan de verwachtingswaarde gelijk is aan de waarde van de betreffende maat in de populatie. Als een valide meetinstrument wordt gebruikt, is het steekproefgemiddelde bijvoorbeeld een zuivere schatter voor het populatiegemiddelde.

Flashcard Machine - create, study and share online flash cards

Shared Flashcard Set

Details

Additional Psychology Flashcards

Cards Return to Set Details

My Flashcards

Flashcard Library

Browse

About

Help

Mobile