De 4 forskelle mellem pålidelighed og validitet (i videnskab)
Da de på mange sprog har meget ensbetydende betydninger, er det let at forveksle vilkårene for pålidelighed og validitet, når vi taler om videnskab og specielt om psykometri..
Med denne tekst har vi til hensigt at belyse store forskelle mellem pålidelighed og validitet. Forhåbentlig finder du det nyttigt at afklare denne almindelige tvivl.
- Relateret artikel: "Psychometrics: studere det menneskelige sind gennem data"
Hvad er pålidelighed?
I psykometri er begrebet "pålidelighed" refererer til nøjagtigheden af et instrument; Specifikt informerer pålidelighedskoefficienterne om sammenhængen og stabiliteten af de foranstaltninger, der træffes med dette værktøj.
Jo større pålideligheden af et instrument er, jo lavere er mængden af tilfældige og uforudsigelige fejl, som vil blive vist, når den bruges til at måle visse attributter. Pålidelighed udelukker forudsigelige fejl, det vil sige dem, der er underlagt eksperimentel kontrol.
Ifølge den klassiske testteori er pålideligheden den andel af variansen, som forklares af de sande resultater. Således vil den direkte score i en test være sammensat af summen af den tilfældige fejl og den sande score.
De to hovedkomponenter af pålidelighed de er den midlertidige stabilitet og den interne konsistens. Det første koncept indikerer, at scorerne ændrer sig lidt, når de måles ved forskellige lejligheder, mens den interne konsistens refererer til, i hvilken grad de elementer, der udgør testmåling, er den samme psykologiske konstruktion.
Derfor indikerer en høj pålidelighedskoefficient, at score på en prøve svinger lidt internt og som en funktion af tid og i sammendrag instrumentet er fraværende fra målefejl.
- Måske er du interesseret: "Typer af psykologiske tests: deres funktioner og egenskaber"
Definition af gyldighed
Når vi taler om validitet, henviser vi til, om testen korrekt måler konstruktionen, den har til hensigt at måle. Dette begreb er defineret som forhold mellem score opnået i en test og en anden beslægtet foranstaltning; graden af lineær korrelation mellem begge elementer bestemmer validitetskoefficienten.
Også i videnskabelig forskning angiver en høj validitet i hvilken grad resultaterne opnået med et givet instrument eller i en undersøgelse kan generaliseres.
Der er forskellige typer af validitet, som afhænger af, hvordan det beregnes; dette gør det til et udtryk med meget forskellige betydninger. Grundlæggende kan vi skelne mellem indholdsgyldighed, kriterium (eller empirisk) validitet og konstruktiv validitet.
Indholdsvaliditet definerer, i hvilket omfang emnerne i en psykometrisk test er en repræsentativ prøve af de elementer, der udgør konstruktionen, der skal evalueres. Instrumentet skal indeholde alle de grundlæggende aspekter af konstruktionen; For eksempel, hvis vi ønsker at foretage en tilstrækkelig test til måling af depression, skal vi nødvendigvis indeholde elementer, der vurderer sindstilstanden og faldet i glæde..
Kriterie validitet måler instrumentets evne til at forudsige aspekter relateret til egenskaben eller interesseområdet. Endelig er konstruktivgyldigheden beregnet Bestem, om testen måler, hvad du har til hensigt at måle, for eksempel fra konvergensen med de score, der er opnået i lignende tests.
Forskelle mellem pålidelighed og validitet
Selvom disse to psykometriske egenskaber er nært beslægtede, er sandheden at de refererer til klart differentierede aspekter. Lad os se, hvad disse forskelle er.
1. Formålet med analysen
Pålidelighed er en karakteristisk karakter af instrumentet, i den forstand at det måler egenskaberne af de elementer, der omfatter det. På den anden side refererer gyldigheden ikke nøjagtigt til instrumentet, men til generaliseringerne, der er lavet af resultaterne opnået gennem denne.
2. De oplysninger, de giver
Selvom det er en noget forenklet måde at nærme sig på, er det sædvanligvis angivet, at validitet indikerer, at et psykometrisk værktøj rent faktisk måler konstruktionen, som den har til hensigt at måle, mens pålideligheden henviser til, om det måler det korrekt uden fejl.
3. Den måde, hvorpå de beregnes
Tre procedurer anvendes grundlæggende til at måle pålidelighed: metoden for de to halvdele, den ene af parallelle former og test-retest. Den mest anvendte er proceduren i de to halvdele, hvor emnerne er opdelt i to grupper, når testen er besvaret; så analyseres korrelationen mellem de to halvdele.
Metoden for parallelle eller alternative former består i at skabe to tilsvarende test for at måle i hvilket omfang de korrelerer emnerne mellem dem. Test-retest er simpelthen baseret på at bestå testen to gange, under betingelser så ensartede som muligt. Begge procedurer kan kombineres, hvilket giver anledning til test-retest med parallelle former, der består i at forlade et tidsinterval mellem den første form af testen og den anden.
På den anden side er gyldigheden det beregnes på forskellige måder afhængigt af typen, men generelt er alle metoder baseret på sammenligningen mellem scoren i objektivprøven og andre data fra de samme fag i forhold til lignende træk; Målet er, at testen kan fungere som en forudsigelse for egenskaben.
Blandt de metoder, der bruges til at evaluere validiteten, finder vi den factorial analyse og multi-method-multi-trait matrices teknikken. Også indholdsgyldigheden bestemmes ofte af rationelle, ikke-statistiske analyser; for eksempel indbefatter den den tilsyneladende gyldighed, som henviser til eksperternes subjektive vurdering af testens gyldighed.
4. Forholdet mellem begge begreber
Pålideligheden af et psykometrisk instrument påvirker dens gyldighed: Jo mere pålidelig det er, jo større er dets gyldighed. Derfor er validitetskoefficienterne for et værktøj altid lavere end pålidelighedskoefficienterne, og validiteten indirekte informerer os om pålideligheden.