Klassisk testteori

Klassisk testteori / Eksperimentel psykologi

En test er a videnskabeligt instrument i det omfang det måler det, den har til hensigt, det vil sige det er gyldigt, og det måler godt, det vil sige det er præcist eller pålideligt. Hvis vi finder et instrument, som vi ikke kan stole på de foranstaltninger, de giver, da de varierer fra tid til anden, når vi måler det samme objekt, så vil vi sige, at det ikke er pålideligt. Et instrument til måling korrekt noget må det være præcist, fordi du ellers måler, hvad du måler, måler det forkert. Derfor er præcis en nødvendig, men ikke tilstrækkelig betingelse. Derudover skal det være gyldigt, det vil sige, hvad det måler præcist, vil være, hvad det er meningen at måle, og intet andet.

Du kan også være interesseret: Item Response Theory - applikationer og test

pålidelighed:

Absolut og relativ pålidelighed: Vi kan løse problemet med pålideligheden af ​​en test på to forskellige måder, selv om de i baggrunden falder sammen.

Pålidelighed som unøjagtigheden af ​​sine målinger: Når et emne reagerer på en test, opnår han en empirisk score, som er påvirket af en fejl. Hvis der ikke var nogen fejl, ville emnet få sin sande score. Prøven er upræcis, fordi den empiriske score ikke stemmer overens med den sande sande score. Denne forskel mellem begge scoringer er prøveudtagningsfejlen, målefejlen. den typisk fejlmåling vil være standardafvigelsen af ​​målefejl. den typisk fejlmåling angiver testets absolutte præcision, da det gør det muligt at estimere forskellen mellem den opnåede mål og den, der ville opnås, hvis der ikke var nogen fejl.

Pålideligheden som målingernes stabilitet: En test vil være mere pålidelig, jo mere konstant eller stabil de resultater, den giver, når den gentages. Jo mere stabile resultaterne er ved to lejligheder, desto større er sammenhængen mellem dem. Denne sammenhæng kaldes pålidelighedskoefficient. Dette udtrykker os, ikke mængden af ​​fejlen, men sammenhængen af ​​testen med sig selv og konstancen af ​​de oplysninger, den tilbyder. den pålidelighedskoefficient udtrykker den relative pålidelighed af testen.

Pålidelighedskoefficienten og pålidelighedsindekset: - Pålidelighedskoefficienten af en test er testens korrelation med sig selv, opnået fx i to parallelle former: rxx. - Præcisionsindekset er sammenhængen mellem den empiriske score af en test og dens sande score: rxv Præcisionsindekset vil altid være større end pålidelighedskoefficienten. For at finde ud af pålidelighedskoefficienten er disse tre klassiske metoder værd at fremhæve:

  • Find sammenhængen mellem testen og dens gentagelse: Metoden til gentagelse eller test-retest-metode: Det består i at anvende samme test til samme gruppe ved to lejligheder, og korrelationen mellem de to seriens serier beregnes. Denne sammenhæng er pålidelighedskoefficienten. Denne metode giver normalt en højere pålidelighedskoefficient end dem, der opnås ved andre procedurer, og kan være forurenet af forstyrrende faktorer.
  • Find sammenhængen mellem to parallelle former for testen: Metoden for parallelle former: Forbered to parallelle former af samme test, dvs. to tilsvarende former, der giver de samme oplysninger og gælder for samme gruppe af emner. Sammenhængen mellem de to former er pålidelighedskoefficienten. Ved denne metode undgås forstyrrende kilder til re-test-pålidelighed ved ikke at gentage den samme test.
  • Find sammenhængen mellem to parallelle halvdele af testen: Metoden for de to halvdele: Prøven er opdelt i to ækvivalente halvdele, og korrelationen mellem dem er fundet. Det er den foretrukne metode, da det er enkelt og ignorerer begrænsningerne i de tidligere procedurer. Du kan vælge de ulige elementer af testen, for at udgøre en halv, og de lige elementer til at udgøre den anden.

Pålidelighedskoefficienten og sammenhængen mellem parallelprøver

den pålidelighedskoefficient af en test angiver den andel, som den ægte varians er af den empiriske varians: gráfico33 Pålidelighedskoefficienten for en test varierer mellem 0 og 1. For eksempel: hvis sammenhængen mellem to parallelle tests er rxx´ = 0,80 betyder, at 80% af testens varians skyldes den reelle mål, og resten, det vil sige, at 20% af testens varians skyldes fejlen. den pålidelighedsindeks af en test er sammenhængen mellem dens empiriske score og dens sande score pålidelighedsindeks = Pålidelighedsindekset er lig med kvadratroden af ​​pålidelighedskoefficienten

Når to parallelle former for en test er blevet udviklet, anvendes variansanalyseproceduren for at kontrollere homogeniteten af ​​afvigelserne og forskellen mellem foranstaltningerne. Hvis variationerne er homogene, er forskellen mellem midlerne ikke signifikant, og de to former er konstrueret med samme antal elementer af samme type og psykologisk indhold, det kan siges at de er parallelle. Hvis ikke, skal du reformere dem, indtil de er. Manglen på pålidelighed er identificeret med rxx værdien´= 0 4.- Den typiske fejlmåling: Forskellen mellem den empiriske og den reelle score er den tilfældige fejl, kaldet målefejl. Standardafvigelsen for målefejlne kaldes den typiske målefejl. den typisk fejlmåling giver mulighed for at foretage skøn over testets absolutte pålidelighed, det vil sige at estimere, hvor meget målefejl påvirker en score.

Pålidelighed og længde: Testens længde refererer til antallet af dets elementer. Pålidelighed afhænger af denne længde. Hvis en prøve består af tre elementer, kan et emne en gang få en score på 1 og i en anden eller på en parallel måde en score på

Fra en lejlighed til en anden har scoret varieret med et punkt; et punkt over tre er en variation på 33%, en høj variation. Hvis emnerne opnår tilfældige variationer af denne type, vil korrelationen af ​​testen med sig selv eller med de to parallelle former af testen blive reduceret kraftigt og kan ikke være høj. Hvis testen er meget længere, hvis du for eksempel har 100 emner, kan et emne få 70 point ved en lejlighed og 67 på et parallelt grundlag. Fra den ene til den anden har den ændret 3 point; Det er en forholdsvis lille varians i forhold til den samlede test, specielt 3%. Disse små uformelle ændringer af denne størrelsesorden, som forekommer i fagets score, når de går fra en form til parallellen, er relativt ubetydelige og vil ikke mindske så meget som før sammenhængen mellem begge.

Pålidelighedskoefficienten vil være meget højere end i det foregående tilfælde. Spearman-Brown-ligningen udtrykker forholdet mellem pålidelighed og længde. Præcisionen af ​​en test er nul, når længden er 0, og den øges, når længden øges. Selvom stigningen er relativt mindre, da længden af ​​hvilken del er større. Det betyder, at præcisionen vokser meget i begyndelsen og relativt mindre senere. Når længden har tendens til uendelig, har tilstedeværelseskoefficienten tendens til

Ved at øge længden af ​​en test øges dens nøjagtighed, fordi den øger den sande varians med en højere hastighed end fejlvariancen. Dette betyder, at testens nøjagtighed stiger, fordi andelen af ​​varians som følge af fejlen falder. Formlen for Rulon, såvel som formlen for Flanagan og Guttman, er specielt anvendelig ved beregning af pålidelighedskoefficienten ved hjælp af metoden i de to halvdele. Disse er formler, der bruges til at beregne pålidelighedskoefficienten.

Pålidelighed og konsistens: Pålidelighedskoefficienten kan også findes på en anden måde, det er den såkaldte alfa koefficient eller generaliserbarhedskoefficient eller repræsentativitet (Cronbach). Denne alfakoefficient angiver nøjagtigheden, hvormed nogle elementer måler et aspekt af personlighed eller adfærd. Det kan fortolkes som: Et estimat af den gennemsnitlige korrelation af alle mulige elementer i et bestemt aspekt. En måling af testens nøjagtighed i overensstemmelse med dens sammenhæng eller interne konsistens (sammenhæng mellem dets elementer, i hvilket omfang testelementerne måler det samme) og dets længde. Angiver testens repræsentativitet, det vil sige den mængde, hvor prøven af ​​genstande, der komponerer den, er repræsentativ for befolkningen af ​​mulige genstande af samme type og psykologisk indhold. den alfa koefficient afspejler hovedsagelig to grundlæggende begreber i en tests præcision: 1. Sammenhængen mellem dens elementer: i hvilket omfang de alle måler det samme.

Testens længde: Når antallet af tilfælde af en prøve øges, og hvis systematiske fejl elimineres, repræsenterer prøven befolkningen bedre end den ekstraheres, og det er mere usandsynligt, at den uheldige fejl er involveret. Hvis testens elementer er dikotom, (ja eller nej, 1 eller 0, aftale eller uenighed osv.) Forenkles alfakoefficientens ligning, hvilket giver anledning til ligningerne af Kuder-Richardson (KR20 og KR21). I betragtning af et vist antal elementer vil en test være mere pålidelig, når den er mere homogen. Alfa-koefficienten fortæller os pålideligheden, da den repræsenterer homogenitet og konsistens eller intern konsistens af elementerne i en test.

Standarder og pålidelighedskriterier

Ifølge modellen af ​​prøverummet af emner er testens formål at estimere den foranstaltning, der ville opnås, hvis alle punkterne i prøverummet blev brugt. Denne foranstaltning ville være den sande score, som de virkelige målinger omtrentliggør mere eller mindre. Afhængig af, i hvilken grad en stikprøve korrelerer med de sande score, er testen mere eller mindre pålidelig. I denne model er matrixen af ​​korrelationer mellem alle elementer i prøverummet centralt. Denne prøvemodel insisterer mere direkte på intern konsistens, og i det omfang det opnår det, garanterer indirekte stabiliteten..

Den lineære model af de parallelle tests insisterer på stabiliteten af ​​scorerne, og i det omfang, at stabilitet opnås indirekte favoriserer indre sammenhæng. Hvis vi anvender en test for at etablere individuelle diagnoser og prognoser, bør pålidelighedskoefficienten være 0,90. I prognoser og kollektive klassifikationer er det ikke så meget kravet, selvom det ikke er praktisk at komme væk meget fra 0'90 til 0'80.

Nogle gange er det i visse former for test, såsom personlighedstest, svært at opnå koefficienter på mere end 0,70. Hvis parallelle former eller parallelle halvdele anvendes efter et mere eller mindre stort interval, kan afslappede fejl være flere talrige end de, der påvirker alfakoefficienten. Dette skyldes, hvad sænker sammenhængen er ikke kun iboende på prøve og en enkelt gang tilfældige fejl, som er dem, der tager hensyn til alfa koefficienten, men også at påvirke alle de fejl, der kan blive resultatet af de to forskellige situationer , som kan afvige i mange detaljer. Derfor er alfa koefficienten sædvanligvis større end de øvrige koefficienter.

Undtagen for koefficienten fundet ved at gentage den samme prøve som det mere sandsynligt, at tilfældige fejl i den første anvendelse i anden gentagelse, og i stedet for at nedsætte korrelationen mellem både stigningen. Det skal sikres, at den anden ansøgning er helt uafhængig af den første. Hvis vi opnår dette, vil det være lettere og billigere og tilrådeligt, når de forsøger at vurdere stabiliteten af ​​scoringer, især for lang tid peridos og komplekse test metode. > Næste: Gyldigheden af ​​testene

Denne artikel er rent informativ, i Online Psychology har vi ikke fakultetet til at foretage en diagnose eller anbefale en behandling. Vi inviterer dig til at gå til en psykolog for at behandle din sag specielt.

Hvis du vil læse flere artikler svarende til Klassisk testteori, Vi anbefaler dig at indtaste vores kategori af eksperimentel psykologi.