Teori for svar på emnet - Ansøgninger og test

Teori for svar på emnet - Ansøgninger og test / Eksperimentel psykologi

Inden for Teorien om psykometriske test Forskellige betegnelser har optrådt, der for øjeblikket hedder "Theory of Item Response" (F.M. Lord, 1980). Denne betegnelse viser nogle forskelle i forhold til den klassiske model: 1.- Forholdet mellem den forventede værdi af fagets karakter og egenskaben (karakteristisk for værdierne) er normalt ikke lineær. 2.- sigter mod at lave individuelle forudsigelser uden at skulle henvise til den normative gruppes karakteristika.

Du kan også være interesseret i: Classical Test Theory Index
  1. Teori af svaret på elementet eller modellerne af latent træk i teorien om testene
  2. Modeller af item response teori (tri)
  3. Parameter estimation
  4. Test konstruktion
  5. Anvendelser af elementresponsteori
  6. Fortolkning af scoringer

Teori af svaret på elementet eller modellerne af latent træk i teorien om testene

Vi ser da, at denne reaktionsteori til elementet giver mulighed for at beskrive de enkelte ting såvel som enkeltpersonerne særskilt. Det vurderer også, at svaret fra emnet afhænger af niveauet af færdigheder, der er blevet vurderet. Oprindelsen af ​​disse modeller skyldes Lazarsfeld, 1950, der introducerede udtrykket "latent træk" .

Herved betragtes det, at hver enkelt person har en individuel parameter, der er ansvarlig for fagets karakteristika, også kaldet "egenskab". Denne funktion er ikke direkte målbar, derfor kaldes den enkelte parameter den latente variabel. Når du anvender testene, kan du få to forskellige ting, den sande score og fitness skalaen; Dette opnås, hvis vi passerer to prøver på samme fitness til samme gruppe.

I teorien om latent træk eller teori om svaret på emnet Den sande score er den værdi, der forventes af den observerede score. Ifølge Lord er den sande score og fitness den samme, men udtrykt i forskellige målestørrelser.

Modeller af item response teori (tri)

Modeller Binomial: blev indført af Lord (1965), der antager, at den observerede score svarer til antallet af korrekte svar, der er opnået i testen (hvis elementer alle har samme vanskeligheder og har lokal selvstændighed, dvs. sandsynligheden at reagere korrekt på et emne påvirkes ikke af svarene til andre emner).

Poisson modeller: Disse modeller er egnede til de test, der har et stort antal elementer, og hvor sandsynligheden for korrekt eller ukorrekt svar er lille. Indenfor denne gruppe har vi igen forskellige modeller:

  1. Poissonian model af Rasch, hvis hypoteser er: hver test har et stort antal binære genstande, som er lokalt uafhængige. sandsynligheden for fejl i hvert element er lille. Sandsynligheden for at emnet udgør en fejl afhænger af to ting: prøvens vanskelighed og fagets evne. Additiviteten af ​​vanskelighederne forstået som resultat af at blande to ækvivalente tests i en enkelt test, hvis vanskelighed er summen af ​​vanskelighederne ved de to første test.
  2. Poisson model til at vurdere hastigheden: Denne model blev også foreslået af Rasch og karakteriseres, fordi hastigheden i udførelsen af ​​testen er taget i betragtning. Modellen kan foreslås på to måder: Tæl antallet af begået fejl og antallet af ord læses i en tidsenhed. tæller antallet af begået fejl og den tid, der bruges til at afslutte læsningen af ​​teksten. Sandsynligheden for realisering af et bestemt antal ord i en prøve (i) af et emne (j) for en tid (t)
  3. Ojiva Normale Modeller: er en model foreslået af lord (1968), som anvendes i test med dikotome elementer og med kun én variabel til fælles. Dens graf ville være som følger: De grundlæggende antagelser, der karakteriserer denne model er:
  • rummet for den latente variant er endimensionel (k = 1).
  • lokal uafhængighed mellem intems.
  • metriske for den latente variabel kan vælges således, at kurven for hvert element er det normale krigshoved.

Logistikmodeller; Det er en model, der ligner den forrige, men det har også flere fordele i forhold til sin matematiske behandling. Den logistiske funktion har følgende form: Der er forskellige logistiske modeller afhængigt af antallet af parametre, der har:

  • 2 parametre logistisk model, Birnbaum 1968, blandt dets egenskaber nævner vi, at det er endimensionelt, der er lokal uafhængighed, elementerne er dikotom osv.
  • 3 parametre logistisk model, Herre, er karakteriseret, fordi sandsynligheden for at slå ved spådom er en faktor, som vil påvirke testens præstationer. 4.3. 4-parameter logistisk model: model foreslået af McDonald 1967 og Barton-Lord i 1981, hvis formål er at forklare de tilfælde, hvor emner, der har et højt fitnessniveau, ikke reagerer korrekt på varen.
  • Logistik model af Rasch: denne model er den, der har genereret flere job trods en ulempe, det er, at dens tilpasning til de faktiske data er mere difícil.Pero modsætning til denne fordel, der gør det så udbredt er, der ikke kræver store Sample størrelser til din justering.

Parameter estimation

Fremgangsmåden mest anvendte er den Maximum Likelihood, med anvendes denne metode numeriske tilnærmelse metoder såsom Newton-Raphson og scoring (Rao). Den maksimale sandsynlighedsmetode er baseret på princippet om at opnå estimatorer af de ukendte parametre, der maksimerer sandsynligheden for at opnå de nævnte prøver. Ud over den Maximum Likelihood Bayesian Skøn baseret på Bayes' sætning, som er at indarbejde alle kendte oplysninger, a priori, som er relevant for processen med at gøre slutninger Det er også bruges. En mere grundig undersøgelse af den bayesiske metode til estimering af fitnessparametre er den af ​​Birnbaum (1996) og Owen (1975). .

INFORMATION FUNKTIONER

Den bedste test, der kan konstrueres, er den der giver mest information om latent egenskab. Kvantificeringen af ​​disse oplysninger sker gennem "informationsfunktionerne". Formlen funktionen oplysninger, Birnbaum 1968, er som følger: Husk på, at oplysningerne i en test er summen af ​​de oplysninger for hvert punkt, plus bidrag for hvert punkt er ikke afhængig af andre elementer der udgør testen. Generelt kan vi sige, at oplysningerne i alle modellerne:

  • varierer med fitness niveauer.
  • Jo større kurvens hældning er, desto mere information.
  • afhænger af variansen af ​​scorerne, jo højere er det, jo mindre information.

Test konstruktion

Den første opgave og en af ​​de vigtigste på tidspunktet for konstruktionen af ​​en test er valget af emnerne, tidligere akkord af de teoretiske antagelser, der skal definere den funktion, som testen har til hensigt at måle. Konceptet "vareanalyse" refererer til det sæt af formelle procedurer, der udføres for at vælge de elementer, der til sidst vil danne testen. De oplysninger, der anses for mest relevante med hensyn til emnerne, er:

  1. Vanskeligheden ved varen, procentdel af personer, der svarer på det.
  2. Diskrimination, sammenhæng mellem hver enkelt vare og den samlede score på testen.
  3. Distraktorer eller fejlanalyser, dens indflydelse er relevant, påvirker varens besvær og forårsager diskriminationsværdiernes undervurdering.

På tidspunktet for opstilling af indikatorer for de forskellige indeks anvendes statistik eller indeks normalt, idet følgende er de mest anvendte:

Indeks of difficulty Index of diskrimination Indeks for pålidelighed Indeks for gyldighed Kendte indeks, der skal tages i betragtning ved udvælgelsen af ​​de elementer, der vil danne testen, vil vi se, hvilke trin der er nødvendige for opførelsen af ​​en test:

  1. Specifikation af problemet.
  2. Angiv et bredt sæt af elementer og debug dem.
  3. Valg af model.
  4. Test de forudvalgte elementer.
  5. Vælg de bedste ting.
  6. Undersøg testets kvaliteter
  7. Etablere fortolkningsnormerne for den opnåede endelige prøve.

Fra de foregående punkter skal det bemærkes, at valget af model, punkt 3, vil afhænge af de mål, der forfølges af testen, egenskaberne og kvaliteten af ​​dataene og de tilgængelige ressourcer. Når en model vælges, givet de teoretiske forhold, hvor den kan anvendes, nej trods dets dyder de skal analyseres i hvert enkelt tilfælde og under særlige omstændigheder. Egenskaberne kan henføres til de modeller, der udgør den Reaktionsteori til varen (TRI), De kan blive påvirket af:

  • dimensionalitet af testen viser den begrænsede tilgængelighed af manglende IT-ressourcer Der er en række præferencer, når at bruge en eller de andre modeller, så lad os se: Normal sprænghoved modeller er generelt ikke anvendes i applikationer, deres værdi er teoretisk.
  • Rasch: egnet til vandret sammenligning (sammenlignelige tests på vanskeligheder med lignende fitnessfordeling). at have forskellige former for samme test. * 2 og 3 parametre: er dem der bedst passer til en række problemer.
  • at opdage fejlagtige responsmønstre. til lodret udligning af prøver (sammenlign test med forskellige sværhedsgrader og forskellige fordelinger for fitness).

1 og 2 parametre:

  • egnet til at bygge en enkelt skala, så du kan sammenligne færdigheder på forskellige niveauer.

Valg af model ud over det forfulgte formål kan påvirkes af stikprøvenes størrelse. I tilfælde af at prøven er stor og repræsentativ, vil der ikke være noget problem enten den klassiske model eller det latente træk. Men i TRI ( item response teori ) en lille prøve tvinger til at vælge modeller med et lille antal parametre, selv uniparametermodellen.

Anvendelser af elementresponsteori

Lad os se, hvad der er de mest almindelige applikationer: a) Equalization of tests, nogle gange er det nødvendigt at relatere de scores, der er opnået i forskellige tests, med to mulige formål:

  • Horisontal udligning: Det søges at opnå forskellige former for den samme test.
  • Lodret Equalization: Målet er at opbygge en enkelt målestok med forskellige vanskeligheder. Med hensyn til udligning af prøver introducerer Lord (1980) begrebet "egenkapital", hvilket indebærer, at for hver enkelt emne to test kan udveksles, da det anvendes, at den ene eller den anden ikke vil variere det niveau af egnethed, der var blevet estimeret. for emnet.

Undersøgelse af elementforspænding, et punkt er skævt, når det i gennemsnit giver betydeligt forskellige scoringer i specifikke grupper, der antages at være en del af samme population.

Test tilpasset eller gennemsnitligt , Gennem TRI kan individuelle test konstrueres, som giver mulighed for på en mere præcis måde at udlede den sande værdi af det pågældende træk. Varerne vil blive administreret sekventielt, forudindstillingen af ​​et element eller et andet vil afhænge af svarene ovenfor. Der findes forskellige typer af tilpassede tests, vi påpeger følgende:

  • to-trins procedure, lord 1971; Bertz og Weiss 1973 - 1974. En test er bestået først og afhængigt af resultaterne administreres en anden test.
  • Fremgangsmåden i flere faser er den samme som den foregående, kun processen indeholder flere faser.
  • Fast forgreningsmodel, Lord 1970, 1971, 1974; Mussio 1973. Alle emner løser det samme emne, afhængigt af svaret, er et sæt emner løst.
  • Variabel forgrenet model er baseret på uafhængigheden mellem emnerne og egenskaberne af de maksimale sandsynligheds estimatorer.

Bank af varer, At have et stort sæt af varer er noget, der vil forbedre testens kvalitet, men for det første skal emnerne gennemgå en fejlfindingsproces først. For at klassificere emnerne er det nødvendigt at tage højde for, hvilken funktion der er beregnet til at måle testen, at denne genstand vil være en del af.

Fortolkning af scoringer

skalaer: Formålet er at tilbyde et kontinuum til at bestille, klassificere eller vide, hvad der er den relative størrelse af den evaluerede funktion Dette vil gøre det muligt for os at etablere forskelle og ligheder i mennesker med hensyn til dette træk. Vægterne anvendt i psykologi er: nominelle, ordinære, interval og årsag; disse skalaer er konstrueret ud fra resultaterne af testene, resultater kaldet "direkte scores" .

typiske : At skrive en test er at omdanne de direkte scoringer til andre, der er letfortolkelige, da den typificerede score vil afsløre motivets stilling i forhold til gruppen og tillade os at lave intra og intersubject sammenligninger. Der er to typer skrivning:

  1. Lineær, bevar fordelingens form og ændrer ikke størrelsen af ​​korrelationerne.
  2. Ikke-lineære, de bevarer ikke distributionen eller størrelsen af ​​korrelationerne .

APTITUDE SCALE I TRI er skalaen, der er bygget, den skala, der svarer til fitnessniveauet; Denne skala karakteriseres, fordi estimaterne og referencerne foretages direkte med hensyn til egnethed og dens skala. Desuden afhænger denne egnethed, der skønnes, kun af formen på karakteristikkens kurve. Inden for de mulige skalaer angiver vi to:

  1. Scale, foreslået af Woodcock (1978) og defineret af følgende formel:
  2. WITS skala, foreslået af Wright (1977), denne skala er en ændring af den foregående og er givet ved følgende forhold:

Denne artikel er rent informativ, i Online Psychology har vi ikke fakultetet til at foretage en diagnose eller anbefale en behandling. Vi inviterer dig til at gå til en psykolog for at behandle din sag specielt.

Hvis du vil læse flere artikler svarende til Teori for svar på emnet - Ansøgninger og test, Vi anbefaler dig at indtaste vores kategori af eksperimentel psykologi.