Teoria răspunsului articolului

Evaluare: 4 (1 vot) 1 comentariu

În domeniul teoriei testelor psihometrice, au apărut diferite denumiri care în prezent poartă denumirea de „Item Response Theory” (FM Lord, 1980). Această denumire prezintă unele diferențe față de modelul clasic: 1.- relația dintre valoarea așteptată a scorurilor subiectului și trăsătura (caracteristică responsabilă de valori), nu este de obicei liniară. 2.- Acesta își propune să facă predicții individuale fără a fi nevoie să se refere la caracteristicile grupului normativ.

Ați putea fi, de asemenea, interesat de: Teoria testelor clasice Index

Teoria răspunsului la elementul sau modelele trăsăturii latente din teoria testelor
Modele de teoria răspunsului la elemente (tri)
Estimarea parametrilor
Testarea construcției
Aplicații ale teoriei răspunsului la elemente
Interpretarea scorurilor

Teoria răspunsului la itemul sau modelele trăsăturii latente din teoria testelor

Vedem, deci, că această teorie a răspunsului la articole oferă posibilitatea descrierii separate atât a articolelor, cât și a persoanelor; De asemenea, consideră că răspunsul dat de subiect depinde de nivelul de abilitate pe care îl are în intervalul luat în considerare. Originea acestor modele se datorează lui Lazarsfeld, 1950, care a introdus termenul „trăsătură latentă”.

De aici se consideră că fiecare individ are un parametru individual care este responsabil pentru caracteristicile subiectului, numit și „trăsătură”. Această trăsătură nu este direct măsurabilă, prin urmare parametrul individual se numește variabilă latentă. La aplicarea testelor, pot fi obținute două lucruri diferite, scorul adevărat și scara aptitudinii; Acest lucru se realizează dacă trecem două teste despre aceeași aptitudine pentru același grup.

În teoria trăsăturilor latente sau în teoria răspunsului la element, scorul adevărat este valoarea așteptată a scorului observat. Potrivit lui Lord, scorul adevărat și condiția fizică sunt același lucru, dar exprimate pe diferite scale de măsurare.

Modele de teoria răspunsului la elemente (tri)

Modele de erori binomiale: au fost introduse de Lord (1965), care presupun că scorul observat corespunde numărului de răspunsuri corecte obținut la test (ale cărui itemi au aceeași dificultate și au independență locală, adică probabilitatea răspunsul corect la un articol nu este afectat de răspunsurile date la alte articole).

Modele Poisson: aceste modele sunt adecvate acelor teste care au un număr mare de itemi și în care probabilitatea unui răspuns corect sau incorect este mică. În cadrul acestui grup, la rândul nostru, avem diferite modele:

Modelul Poissonian al lui Rasch, ale cărui ipoteze sunt: fiecare test are un număr mare de itemi binari care sunt independenți la nivel local. probabilitatea de eroare în fiecare articol este mică. probabilitatea ca subiectul să comită o eroare depinde de două lucruri, de dificultatea testului și de capacitatea subiectului. aditivitatea dificultăților, înțeleasă ca rezultat al amestecării a două teste echivalente într-un singur test a cărui dificultate este suma dificultăților celor două teste inițiale.
Modelul Poisson pentru evaluarea vitezei: Acest model a fost propus și de Rasch și se caracterizează prin luarea în considerare a vitezei în executarea testului. Modelul poate fi luat în considerare în două sensuri: să numere numărul de greșeli făcute și cuvintele citite într-o unitate de timp. numărați numărul greșelilor făcute și timpul petrecut în finalizarea lecturii textului. Probabilitatea de a efectua un anumit număr de cuvinte într-un test (i) de un subiect (j), în timpul unui timp (t)
Modele de focoase normale: este un model propus de Lord (1968), care este utilizat în teste cu itemi dihotomici și cu o singură variabilă în comun. Graficul său ar fi următorul: Ipotezele de bază care caracterizează acest model sunt:

spațiul variantei latente este unidimensional (k = 1).
independența locală între inteme.
metrica pentru variabila latentă poate fi aleasă astfel încât curba pentru fiecare element să fie focoasa normală.

Modele logistice; Este un model foarte asemănător cu cel precedent, dar are și mai multe avantaje în ceea ce privește tratamentul său matematic. Funcția logistică ia următoarea formă: Există diferite modele logistice în funcție de numărul de parametri pe care îi au:

Model logistic cu 2 parametri, Birnbaum 1968, printre caracteristicile sale menționăm că este unidimensional, există independență locală, articolele sunt dihotomice etc.
Modelul logistic cu 3 parametri, Lord, se caracterizează prin faptul că probabilitatea unei ghiciri corecte este un factor care va influența performanța testului. 4.3. Model logistic cu 4 parametri: model propus de McDonald 1967 și Barton-Lord în 1981, al cărui scop este de a explica acele cazuri în care subiecții cu un nivel ridicat de fitness nu răspund corect la item.
Modelul logistic Rasch: acest model este cel care a generat cel mai mare număr de locuri de muncă în ciuda faptului că are un dezavantaj, adică ajustarea sa la datele reale este mai dificilă, dar spre deosebire de acesta avantajul care îl face atât de utilizat este Nu necesită dimensiuni mari ale eșantionului pentru ajustare.

Estimarea parametrilor

Metoda care a fost utilizată cel mai mult este Probabilitatea maximă, împreună cu această metodă sunt utilizate proceduri de aproximare numerică, cum ar fi Newton-Raphson și Scoring (Rao). Metoda Probabilității maxime se bazează pe principiul obținerii estimatorilor parametrilor necunoscuți care maximizează probabilitatea de a obține astfel de probe. Pe lângă Probabilitatea maximă, se utilizează și Estimarea Bayesiană, bazată pe teorema Bayes, care constă în încorporarea tuturor informațiilor cunoscute, a priori, relevante pentru procesul de realizare a inferențelor. Un studiu mai aprofundat al metodei bayesiene pentru estimarea parametrilor de fitness este realizat de Birnbaum (1996) și Owen (1975).

FUNCȚII DE INFORMAȚIE

Cel mai bun test care poate fi construit este cel care oferă cea mai mare cantitate de informații despre trăsătura latentă. Cuantificarea acestor informații se face prin „funcțiile informaționale”. Formula funcției informaționale, Birnbaum 1968, este următoarea: Trebuie să se țină seama de faptul că informațiile obținute într-un test sunt suma informațiilor fiecărui articol, în plus contribuția fiecărui articol nu depinde de restul articolelor care alcătuiesc testul. În termeni generali, putem spune că informațiile, în toate modelele:

variază în funcție de nivelurile de fitness.
cu cât panta curbei este mai mare, cu atât mai multe informații.
depinde de varianța scorurilor, cu cât este mai mare, cu atât mai puține informații.

Testarea construcției

Prima sarcină și una dintre cele mai importante atunci când se construiește un test este alegerea articolelor, acordul prealabil al ipotezelor teoretice care ar trebui să definească trăsătura pe care testul intenționează să o măsoare. Conceptul „Analiza articolelor” se referă la setul acelor proceduri formale care sunt efectuate pentru a selecta acele elemente care vor forma în cele din urmă testul. Informațiile care sunt considerate cele mai relevante cu privire la articole sunt:

Dificultatea articolului, procentul de persoane care îl înțeleg.
Discriminarea, corelarea fiecărui item cu scorul total la test.
Distractorii sau analiza erorilor, influența lor este relevantă, afectează dificultatea articolului și face ca valorile discriminării să fie subestimate.

La stabilirea indicatorilor diferiților indici, se utilizează de obicei statistici sau indici, următorii fiind cei mai utilizați:

Indice de dificultate Indice de discriminare Indice de fiabilitate Indice de valabilitate Cunoscând indicii care trebuie luați în considerare pentru selectarea articolelor care vor forma testul, vom vedea ce pași sunt necesari pentru construirea unui test:

Specificarea problemei.
Enumerați un set mare de articole și depanați-le.
Alegerea modelului.
Testați elementele preselectate.
Selectați articolele ideale.
Studiați calitățile testului
Stabiliți regulile de interpretare a testului final obținut.

Din punctele anterioare, trebuie remarcat faptul că alegerea modelului, punctul 3, va depinde de obiectivele urmărite de test, de caracteristicile și calitatea datelor și de resursele disponibile. Atunci când se alege un model, condițiile teoretice în care poate fi aplicat sunt deja date, totuși virtuțile sale trebuie analizate în fiecare caz și circumstanțe specifice. Proprietățile atribuibile acelor modele care integrează teoria răspunsului la element (TRI), pot fi afectate de:

dimensionalitatea testului disponibilitatea redusă a eșantionului lipsa resurselor informatice Există o serie de preferințe atunci când se utilizează unul sau celelalte modele, să le vedem: modelele normale de focoase nu sunt utilizate de obicei în aplicații, valoarea lor este teoretică.
Rasch: potrivit pentru comparație orizontală (teste comparabile la niveluri de dificultate cu distribuții de aptitudini similare). să aibă forme diferite ale aceluiași test. * 2 și 3 parametri: sunt cei care se potrivesc cel mai bine unei varietăți de probleme.
pentru a detecta modele de răspuns greșite. pentru potrivirea verticală a testelor (compară testele cu diferite niveluri de dificultate și distribuții diferite pentru aptitudine).

1 și 2 parametri:

adecvat pentru construirea unei singure scări, astfel încât abilitățile să poată fi comparate la diferite niveluri.

Alegerea modelului, pe lângă scopul urmărit, poate fi afectată de dimensiunea eșantionului; În cazul în care eșantionul este mare și reprezentativ, nu va exista nicio problemă, fie că este vorba de modelul de trăsături clasic sau latent. Dar în IRT (teoria răspunsului la element) un eșantion mic forțează să aleagă modele cu un număr mic de parametri, chiar și modelul uniparametric.

Aplicații ale teoriei răspunsului la elemente

Vom vedea care sunt cele mai frecvente aplicații: a) Testarea potrivită, uneori este necesar să raportăm scorurile obținute în diferite teste, cu două scopuri posibile:

Egalizare orizontală: urmărește obținerea diferitelor forme ale aceluiași test.
Egalizare verticală: urmărește să construiască o singură scară de aptitudini cu diferite niveluri de dificultate. În ceea ce privește egalizarea testelor, Lord (1980) introduce conceptul de „corectitudine”, ceea ce implică faptul că pentru fiecare subiect două teste pot fi interschimbabile, deoarece se aplică faptul că unul sau altul nu va schimba nivelul de aptitudine care fusese estimat. pentru subiect.

Studiul părtinirii articolelor, un element este părtinitor atunci când, în medie, dă scoruri semnificativ diferite în grupuri specifice care se presupune că fac parte din aceeași populație.

Pot fi construite teste adaptate sau medii, prin IRT, teste individualizate care permit deducerea mai precisă a adevăratei valori a trăsăturii în cauză. Itemii vor fi administrați secvențial, prezentarea unui item sau a altui va depinde de răspunsurile date anterior. Există diferite tipuri de teste adaptate, subliniem următoarele:

procedura în două etape, Lord 1971; Bertz și Weiss 1973 - 1974. Același test este trecut primul și un al doilea test este administrat în funcție de rezultate.
Procedura în mai multe etape, este la fel ca cea precedentă, doar că procesul include mai multe etape.
Model ramificat fix, Lord 1970, 1971, 1974; Mussio 1973. Toți subiecții rezolvă același item, conform răspunsului, se rezolvă un set de itemi.
Modelul ramificat variabil se bazează pe independența dintre elemente și pe proprietățile estimatorilor de maximă probabilitate.

Banca de articole, având un set mare de articole este ceva care va îmbunătăți calitatea testului, dar pentru aceasta articolele trebuie să treacă mai întâi printr-un proces de depanare. Pentru a clasifica articolele, este necesar să se ia în considerare care este trăsătura pe care testul din care va face parte acest articol este destinat să îl măsoare.

Interpretarea scorurilor

Scale: scopul lor este de a oferi un continuum pentru a putea ordona, clasifica sau cunoaște care este magnitudinea relativă a trăsăturii evaluate; Acest lucru ne va permite să stabilim diferențe și similitudini la oameni cu privire la această trăsătură. Scalele folosite în Psihologie sunt: nominală, ordinală, interval și raport; Aceste scale sunt construite din rezultatele testelor, rezultate numite „scoruri directe”.

Tipificați: tipificați un test este de a transforma scorurile directe în altele care sunt ușor de interpretat, deoarece scorul tipificat va dezvălui poziția subiectului față de grup și ne va permite să facem comparații intra și inter-subiecte. Există două forme de tastare:

Liniare, păstrează forma distribuției și nu modifică dimensiunea corelațiilor.
Neliniare, ele nu păstrează distribuția sau dimensiunea corelațiilor.

SCALA DE FITNESS În IRT, scala care este construită este scala care corespunde nivelurilor de aptitudine; Această scară se caracterizează prin faptul că estimările și referințele sunt făcute direct cu privire la fitness și la scara sa. Mai mult, această aptitudine estimată depinde doar de forma curbei caracteristice a elementelor. Printre scalele posibile, indicăm două:

Scala, propusă de Woodcock (1978) și este definită de următoarea formulă:
Scala WITS, propusă de Wright (1977), această scală este o modificare a celei anterioare și este dată de următoarea relație:

Acest articol este doar informativ, în Psihologie-Online nu avem puterea de a pune un diagnostic sau de a recomanda un tratament. Vă invităm să mergeți la un psiholog pentru a vă trata cazul particular.

Dacă doriți să citiți mai multe articole similare cu teoria răspunsului la articole - Aplicații și test, vă recomandăm să introduceți categoria noastră de psihologie experimentală.