Teoria testului clasic

Un test este un instrument științific în măsura în care măsoară ceea ce intenționează, adică este valid și măsoară bine, adică este corect sau de încredere. Dacă găsim un instrument în care nu putem avea încredere în măsurătorile pe care le oferă, deoarece acestea variază din când în când când măsurăm același obiect, atunci vom spune că nu este fiabil. Un instrument, pentru a măsura ceva corect, trebuie să fie precis, deoarece dacă nu, măsurați ceea ce măsoară, îl va măsura greșit. Prin urmare, a fi precis este o condiție necesară, dar nu suficientă. În plus, trebuie să fie valabil, adică ceea ce măsoară cu precizie va fi ceea ce se intenționează să măsoare și nimic altceva.

Ați putea fi, de asemenea, interesat de: Teoria răspunsului la elemente - Aplicații și test

Fiabilitate:

Fiabilitate absolută și relativă: putem aborda problema fiabilității unui test în două moduri diferite, deși practic coincid.

Fiabilitatea și inexactitatea măsurătorilor sale: Când un subiect răspunde la un test, el obține un scor empiric, care este afectat de o eroare. Dacă nu ar exista erori, subiectul ar obține adevăratul scor. Testul este imprecis, deoarece scorul empiric nu se potrivește cu scorul adevărat adevărat. Această diferență între cele două scoruri este eroarea de eșantionare, eroarea de măsurare. Eroarea standard de măsurare va fi abaterea standard a erorilor de măsurare. Eroarea standard de măsurare indică precizia absolută a testului, deoarece permite estimarea diferenței dintre măsurarea obținută și cea care ar fi obținută dacă nu ar exista nicio eroare.

Fiabilitatea și stabilitatea măsurătorilor: un test va fi mai fiabil cu cât rezultatele pe care le oferă sunt mai constante sau mai stabile atunci când se repetă. Cu cât rezultatele sunt mai stabile în două ocazii, cu atât este mai mare corelația dintre ele. Această corelație se numește coeficient de fiabilitate. Acest lucru ne spune nu valoarea erorii, ci consistența testului cu el însuși și consistența informațiilor pe care le oferă. Coeficientul de fiabilitate exprimă fiabilitatea relativă a testului.

Coeficientul de fiabilitate și indicele de fiabilitate: - Coeficientul de fiabilitate al unui test este corelația testului cu el însuși, obținut de exemplu, în două moduri paralele: rxx. - Indicele de precizie este corelația dintre scorurile empirice ale unui test și scorurile reale ale acestuia: rxv Indicele de precizie va fi întotdeauna mai mare decât coeficientul de fiabilitate. Pentru a afla coeficientul de fiabilitate, aceste trei metode clasice trebuie evidențiate:

Găsirea corelației dintre test și repetarea acestuia: Metoda de repetare sau metoda test-retest: constă în aplicarea aceluiași test aceluiași grup în două ocazii și calcularea corelației dintre cele două serii de scoruri. Această corelație este coeficientul de fiabilitate. Această metodă oferă de obicei un coeficient de fiabilitate mai mare decât cele obținute prin alte proceduri și poate fi contaminată de factori perturbatori.
Găsiți corelația dintre două forme paralele ale testului: Metoda formelor paralele: sunt pregătite două forme paralele ale aceluiași test, adică două forme echivalente care dau aceleași informații și se aplică aceluiași grup de subiecți. Corelația dintre cele două forme este coeficientul de fiabilitate. Cu această metodă, prin repetarea aceluiași test, se evită sursele perturbatoare de fiabilitate a retestării.
Găsiți corelația dintre două jumătăți paralele ale testului: Metoda celor două jumătăți: Testul este împărțit în două jumătăți echivalente și se găsește corelația dintre ele. Este metoda preferată, deoarece este simplă și evită limitările procedurilor anterioare. Puteți alege elementele ciudate ale testului, pentru a constitui o jumătate și elementele pare pentru a constitui cealaltă.

Coeficientul de fiabilitate și corelația dintre testele paralele

Coeficientul de fiabilitate a unui test indică proporția în care varianța adevărata este varianța empirică: graph33 Coeficientul de fiabilitate al unui test variază între 0 și 1. De exemplu: dacă corelația dintre două teste paralele este rxx '= 0'80, înseamnă că 80% din varianța testului se datorează măsurii adevărate, iar restul, adică 20% din varianța testului se datorează unei erori. Indicele de fiabilitate al unui test este corelația între scorurile sale empirice și scorurile adevăratele sale index Fiabilitate = Indicele de fiabilitate este egală cu rădăcina pătrată a coeficientului de fiabilitate

Odată ce au fost dezvoltate două forme paralele ale unui test, se aplică procedura de analiză a varianței pentru a verifica omogenitatea variațiilor și diferența dintre măsuri. Dacă varianțele sunt omogene, diferența dintre medii nu este semnificativă și cele două forme sunt construite cu același număr de elemente de același tip și conținut psihologic, se poate afirma că sunt paralele. Dacă nu, trebuie să le reformați până când vor fi. Lipsa fiabilității este identificată cu valoarea rxx´ = 0 4.- Eroarea tipică de măsurare: Diferența dintre scorul empiric și cel adevărat este eroarea aleatorie, numită eroare de măsurare. Abaterea standard a erorilor de măsurare se numește eroare standard de măsurare. Eroarea standard de măsurare Permite estimarea fiabilității absolute a testului, adică estimarea cantității de eroare de măsurare care afectează un scor.

Fiabilitate și lungime: lungimea testului se referă la numărul de elemente ale acestuia. Fiabilitatea sa depinde de această lungime. Dacă un test constă din trei elemente, un subiect poate obține un scor de 1 cu o ocazie și un scor de 1 cu alta, sau în mod paralel.

De la o ocazie la alta, scorul a variat cu un punct; un punct din trei este o variație de 33%, o variație mare. Dacă subiecții obțin variații aleatorii de acest tip, corelația testului cu el însuși sau cea a celor două forme paralele ale testului va fi mult redusă și nu poate fi ridicată. Dacă testul este mult mai lung, dacă are, de exemplu, 100 de elemente, un subiect poate obține 70 de puncte la o dată și 67 în mod paralel. De la o dată la alta a variat 3 puncte; este o varianță relativ mică în raport cu testul total, în special 3%. Aceste mici modificări accidentale de această magnitudine, care apar în scorurile subiecților, atunci când trec de la o formă la paralelă, sunt relativ minore și nu vor scădea corelația dintre cele două la fel de mult ca înainte.

Coeficientul de fiabilitate va fi mult mai mare decât în cazul anterior. Ecuația Spearman-Brown exprimă relația dintre fiabilitate și lungime. Precizia unui test este nulă atunci când lungimea este 0 și crește pe măsură ce lungimea crește. Deși creșterea este relativ mai mică, cu cât lungimea piesei este mai mare. Aceasta înseamnă că precizia crește mult la început și relativ mai puțin după aceea. Când lungimea tinde spre infinit, coeficientul de fiabilitate tinde spre

Pe măsură ce lungimea unui test crește, precizia acestuia crește deoarece varianța reală crește cu o rată mai mare decât varianța erorii. Aceasta înseamnă că precizia testului crește deoarece proporția de varianță datorată erorii scade. Formula Rulon, precum și formula Flanagan și Guttman, sunt aplicabile în special la calcularea coeficientului de fiabilitate prin metoda cu două jumătăți. Acestea sunt formule utilizate pentru a calcula coeficientul de fiabilitate.

Fiabilitate și consistență: coeficientul de fiabilitate poate fi găsit și în alt mod, este așa-numitul coeficient alfa sau coeficientul de generalizare sau reprezentativitate (Cronbach). Acest coeficient alfa indică precizia cu care unele elemente măsoară un aspect al personalității sau al comportamentului. Poate fi interpretat ca: O estimare a corelației medii a tuturor elementelor posibile într-un anumit aspect. O măsură a preciziei testului în funcție de coerența sau consistența sa internă (relația dintre elementele sale; în ce măsură toate elementele testului măsoară la fel) și de lungimea acestuia. Indicând reprezentativitatea testului, adică cantitatea în care eșantionul de itemi care îl compune este reprezentativ pentru populația de posibili itemi de același tip și conținut psihologic. Coeficientul alfa În principal, reflectă două concepte de bază în precizia unui test: 1. Relația dintre elementele sale: măsura în care toate măsoară bine același lucru.

Lungimea testului: prin creșterea numărului de cazuri dintr-un eșantion și dacă sunt eliminate erorile sistematice, eșantionul reprezintă mai bine populația din care este extrasă și este mai puțin probabil să intervină eroarea întâmplătoare. Dacă elementele de testare sunt dihotomice (da sau nu, 1 sau 0, sunt de acord sau nu, etc), ecuația coeficientului alfa este simplificată, dând naștere ecuațiilor Kuder-Richardson (KR20 și KR21). Având în vedere un anumit număr de itemi, un test va fi cu atât mai fiabil, cu cât este mai omogen. Coeficientul alfa ne spune fiabilitatea în măsura în care reprezintă omogenitatea și coerența sau consistența internă a elementelor unui test.

Standarde și criterii de fiabilitate

Conform modelului spațiului eșantion de obiecte, obiectivul testului este de a estima măsura care ar fi obținută dacă ar fi utilizate toate elementele din spațiul eșantionului. Această măsurare ar fi adevăratul scor, la care măsurătorile reale sunt mai mult sau mai puțin aproximative. În funcție de gradul în care un eșantion de itemi se corelează cu scorurile reale, testul este mai mult sau mai puțin fiabil. Esențial pentru acest model este matricea corelațiilor dintre toate elementele din spațiul eșantionului. Acest model eșantion insistă mai direct asupra consistenței interne și, în măsura în care îl atinge, garantează indirect stabilitatea.

Modelul liniar al testelor paralele insistă mai mult pe stabilitatea scorurilor și, în măsura în care atinge stabilitatea, favorizează indirect consistența internă. Dacă aplicăm un test pentru a stabili diagnostice și prognoze individuale, coeficientul de fiabilitate trebuie să fie de 0,90 în sus. În previziuni și clasificări colective, cerința nu este atât de mare, deși nu este convenabil să vă abateți de la 0,90 la 0,80.

Uneori, la anumite tipuri de teste, cum ar fi testele de personalitate, este dificil să se obțină coeficienți mai mari de 0,70. Dacă formele paralele sau jumătățile paralele sunt aplicate după un interval mai mult sau mai puțin mare, erorile de șansă pot fi mai numeroase decât cele care afectează coeficientul alfa. Acest lucru se întâmplă deoarece ceea ce scade corelația nu sunt doar erorile aleatorii intrinseci testului și cu o singură ocazie, care sunt cele luate în considerare de coeficientul alfa, ci și toate erorile care pot proveni din cele două situații diferite influențează, care pot diferi prin numeroase detalii. Prin urmare, coeficientul alfa este de obicei mai mare decât ceilalți coeficienți.

Cu excepția coeficientului constatat prin repetarea aceluiași test, deoarece erorile aleatorii ale primei aplicații sunt mai susceptibile de a fi repetate în a doua și, în loc să scadă corelația dintre cele două, o măresc. Trebuie avut grijă ca a doua aplicație să fie complet independentă de prima. Dacă vom realiza acest lucru, aceasta va fi cea mai ușoară și mai ieftină metodă și recomandabilă atunci când încercăm să apreciem stabilitatea scorurilor, în special în perioade lungi de timp și cu teste complexe. > În continuare: Valabilitatea testelor

Acest articol este doar informativ, în Psihologie-Online nu avem puterea de a pune un diagnostic sau de a recomanda un tratament. Vă invităm să mergeți la un psiholog pentru a vă trata cazul particular.

Dacă doriți să citiți mai multe articole similare cu teoria testelor clasice, vă recomandăm să intrați în categoria noastră de Psihologie experimentală.

Cuprins:

Fiabilitate:

Standarde și criterii de fiabilitate

Alegerea editorilor