Giltighet av ett test: 6 typer

Följande sex typer av validitet används i allmänhet, Ansiktsgiltighet, Innehållsförmåga, Prediktiv validitet, Samtidig, Konstruktion och Faktoriell validitet. Av dessa är innehållet, prediktiv, samtidig och konstruktiv validitet de viktigaste som används inom psykologi och utbildning.

Dessa diskuteras nedan:

Typ # 1. Ansiktsgiltighet:

Ansiktsgiltighet i den mån testet verkar mäta vad som ska mätas.

Ansiktsgiltighet avser huruvida ett test verkar vara giltigt eller inte, dvs från externt utseende om föremålen verkar mäta den önskade aspekten eller inte. Om ett test mäter vad testförfattaren önskar mäta, säger vi att testet har ansikte validitet. Sålunda avser ansiktets giltighet inte vad testet mäter, men vad testet tycks mäta. Testets innehåll ska inte uppenbarligen vara olämpligt, irrelevant.

Exempelvis bör ett test för att mäta "Skicklighet dessutom" endast innehålla objekt på tillägg. När man går igenom föremålen och känner att alla föremål verkar mäta färdigheten dessutom kan man säga att testet valideras av ansikte.

Även om det inte är en effektiv metod för att bedöma testets giltighet och som sådan inte brukar användas, kan den användas som ett första steg för att validera testet. När testet validerats i ansiktet kan vi fortsätta vidare för att beräkna validitetskoefficienten.

Dessutom hjälper den här metoden till en testtillverkare att revidera testobjekten för att passa till syftet. När ett test ska konstrueras snabbt eller när det är ett brådskande behov av ett test och det inte finns tid eller utrymme för att bestämma giltigheten med andra effektiva metoder kan ansiktets giltighet bestämmas.

Denna typ av giltighet är inte tillräcklig eftersom den arbetar på ansiktsnivå och kan därför användas som en sista utväg.

Typ # 2. Innehåll Giltighet:

Innehåll Giltighet en process för att matcha testobjekten med instruktionsmålen.

Innehållsvaliditet är det viktigaste kriteriet för nyttan av ett test, särskilt av ett prestationstest. Det kallas också som rationell giltighet eller logisk giltighet eller kurrikulär giltighet eller intern giltighet eller intrinsisk giltighet.

Innehållsvaliditet avser graden eller omfattningen av ett test som består av föremål som representerar de beteenden som provtagaren vill mäta. I vilken utsträckning testresultaten är representativa för hela innehållet och målen för undervisningen kallas testets innehållsvaliditet.

Innehållsvaliditet beräknas genom att utvärdera relevansen av testobjekten. dvs. testobjekten måste vederbörligen täcka alla innehålls- och beteendemässiga områden av egenskapen som ska mätas. Det ger idé om ämne eller förändring av beteende.

På så sätt avser innehållsvaliditet i vilken utsträckning ett test innehåller föremål som representerar beteendet som vi ska mäta. Proverna ska innehålla alla relevanta egenskaper för hela innehållsområdet och målen i rätt proportion.

Innan konstruktionen utförs, förbereder provtagaren en tvåvägs tabell över innehåll och mål, som i allmänhet kallas "Specifikationstabell".

Antag att ett prestationstest i matematik är förberedd. Det måste innehålla föremål från Algebra, Aritmetik, Geometri, Mensuration och Trigonometri, och dessutom måste objekten mäta de olika beteendemålen som kunskap, förståelse, skicklighet, tillämpning etc. Så det är viktigt att vikten ges åt olika innehållsområden och mål.

Ett exempel på "specifikationstabellen" i matematik visas i följande tabell:

Tabellen återspeglar provet av inlärningsuppgifter som ska mätas. Ju närmare testobjekten motsvarar det angivna provet, desto större är möjligheten att ha tillfredsställande innehållsvaliditet. Därför är det önskvärt att föremålen i ett test screenas av ett team av experter. De bör kontrollera om placeringen av de olika objekten i tabellens celler är lämplig och om alla celler i tabellen har ett tillräckligt antal objekt.

Tillräckligheten ska bedömas i förhållande till den vikt som ges till det olika innehållsobjektet enligt expertgruppen som har utformat läroplanen.

Några allmänna punkter för att säkerställa innehållsvaliditet ges nedan:

1. Testet ska tjäna den önskade nivån av studenter, varken över eller under deras standard.

2. Språket ska vara upp till nivån på eleverna.

3. Allt som inte ingår i läroplanen ska inte ingå i testobjekten.

4. Varje del av läroplanen ska ges nödvändig vikt. Fler artiklar ska väljas från viktiga delar av läroplanen.

begränsningar:

1. Vikten som ska ges till olika delar av innehållet är subjektivt.

2. Det är svårt att konstruera det perfekta objekttestet.

3. Innehållsvaliditet är inte tillräcklig eller tillräcklig för test av Intelligens, Prestation, Attityd och i viss utsträckning Personlighetstest.

4. Vikt som ges på olika beteendeförändringar är inte objektiv.

Typ # 3. Prediktiv Giltighet:

Prediktiv Giltighet i vilken utsträckning testet förutsäger studenternas framtida prestation.

Prediktiv validitet handlar om testets prediktiva kapacitet. Det indikerar effektiviteten av ett test vid prognoser eller förutsäger framtida resultat i ett visst område. Testanvändaren vill förutse en individs framtida prestanda. Testresultat kan användas för att förutse framtida beteende eller prestanda och därmed kallas som prediktiv validitet.

För att hitta prediktiv validitet korrelerar testaren testresultaten med testens efterföljande prestation, tekniskt känd som "Kriterium". Kriteriet är en oberoende, extern och direkt åtgärd av det som testet är utformat för att förutsäga eller mäta. Därför är det också känt som "kriteriumrelaterad giltighet".

Den prediktiva eller empiriska validiteten har definierats av Cureton (1965) som en uppskattning av korrelationskoefficienten mellan testresultat och det sanna kriteriet.

Ett exempel kan klargöra konceptet bättre.

Exempel:

Medicinskt inträdesprov är uppbyggt och administrerat för att välja kandidat för antagning till MBBS-kurser. Med utgångspunkt i de poäng som kandidaterna gjort på detta test erkänner vi kandidaterna.

Efter avslutad kurs visas de vid den slutliga MBBS-undersökningen. Poängen av slutlig MBBS-undersökning är kriteriet. Poängen av inträdesprov och slutprövning (kriterium) är korrelerade. Hög korrelation innebär hög prediktiv validitet.

Liknande exempel som andra rekryteringstest eller ingångstester i jordbruk, teknik, bank, järnväg mm kan här anges som måste ha hög förutsägbar validitet.

Det är test som används för rekrytering, klassificering och inträdesprov måste ha hög förutsägbar validitet. Denna typ av validitet kallas ibland "Empirical validity" eller "Statistical validity" eftersom vår utvärdering huvudsakligen är empirisk och statistisk.

Begränsning:

Om vi får ett lämpligt kriterieåtgärd som våra testresultat ska korreleras med, kan vi bestämma testets prediktiva validitet. Men det är väldigt svårt att få ett bra kriterium. Dessutom får vi inte få kriterieåtgärder för alla typer av psykologiska tester.

Typ # 4. Samtidig giltighet:

Samtidig giltighet som korrelerar testresultatet med en annan uppsättning kriterionsresultat.

Samtidig validitet hänvisar till i vilken utsträckning testresultatet motsvarar redan etablerad eller accepterad prestation, känd som kriterium. För att veta giltigheten av ett nybyggt test är det korrelerat eller jämfört med någon tillgänglig information.

Således valideras ett test mot någon samtidigt tillgänglig information. Poängen som erhållits från ett nybyggt test är korrelerat med förutbestämd testprestanda. Antag att vi har förberett ett test av intelligens.

Vi administrerar det till en grupp elever. Stanford-Binet-testet administreras också till samma grupp. Nu testresultat gjorda på vårt nybyggda test och testresultat från eleverna på Stanford-Binet Intelligence Test är korrelerade. Om korrelationskoefficienten är hög är vår intelligensprov sägs ha hög samtidig validitet.

Ordbokens mening med termen "samtidig" är "existerande" eller "gjort samtidigt". Således används termen "samtidig validitet" för att indikera processen för validering av ett nytt test genom att korrelera dess poäng med någon befintlig eller tillgänglig informationskälla (kriterium) som kan ha erhållits strax före eller kort efter det nya testet ges.

För att fastställa den samtidiga giltigheten av ett prestationstest konstruerat färskt, är dess poäng korrelerade med de poäng som erhållits av samma studenter i deras senaste första terminala eller terminskontroll. Således valideras ett test mot någon samtidigt tillgänglig information. För att få en kriterieåtgärd behöver vi inte vänta länge.

Den prediktiva validiteten skiljer sig från samtidig giltighet i den meningen att vi i tidigare giltighet väntar på framtiden för att få kriterieåtgärd. Men med tanke på samtidig validitet behöver vi inte vänta på längre luckor.

Uttrycket "samtidiga" här innebär följande egenskaper:

1. De två testen - den som har giltighetskontroll och den som har bevisad giltighet - ska täcka samma innehållsområde på en given nivå och samma mål.

2. Befolkningen för båda proven är fortsatt densamma och de två testen administreras i nästan liknande miljöer; och

3. Prestationsdata på båda provningarna kan erhållas nästan samtidigt.

Denna typ av giltighet är också känd som "extern giltighet" eller "funktionell giltighet". Samtidig validitet är relevant för test som används för diagnos inte för att förutsäga framtida framgång.

Typ # 5. Konstruera Giltighet:

Konstruera Giltighet omfattningen är vilken testet kan sägas att mäta en teoretisk konstruktion eller psykologisk variabel.

En konstruktion är huvudsakligen psykologisk. Vanligtvis refererar det till en egenskap eller mental process. Konstruktiv validering är processen att bestämma i vilken utsträckning ett visst test mäter de psykologiska konstruktioner som provtagaren avser att mäta.

Det indikerar i vilken utsträckning ett test mäter de abstrakta attribut eller kvaliteter som inte är operativt definierade.

Gronlund och Linn säger att "Construct validation kanske definieras som processen att bestämma i vilken utsträckning testprestandan kan tolkas i termer av en eller flera psykologiska konstruktioner."

Ebel och Frisbie beskriver, "Construct validation är processen att samla bevis för att stödja det påståendet att ett givet test verkligen mäter den psykologiska konstruktion som testmakarna hade för avsikt att mäta."

Konstruktionsgiltighet är också känd som "Psychological Validity" eller "Trait Validity" eller "Logical Validity". Konstruktionsgiltighet innebär att testresultatet undersöks i termer av en konstruktion. Det studerar konstruktionen eller psykologiska egenskaper som ett test mäter.

I vilken utsträckning testet mäter personlighetsegenskaperna eller mentala processer som definieras av testmaskinen är känd som testets konstruktivitet.

Vid konstruktion av test på intelligens, attityd, matematisk förmåga, kritiskt tänkande, studiefärdigheter, ångest, logisk resonemang, läsförståelse etc. måste vi gå för konstruktiv validitet. Ta till exempel "ett test av uppriktighet".

Innan konstruktion av sådana typer av test konfronteras provtagaren med frågorna:

1. Vad ska vara definitionen av begreppet uppriktighet?

2. Vilka typer av beteende kan förväntas från en person som är uppriktig?

3. Vilken typ av beteende skiljer sig mellan uppriktighet och insincerity?

Varje konstruktion har en underliggande teori som kan bäras för att beskriva och förutsäga en elevs beteende.

Gronlund (1981) föreslår följande tre steg för att bestämma konstruktionsgiltighet:

(i) Identifiera de konstruktioner som antas vara redo för testprestanda.

(ii) Avleda hypoteser avseende testprestanda från teorin som ligger till grund för varje konstruktion.

iii) verifiera hypoteserna med hjälp av logiska och empiriska medel

Det måste noteras att konstruktionsgiltigheten är inferentiell. Den används främst när andra typer av validitet är otillräckliga för att indikera testets giltighet. Konstruktionsgiltighet är vanligtvis involverad i studier av vanor, uppskattning, ärlighet, känslomässig stabilitet, sympati etc.

Typ # 6. Faktorisk giltighet:

Faktoriell Giltighet Graden av korrelation av de olika faktorerna med hela testet.

Faktoriell validitet bestäms av en statistisk teknik som kallas faktoranalys. Den använder metoder för att förklara interkorrelationer för att identifiera faktorer (som kan vara verbaliserade som förmågor) som utgör testet.

Med andra ord används metoder för interkorrelation och andra statistiska metoder för att uppskatta faktoriell validitet. Korrelationen av testet med varje faktor beräknas för att bestämma vikten som bidrar med varje sådan faktor till testets totala prestanda.

Detta berättar om faktorbelastningarna. Denna relation av de olika faktorerna med hela testet kallas den faktoriella giltigheten. Guilford (1950) föreslog att faktoriell validitet är den tydligaste beskrivningen av vad en teståtgärd och i alla fall bör ges företräde framför andra typer av validitet.