Icke-parametriska test: Begrepp, försiktighetsåtgärder och fördelar

Efter att ha läst den här artikeln kommer du att lära dig om: - 1. Begrepp av icke-parametriska test 2. Förutsättningar för icke-parametriska test 3. Försiktighetsåtgärder 4. Några icke-parametriska test 5. Fördelar 6. Nackdelar.

Begrepp av icke-parametriska test:

Något mer nyligen har vi sett utvecklingen av ett stort antal engagemangstekniker som inte gör många eller stränga antaganden om den befolkning som vi har samplerat data från. Dessa fördelningsfria eller icke-parametriska tekniker resulterar i slutsatser som kräver färre kvalifikationer.

Efter att ha använt en av dem kan vi kanske säga det, "Oavsett befolkningens form, kan vi konstatera att ...."

De två alternativa namnen som ofta ges till dessa tester är:

Distribution-Free:

Icke-parametriska tester är "distributionsfria". De antar inte att de undersökta värdena dras från en befolkning som distribueras på ett visst sätt, t.ex. från en normalt distribuerad befolkning.

När vi gör tester av betydelsen av skillnaden mellan två sätt (i termer av CR eller t, till exempel) antar vi att värderingar som vår statistik bygger på fördelas normalt i befolkningen. Vad som egentligen gör - under nollhypotesen - är att uppskatta från vår provstatistik sannolikheten för en sann skillnad mellan de två parametrarna.

När N är ganska liten eller data är dåligt skevda, så att antagandet om normalitet är tveksamt, är parametriska metoder av tvivelaktigt värde eller inte alls tillämpliga. Vad vi behöver i sådana fall är tekniker som gör det möjligt för oss att jämföra prover och göra inferenser eller tester av betydelse utan att behöva anta normalitet i befolkningen.

Sådana metoder kallas icke-parametriska eller distributionsfria. Testet X-test X-testet är till exempel en icke-parametrisk teknik. Betydelsen av X ² beror endast på graden av frihet i bordet; inget antagande behöver göras i form av distribution för de variabler som klassificeras i kategorierna i X ^2- tabellen.

Rang-skillnadskorrelationskoefficienten (rho) är också en icke parametrisk teknik. När p beräknas från poäng rangordnade i ordning av merit, är den fördelning från vilken poängen tas, sannolikt skevad och N är nästan alltid liten.

Ranking tester:

Alternativt identifieras många av dessa tester som "rankningstester", och denna titel antyder deras andra huvudprincip: icke-parametriska tekniker kan användas med poäng som inte är exakta i någon numerisk bemärkelse men som i själva verket helt enkelt ligger.

Förutsättningar för icke-parametriska test:

Ett icke parametriskt statistiskt test baseras på en modell som endast anger mycket allmänna förhållanden och ingen angående den specifika formen av fördelningen från vilken provet drogs.

Vissa antaganden är förknippade med de flesta icke-parametriska statistiska testerna, nämligen:

1. Att observationerna är oberoende

2. Variabeln som studeras har underliggande kontinuitet;

3. Icke-parametriska förfaranden, inte en annan hypotes om befolkningen än parametriska förfaranden.

4. Till skillnad från parametriska tester finns det icke-parametriska tester som kan tillämpas på lämpligt sätt på data mätt i ordinär skala och andra till data i nominell eller kategorisk skala.

Försiktighetsåtgärder vid användning av icke-parametriska test:

Vid användning av icke-parametriska tester varnas studenten med följande nedläggningar:

1. När mätningar är i fråga om intervall och förhållande vågor, kommer omvandlingen av mätningarna på nominella eller ordinära skalor leda till förlust av mycket information. Därför ska parametriska test i så stor utsträckning som möjligt tillämpas i sådana situationer. När vi använder en icke parametrisk metod som en genväg slänger vi bort dollar för att spara pennies.

2. I situationer där de antaganden som ligger till grund för ett parametertest är nöjda och både parametriska och icke parametriska tester kan tillämpas bör valet vara på parametertestet eftersom de flesta parametriska testerna har större kraft i sådana situationer.

3. Icke-parametriska tester ger utan tvekan ett medel för att undvika antagandet om distributionens normalitet. Men dessa metoder gör ingenting för att undvika antagandena om självständighet på homoscedasticitet, när så är tillämpligt.

4. Beteendeforskare bör ange nollhypotesen, alternativ hypotes, statistiskt test, provtagningsfördelning och nivå av betydelse före insamling av data. Att jaga efter ett statistiskt test efter det att uppgifterna har samlats tenderar att maximera effekterna av eventuella chansskillnader som gynnar ett test över en annan.

Som ett resultat är möjligheten att avvisa nollhypotesen när den är sant (typ I-fel) kraftigt ökat. Denna försiktighet gäller dock lika med parametriska såväl som icke parametriska test.

5. Vi har inte problem med att välja statistiska tester för kategoriska variabler. Endast parametriska tester är lämpliga för uppräknande data.

6. F- och t-testen anses allmänt vara robusta test, eftersom överträdelsen av de underliggande antagandena inte ogiltigförklarar inferensen.

Det är vanligt att motivera användningen av ett normalt teorintest i en situation där normalitet inte kan garanteras, genom att hävda att den är robust under icke normalitet.

Några icke-parametriska test:

Vi kommer att diskutera några vanliga icke parametriska test.

1. Teckentest:

Teckentestet är det enklaste av all distributionsfri statistik och har en mycket hög nivå av allmänt användbarhet. Det är tillämpligt i situationer där det kritiska förhållandet, t, testet för korrelerade prover inte kan användas, eftersom antagandena om normalitet och homoscedasticitet inte är uppfyllda.

Eleverna är medvetna om att vissa villkor i experimentets inställning introducerar elementet i förhållandet mellan de två uppsättningarna av data.

Dessa förhållanden är i allmänhet en pre-test, post-test situation; ett test och omprövning testning av en grupp av ämnen på två test; bildandet av "matchade grupper" genom att para ihop några externa variabler som inte är föremål för utredning, men som kan påverka observationerna.

I teckentest testar vi signifikansen av tecken på skillnad (som plus eller minus). Detta test tillämpas när N är mindre än 25.

Följande exempel kommer att göra oss klart om teckentest:

Exempel:

Poängerna utsätts ofta under två olika förhållanden, A och B ges nedan. Applicera teckentest och testa hypotesen att A är överlägsen B.

Exklusive 0 (noll) har vi nio skillnader varav sju är plus.

Vi måste nu expandera binomialet, (p + q) ⁹

(p + q) ⁹ = p ⁹ + 9p ⁸ q + 36p ⁷ q ² + 84p ⁶ q ³ + 126 p ⁵ q ⁴ + 126 p ⁴ q ⁵ + 84p ³ q ⁶ + 36 p ² q ⁷ + 9 pq ⁸ + q ⁹ .

Det totala antalet kombinationer är 2 ⁹ eller 512. Vi har totalt 46 kombinationer (dvs. 1 av 9, 9 av 8), som lägger till de första 3 termerna (nämligen p ⁹ + 9p ⁸ q + 36 p ⁷ q ² )., och 36 av 7) som innehåller 7 eller flera plustecken.

Några 46 gånger i 512 försök 7 eller fler plus tecken utöver 9 kommer att inträffa när medelvärdet av + tecken under nullhypotesen är 4, 5. Sannolikheten för 7 eller fler + tecken är därför 46/512 eller09 och är tydligt inte signifikant.

Detta är ett-tailed test eftersom vår hypotes säger att A är bättre än B. Om hypotesen i början hade varit att A och B skiljer sig från utan att ange vilken som är överlägsen, skulle vi ha haft ett 2-tailed test för vilket P = 0, 18.

Tabeller finns tillgängliga som ger antalet tecken som är nödvändiga för betydelse på olika nivåer, när N varierar i storlek. När antalet par är så stora som 20 kan den normala kurvan användas som en approximation till binomialexpansionen eller det använda x ^2- testet.

2. Mediantest:

Medianprovet används för att jämföra prestanda för två oberoende grupper som till exempel en experimentell grupp och en kontrollgrupp. Först kastas de två grupperna och en gemensam median beräknas.

Om de två grupperna har dragits slumpmässigt från samma population, bör 1/2 av poängen i varje grupp ligga över och 1/2 under den gemensamma medianen. För att testa den här nollhypotesen måste vi utarbeta ett 2 x 2 bord och beräkna x ² .

Metoden visas i följande exempel:

Exempel:

En klinisk psykolog vill undersöka effekterna av ett lugnande läkemedel vid handskakning. Fjorton psykiatriska patienter ges läkemedlet, och 18 andra patienter ges en ofarlig dos. Den första gruppen är den experimentella, den andra kontrollgruppen.

Ökar läkemedlet stabilitet - vilket framgår av lägre poäng i försöksgruppen? Eftersom vi bara är oroade om drogen minskar tremor, är det ett ett-tailed test.

Mediantest applicerat på experimentella och kontrollgrupper. Plus-tecken indikerar poäng över den gemensamma medianen, minus teckenvärden under den gemensamma medianen.

N = 14 N = 18

Vanlig median = 49, 5

Den gemensamma medianen är 49, 5. I försöksgruppen 4 är poängen över och 10 under den gemensamma medianen istället för de 7 ovan och 7 nedan för att förväntas av en slump. I kontrollgruppen är 12 poäng över och 6 under den gemensamma medianen istället för de förväntade 9 i varje kategori.

Dessa frekvenser anges i följande tabell och X ² beräknas med formeln (anges nedan) med korrigering för kontinuitet:

AX ² c av 3, 17 med 1 frihetsgrad ger ap som ligger vid .08 ungefär halvvägs mellan .05 och .10. Vi ville veta om medianen i försöksgruppen var signifikant lägre än kontrollen (vilket indikerar mer stabilitet och mindre tremor).

För denna hypotes är ett ett-tailed test, p / 2, ungefär .04 och X2c är signifikant vid 0, 5-nivån. Hade vår hypotes varit att de två grupperna skiljer sig åt utan att ange riktningen, vi skulle ha haft ett tvåstansstest och X ² skulle ha markerats inte signifikant.

Vår slutsats, gjorde något försiktigt, är att läkemedlet ger en viss reduktion i tremor. Men på grund av de små proverna och avsaknaden av ett mycket betydelsefullt resultat skulle klinisk psykolog nästan helt säkert upprepa experimentet - kanske flera gånger.

X ² är generellt tillämplig i medianprovet. Men när N ₁ och N ₂ är små (t.ex. mindre än ca 10) och X ^2- testet inte är korrekt och den exakta metoden för beräkning av sannolikheter ska användas.

Fördelar med icke-parametriska test:

1. Om provstorleken är mycket liten kan det inte vara något alternativ att använda ett icke-parametriskt statistiskt test om inte befolkningens fördelning är känd exakt.

2. Icke-parametriska tester gör vanligtvis färre antaganden om data och kan vara mer relevanta för en viss situation. Dessutom kan hypotesen som testas av det icke parametriska testet vara mer lämpligt för forskningsundersökningen.

3. Icke-parametriska statistiska tester är tillgängliga för att analysera data som är iboende i led samt data vars uppenbara numeriska poäng har styrkan i led. Det vill säga att forskaren bara kan säga om sina ämnen att man har mer eller mindre karaktäristiska än en annan, utan att kunna säga hur mycket mer eller mindre.

Exempelvis kan vi, när vi studerar en sådan variabel som ångest, kunna säga att ämnet A är mer angeläget än ämne B utan att veta alls hur mycket mer angelägen A är.

Om uppgifterna i sig är i rang eller om de bara kan kategoriseras som plus eller minus (mer eller mindre, bättre eller sämre), kan de behandlas med icke parametriska metoder, medan de inte kan behandlas med parametriska metoder, såvida inte osäkra och, kanske görs orealistiska antaganden om de underliggande fördelningarna.

4. Icke-parametriska metoder är tillgängliga för att behandla data som helt enkelt klassificerande eller kategoriska, dvs mäts i nominell skala. Ingen parametrisk teknik gäller för sådan data.

5. Det finns lämpliga icke-parametriska statistiska test för att behandla prover som består av observationer från flera olika populationer. Parametriska tester kan ofta inte hantera sådana data utan att kräva att vi gör till synes orealistiska antaganden eller kräver tunga beräkningar.

6. Icke-parametriska statistiska tester är vanligtvis mycket enklare att lära och att tillämpa än parametriska tester. Dessutom är deras tolkning ofta mer direkt än tolkningen av parametriska test.

Nackdelar med icke-parametriska test:

1. Om alla antaganden av en parametrisk statistisk metod faktiskt uppfylls i data och forskningshypotesen kan testas med ett parametertest, är icke-parametriska statistiska test slöseri.

2. Graden av slöseri uttrycks av effekten av det icke parametriska testet.

3. En annan invändning mot icke-parametriska statistiska tester är att de inte är systematiska, medan parametriska statistiska tester har systematiserats, och olika tester är helt enkelt variationer på ett centralt tema.

4. En annan invändning mot icke-parametriska statistiska tester har att göra med bekvämligheten. Tabeller som krävs för att genomföra icke parametriska test sprids i stor utsträckning och visas i olika format.