Korrelation: Betydelse, Typer och Beräkning

Efter att ha läst den här artikeln kommer du att lära dig om: - 1. Definitioner av korrelation 2. Betydelse av korrelation 3. Behövs 4. Typer 5. Metoder för databehandling.

Definitioner av korrelation:

Om förändringen i en variabel tycks åtföljas av en ändring i den andra variabeln sägs de två variablerna vara korrelerade och detta ömsesidiga beroende kallas korrelation eller kovariation.

Kort sagt kallas tendensen för samtidig variation mellan två variabler korrelation eller kovariation. Till exempel kan det finnas en relation mellan höjder och vikter hos en grupp studenter, poängen av elever i två olika ämnen förväntas ha ett ömsesidigt beroende eller förhållande mellan dem.

För att mäta graden av relation eller kovariation mellan två variabler är föremålet för korrelationsanalys. Korrelation betyder således förhållandet eller "sammankomst" eller korrespondens mellan två variabler.

I statistik är korrelation en metod för att bestämma korrespondens eller proportionalitet mellan två serier av åtgärder (eller poäng). För att uttrycka det enkelt indikerar korrelationen förhållandet mellan en variabel och den andra.

Betydelsen av korrelation:

För att mäta graden av association eller förhållande mellan två variabler kvantitativt används ett relationsförhållande och benämns som koeffektiv av korrelation.

Samverkan av korrelation är ett numeriskt index som berättar i vilken utsträckning de två variablerna är relaterade och i vilken utsträckning variationerna i en variabel förändras med variationerna i den andra. Samverkan av korrelation symboliseras alltid med antingen r eller p (Rho).

Uttrycket "r" är känt som korrelationskoefficient för produktmoment eller Karl Pearsons korrelationskoefficient. Symbolen 'ρ' (Rho) är känd som Rank Difference Correlation-koefficient eller Spearmans Rank Correlation Coefficient.

Storleken på ' r ' anger beloppet (eller graden eller omfattningen) av korrelations-skeppet mellan två variabler. Om korrelationen är positiv är värdet av ' r ' + ve och om korrelationen är negativ är värdet av V negativt. Således anger tecken på koefficienten typen av relation. Värdet på V varierar från +1 till -1.

Korrelationen kan variera mellan perfekt positiv korrelation och perfekt negativ korrelation. Överst i skalan indikerar perfekt positiv korrelation och den kommer att börja från +1 och då kommer den att gå igenom noll, vilket indikerar fullständig frånvaro av korrelation.

Skalets botten slutar vid -1 och det kommer att indikera perfekt negativ korrelation. Sålunda tillhandahålls numerisk mätning av korrelationen av skalan som går från +1 till -1.

[NB-Korrelationskoefficienten är ett tal och inte en procentandel. Den är generellt rundad upp till två decimaler].

Behov av korrelation:

Korrelation ger mening till en konstruktion. Korrelationsanalys är avgörande för grundläggande psyko-pedagogisk forskning. Faktum är att den mesta av den grundläggande och tillämpade psykologiska forskningen är korrelationell i naturen.

Korrelationsanalys krävs för:

(i) Att hitta egenskaper hos psykologiska och pedagogiska test (tillförlitlighet, validitet, objektanalys etc.).

(ii) Testa om vissa data överensstämmer med hypotesen.

(iii) Förutsägande en variabel utifrån kunskapen om de andra (erna).

(iv) Att bygga psykologiska och pedagogiska modeller och teorier.

(v) Gruppering av variabler / åtgärder för parsimonisk tolkning av data.

(vi) Genomförande av multivariata statistiska test (Hoteling's T 2, MANOVA, MANCOVA, Diskriminantanalys, Factor Analysis).

(vii) Isolerande påverkan av variabler.

Typer av korrelation:

I en bivariatfördelning kan korrelationen vara:

1. Positiv, negativ och nollkorrelation; och

2. Linjär eller Curvilinear (icke-linjär).

1. Positiv, negativ eller nollkorrelation:

När ökningen i en variabel (X) följs av en motsvarande ökning i den andra variabeln (Y); korrelationen sägs vara positiv korrelation. De positiva korrelationerna sträcker sig från 0 till +1; den övre gränsen, dvs +1 är den perfekta positiva koefficienten för korrelation.

Den perfekta positiva korrelationen anger att för varje enhet ökar i en variabel är det proportionellt ökat i det andra. Till exempel "Värme" och "Temperatur" har en perfekt positiv korrelation.

Om å andra sidan ökningen i en variabel (X) resulterar i en motsvarande minskning i den andra variabeln (Y), sägs korrelationen vara negativ korrelation.

Den negativa korrelationen varierar från 0 till -1; den nedre gränsen ger den perfekta negativa korrelationen. Den perfekta negativa korrelationen indikerar att för varje enhet ökar i en variabel, är det en proportionell minskning av enheten i den andra.

Nollkorrelation betyder inget förhållande mellan de två variablerna X och Y; dvs förändringen i en variabel (X) är inte associerad med förändringen i den andra variabeln (Y). Till exempel kroppsvikt och intelligens, sko storlek och månadslön; etc. Nollkorrelationen är mittpunkten i intervallet - 1 till + 1.

2. Linjär eller kurvlinjig korrelation:

Linjär korrelation är förhållandet mellan förändring mellan de två variablerna antingen i samma riktning eller motsatt riktning och den grafiska representationen av en variabel med avseende på andra variabler är rak linje.

Tänk på en annan situation. Först ökar den andra variabeln med ökningen av en variabel proportionellt upp till en viss punkt; Efter det med en ökning av den första variabeln börjar den andra variabeln minska.

Den grafiska representationen av de två variablerna kommer att vara en krökt linje. Ett sådant förhållande mellan de två variablerna benämns den kröklinjiga korrelationen.

Metoder för beräkning av korrelationens effektivitet:

I lättheten av ogrupperad data för bivariatfördelning används följande tre metoder för att beräkna värdet av koefficienten för korrelation:

1. Scatterdiagrammetod.

2. Pearson Produkt Moment Coefficient of Correlation.

3. Spearmans Rank Order Coefficient of Correlation.

1. Scatterdiagrammetod:

Scatterdiagram eller punktdiagram är en grafisk enhet för att dra vissa slutsatser om korrelationen mellan två variabler.

Vid framställning av ett scatterdiagram ritas de observerade observationsparen av prickar på ett grafpapper i ett tvådimensionellt utrymme genom att ta mätningarna på variabel X längs den horisontella axeln och den på variabel Y längs den vertikala axeln.

Placeringen av dessa prickar i diagrammet visar förändringen i variabeln om de ändras i samma eller i motsatta riktningar. Det är en mycket enkel, enkel men grov metod för att beräkna korrelation.

Frekvenserna eller punkterna är ritade på ett diagram genom att använda lämpliga vågar för de två serierna. De plottade punkterna tenderar att koncentrera sig i ett band med större eller mindre bredd beroende på graden. "Den bästa passformen" ritas med en fri hand och dess riktning indikerar korrelationens karaktär. Scatterdiagram, som ett exempel, visar olika grader av korrelation visas i figur 5.1 och figur 5.2.

Om linjen går uppåt och denna uppåtgående rörelse är från vänster till höger kommer den att visa positiv korrelation. På samma sätt, om linjerna rör sig nedåt och dess riktning är från vänster till höger, kommer det att visa negativ korrelation.

Graden av sluttning kommer att indikera graden av korrelation. Om de plottade punkterna sprids i stor utsträckning kommer det att visa att det inte finns någon korrelation. Denna metod beskriver bara "faktumet" att korrelationen är positiv eller negativ.

2. Pearsons Produkt Moment Coefficient of Correlation:

Korrelationskoefficienten r kallas ofta "Pearson r" efter professor Karl Pearson som utvecklade produkt-moment-metoden, efter det tidigare arbetet i Gallon och Bravais.

Korrelationskoefficient som förhållande:

Korrelationsprodukt-momentkoefficienten kan anses väsentligen som det förhållandet som uttrycker i vilken utsträckning förändringar i en variabel åtföljs av eller beroende av förändringar i en andra variabel.

Som en illustration, överväga följande enkla exempel som ger de parade höjderna och vikterna hos fem studenter:

Den genomsnittliga höjden är 69 tum, den genomsnittliga vikten 170 pund och o är 2, 24 tum och o är 13, 69 pund respektive. I kolumnen (4) anges avvikelsen (x) för varje elevs höjd från medelhöjden och i kolumn (5) avvikelsen (y) för varje elevs vikt från medelvikten. Produkten av dessa parade avvikelser (xy) i kolumn (6) är ett mått på överenskommelsen mellan individuella höjder och vikter. Ju större summan av xy-kolumnen desto högre grad av korrespondens. I ovanstående exempel är värdet av Σxy / N 55/5 eller 11. Om perfekt överenskommelse, dvs r = ± 1, 00, överskrider värdet på Σ xy / N maxgränsen.

Således skulle Σ xy / N inte ge ett lämpligt mått på förhållandet mellan x och y. Anledningen är att ett sådant medel inte är en stabil åtgärd, eftersom den inte är oberoende av de enheter där höjd och vikt har uttryckts.

Följaktligen kommer detta förhållande att variera om centimeter och kilo används istället för tum och pund. Ett sätt att undvika besväret - en del av skillnader i enheter är att uttrycka varje avvikelse som ett σ-poäng eller standardpoäng eller Z-poäng, dvs att dela upp varje x och y med egen σ.

Varje x- och y-avvikelse uttrycks sedan som ett förhållande och är ett rent tal oberoende av testenheterna. Summan av produkterna i σ-poängkolumnen (9) dividerad med N ger ett förhållande som är ett stabilt uttryck för förhållandet. Detta förhållande är korrelationskoefficienten "produkt-moment". I vårt exempel anger dess värde på .36 en ganska hög positiv korrelation mellan höjd och vikt i detta lilla prov.

Eleven bör notera att vårt förhållande eller koefficient är helt enkelt den genomsnittliga produkten av σ poängen av motsvarande X- och Y-mått, dvs

Typ av r xy :

(i) r xy är ett produkt moment r

(ii) r xy är ett förhållande, = r xy .

(iii) r xy kan vara + ve eller - ve bunden av gränser - 1, 00 till + 1, 00.

(iv) r xy kan betraktas som ett aritmetiskt medelvärde (r xy är medelvärdet av standardvärdesprodukter).

(v) r xy påverkas inte av någon linjär transformation av poäng på antingen X eller Y eller båda.

(vi) När variabler finns i standardpoängformen ger r ett mått på den genomsnittliga förändringsmängden i en variabel som hör samman med ändringen av en enhet den andra variabeln.

(vii) r xy = √b yx b xy där b yx = regressionskoefficienten Y på X, b xy = regressionskoefficienten X på Y. r xy = kvadratroten av regressionslinjens sluttningar.

(Viii) r xy påverkas inte av medelstorleken (poängen är alltid relativ).

(Ix) r xy kan inte beräknas om någon av variablerna inte har någon varians S 2 x eller S 2 Y = 0

(x) r xy av 60 innebär samma storleksförhållande som r xy = - .60. Tecknet berättar om förhållandets riktning och storheten om förhållandet i förhållandet.

(xi) df för r xy är N - 2, som används för att testa betydelsen av r xy . Att testa betydelsen av r testar signifikans av regression. Regressionslinjen involverar lutning och avlyssning, varför 2 df går förlorad. Så när N = 2, r xy är antingen + 1, 00 eller -1, 00 eftersom det inte finns någon frihet för provtagningsvariationen i det numeriska värdet av r.

A. Beräkning av r xy (oupphörig data) :

Här, med hjälp av formeln för beräkning av r beror på "varifrån avvikelserna tas". I olika situationer kan avvikelser tas antingen från det verkliga medelvärdet eller från noll eller från AM Typ av formel som är lämpligt tillämpad för beräkning av koefficientkorrelation beror på medelvärde (antingen i fraktion eller hel).

(i) Formeln av r när avvikelser tas från medel för de två fördelningarna X och Y.

var r xy = Korrelation mellan X och Y

x = avvikelse från något X-poäng från medelvärdet i testet X

y = avvikelse från motsvarande Y-poäng från medelvärdet i test Y.

Σxy = Summan av alla produkter med avvikelser (X och Y)

σ x och σ y = Standardavvikelser för fördelningen av X- och Y-poäng.

där x och y är avvikelser från det faktiska medlet och Σx 2 och Σy 2 är summan av kvadrerade avvikelser i x och y tagna från de två organen.

Denna formel föredras:

jag. När medelvärdena för båda variablerna inte är i fraktion.

ii. När ska man ta reda på korrelation mellan korta, ogrupperade serier (säg tjugofem fall eller så).

III. När avvikelser ska tas från faktiska medel för de två fördelningarna.

De steg som krävs är illustrerade i tabell 5.1. De är här uppräknade:

Steg 1:

Ange i parallella kolumner de parade X- och Y-poängen, se till att motsvarande poäng är tillsammans.

Steg 2:

Bestäm de två medlen Mx och M y . I tabell 5.1 är dessa 7, 5 respektive 8, 0.

Steg 3:

Bestäm för varje par poäng de två avvikelserna x och y. Kontrollera dem genom att hitta algebraiska summor, vilket borde vara noll.

Steg 4:

Kvadrata alla avvikelser och lista i två kolumner. Detta är för att beräkna σ x och σ y .

Steg 5:

Summa kvadraterna för avvikelserna för att erhålla Σx 2 och Σy 2 Hitta xy-produkt och summera dessa för Σxy.

Steg 6:

Beräkna σ x och σ y från dessa värden.

En alternativ och kortare lösning:

Det finns en alternativ och kortare väg som utesluter beräkningen av σ x och σ y, om de inte behövs för något annat syfte.

Användning av formel (28):

(ii) Beräkningen av r xy från Originalscores eller Raw poäng:

Det är ett annat förfarande med ogrupperad data, som inte kräver användning av avvikelser. Det handlar helt och hållet om ursprungliga poäng. Formeln kan se förbud men är väldigt lätt att applicera.

Denna formel föredras:

jag. När ska man räkna r från direkta råa poäng.

ii. Originalscore ft. När data är små grupperade.

III. När medelvärden är i fraktioner.

iv. När god beräkningsmaskin finns tillgänglig.

X och Y är ursprungliga poäng i variablerna X och Y. Andra symboler berättar vad som är gjort med dem.

Vi följer stegen som illustreras i tabell 5.2:

Steg 1:

Kvadrat alla X och Y mätningar.

Steg 2:

Hitta XY-produkten för varje par poäng.

Steg 3:

Summa X, Y, X 2, Y 2 och XY.

Steg 4:

Applicera formel (29):

(ii) Beräkning av r xy när avvikelser tas från antagande medelvärde:

Formeln (28) är användbar vid beräkning av r direkt från två icke grupperade serier av poäng, men den har nackdelarna eftersom den kräver "lång metod" för beräkningsorganen och σ s. Avvikelserna x och y när de tas från de faktiska medlen är vanligtvis decimaler och multipliceringen och kvadrering av dessa värden är ofta en tråkig uppgift.

Av denna anledning - även när man arbetar med korta grupperade serier - är det ofta lättare att anta medel, beräkna avvikelser från dessa AM och tillämpa formeln (30).

Denna formel föredras:

jag. När faktiska medel är vanligtvis decimaler och multiplicering och kvadrering av dessa värden är ofta en tråkig uppgift.

ii. När avvikelser tas från AM: s.

III. När vi ska undvika fraktioner.

Stegen i beräkningen r kan beskrivas enligt följande:

Steg 1:

Hitta medelvärdet av Test 1 (X) och medelvärdet av Test 2 (Y). Medlen som visas i Tabell 5.3 M X = 62.5 respektive M Y = 30.4.

Steg 2:

Välj AM av både X och Y, dvs AM X som 60.0 och AM Y som 30.0.

Steg 3:

Hitta avvikelsen för varje poäng på Test 1 från dess AM, 60.0 och skriv in den i kolumn x '. Därefter hitta avvikelsen för varje poäng i test 2 från dess AM, 30.0 och skriv in den i kolumn y '.

Steg 4:

Kvadratera alla x 'och alla de' och ange dessa rutor i kolumn x ' 2 respektive y' 2 . Summa dessa kolumner för att få Σx ' 2 och Σy' 2 .

Steg 5:

Multiplicera x 'och y' och skriv in dessa produkter (med vederbörlig hänsyn till tecken) i x'y-kolumnen. Summa x'y 'kolumn, med hänsyn till tecken, för att få Σx'y'.

Steg 6:

Korrigeringarna, C x och C y, hittas genom att subtrahera AM X från M x och AM y från M y . Sedan hittades C x som 2, 5 (62, 5 - 60, 0) och C y som .4 (30, 4 - 30, 0).

Steg 7:

Ersätt Σx'y ', 334, för Σx' 2, 670 och för Σy ' 2, 285 i formel (30), som visas i tabell 5.3 och lösa för r xy.

Egenskaper hos r :

1. Värdet av korrelationskoefficienten r förblir oförändrat när en konstant läggs till i en eller båda variablerna:

För att observera effekten på koefficientkorrelationen r när en konstant läggs till en eller båda variablerna, betraktar vi ett exempel.

Nu lägger vi till en poäng på 10 till varje poäng i X och 20 till varje poäng på Y och representerar dessa poäng med X 'respektive Y'.

Beräkningarna för beräkning r för ursprungliga och nya observationspar är angivna i tabell 5.4:

Med hjälp av formel (29) kommer korrelationskoefficienten för originalvärdet att vara:

Samma formel för nya poäng kan skrivas som:

Således noterar vi att värdet av koefficienten för korrelation r förblir oförändrad när en konstant läggs till en eller båda variablerna.

2. Värdet på korrelationskoefficienten r förblir oförändrad när en konstant subtraheras från en eller båda variablerna:

Eleverna kan undersöka detta genom att ta ett exempel. När varje poäng av en eller båda variablerna subtraheras med en konstant förblir värdet av korrelationskoefficienten r också oförändrad.

3. Värdet på koefficienten för korrelation r förblir oförändrat när en eller båda uppsättningarna av variabelvärden multipliceras med en viss konstant:

För att observera effekten av att multiplicera variablerna med någon konstant på värdet av r multiplicerar vi godtyckligt de ursprungliga poängen av första och andra uppsättningar i föregående exempel med 10 respektive 20.

R mellan X 'och Y' kan sedan beräknas som under:

Korrelationen mellan koefficienten X 'och Y' kommer att vara:

Således observerar vi att värdet av koefficienten för korrelation r förblir oförändrad när en konstant multipliceras med en eller båda uppsättningar av variativa värden.

4. Värdet på r kommer att förbli oförändrat även om en eller båda uppsättningarna av variativa värden delas med en viss konstant:

Eleverna kan undersöka detta genom att ta ett exempel.

B. Korrelationskoefficient i grupperade data :

När antalet mätvärden (N) på två variabler X och Y är stora, till och med måttliga i storlek och när ingen beräkningsmaskin är tillgänglig är det vanliga förfarandet att gruppera data i både X och Y och att bilda ett scatterdiagram eller korrelationsdiagram som även kallas tvåvägsfrekvensfördelning eller bivariatfrekvensfördelning.

Valet av klassintervallets storlek och gränserna för intervaller följer ungefär samma regler som tidigare givits. För att klargöra idén betraktar vi en bivariate data som berörs av poängen som erhållits av en klass på 20 studenter i fysik och matematik.

Förbereda ett scatterdiagram:

Vid upprättandet av en dubbel gruppering av data utarbetas ett bord med kolumner och rader. Här klassificerar vi varje par variabler samtidigt i de två klasserna, en representerande poäng i fysik (X) och den andra i matematik (Y) som visas i tabell 5.6.

Resultatet av 20 studenter i både fysik (X) och matematik (Y) visas i tabellen nedan:

Vi kan enkelt förbereda ett bivariat frekvensdistributionstabell genom att lägga tallies för varje par poäng. Byggandet av ett scattergram är ganska enkelt. Vi måste förbereda ett bord enligt bilden ovan.

Längs vänstra marginalen avgränsas klassintervallet för X-fördelningen från botten till toppen (i stigande ordning). Längst upp i diagrammet läggs c.i av Y-fördelningen från vänster till höger (i stigande ordning).

Varje par av poäng (både i X och Y) representeras genom ett tal i respektive cell. Nr 1-student har säkrat 32 i fysik (X) och 25 i matematik (Y). Hans poäng på 32 i (X) placerar honom i sista raden och 25 i (Y) placerar honom i andra kolumnen. Så för paret av poäng (32, 25) kommer en tally att markeras i den andra kolumnen i femte raden.

På liknande sätt, i händelse av nr 2-student, för poäng (34, 41) ska vi sätta in i den fjärde kolumnen i femte raden. På samma sätt läggs 20 tallrikar i respektive rader och kolumner. (Raderna representerar X-poäng och kolumnerna representerar Y-poängen).

Längst till höger marginal är fx- kolumnen, antalet fall i varje ci, av X-fördelningen tabulerade och längst ner på diagrammet i fy raden är antalet fall i varje ci av Y-fördelningen tabulerade.

Summan av fx kolumnen är 20 och summan av fy raden är också 20. Det är faktiskt en bi-variabel fördelning eftersom den representerar gemensam fördelning av två variabler. Scattergrammet är då en "korrelationstabell".

Beräkning av r från ett korrelationstabell:

Följande skiss över de steg som ska följas vid beräkningen r kommer bäst att förstås om studenten kontinuerligt kommer att hänvisa till Tabell 5.7 när han läser igenom varje steg:

Steg 1:

Konstruera ett scattergram för de två variablerna som ska korreleras, och utarbeta däri ett korrelationstabell.

Steg 2:

Räkna frekvenserna för varje ci av distributionen - X och skriv den i fx- kolumnen. Räkna frekvenserna för varje ci-fördelning - Y och fyll i fy- raden.

Steg 3:

Antag ett medelvärde för X-fördelningen och markera ci i dubbla linjer. I det givna korrelationstabellen, låt oss anta medelvärdet på ci, 40-49 och sätta dubbla linjer som visas i tabellen. Avvikelserna ovanför AM-linjen kommer att vara (+ ve) och avvikelserna under det blir (- ve).

Avvikelsen mot AM-linjen, dvs mot ci där vi antog medelvärdet är markerat 0 (noll) och ovanför är d : s noterade som +1, +2. 13 och under det är d noterat att vara - 1. Nu är dx-kolonnen fylld. Multiplicera sedan fx . och dx i varje rad för att få fdx . Multiplicera dx och fdx i varje rad för att få fdx 2 .

[Obs: När du beräknar SD-värdet i den antagna medelvärdet antog vi ett medelvärde som markerade ds och datafunktionerna fd och fd 2 . Här följer också samma procedur.]

Steg 4:

Antag samma procedur som i steg 3 och beräkna dy, fdy och fdy 2 . För fördelningen -J, låt oss anta medelvärdet i ci 20-29 och sätta dubbla linjer för att avmarkera kolonnen som visas i tabellen. Avvikelserna till vänster om denna kolumn kommer att vara negativa och rätt vara positiva.

Således d för kolumnen där medelvärdet antas är markerat 0 (noll) och d till vänster är markerat - 1 och d till höger är markerade +1, +2 och +3. Nu dy kolumnen är fylld. Multiplicera värdena för fy och dy för varje kolumn för att få fdy . Multiplicera värdena för dy och fdy till varje kolumn för att få fdy 2 .

Steg 5:

Eftersom denna fas är en viktig, ska vi markera noggrant för beräkningen av dy för olika ci av distribution X och dx för olika ci-av-fördelning -Y.

dy för olika distributionskanaler - X: I första raden är 1 f under kolumnen 20-29 vars dy är 0 (Se till botten. Dy posten i denna rad är 0). Återigen är 1 f under kolumnen 40-49 vars dy är + 2. Så dy för första raden = (1 x 0) + (1 x 2) = + 2.

I den andra raden finner vi att:

1 f ligger under kolumnen 40-49 vars dy är + 2 och

2 f s ligger under kolumnen, 50-59 vars dy s är + 3 vardera.

dy för 2: a rad = (1 x 2) + (2 X 3) = 8.

I den tredje raden,

2 f s ligger under kolumnen, 20-29 vars dy är 0 vardera,

2 f s ligger under kolumnen 40-49 vars dy är +2 vardera och 1 f ligger under kolumnen 50-59 vars dy är +3.

Så dy för tredje raden = (2 x 0) + (2 x 2) + (1 X 3) = 7.

I fjärde raden,

3 f s ligger under kolumnen, 20-29 vars dy är 0 vardera,

2 f s ligger under kolumnen 30-39 vars dy är +1 vardera och 1 f ligger under kolumnen 50-59 vars dy är + 3,

dy för fjärde raden = (3 X 0) + (2 X 1) + (1 x 3) = 5.

På samma sätt i 5: e raden

dy för 5: e raden = (2 x - 1) + (1 x 0) + (1 x 2) = 0

dx för olika ci, 'v för distributionen - Y:

I den första kolumnen,

2 f s är mot raden, 30-39 vars dx är - 1.

dx i den första kolumnen = (2 x - 1) = - 2

I den andra kolumnen,

1 f är mot ci, 70-79, vars dx är +3,

2 f s är emot ci, 50-59 vars dx s är +1 vardera,

3 f s är emot ci, 40-49 vars dx s är 0 vardera,

1 f är mot ci, 30-39 vars dx är - 1.

dx för den andra kolumnen = (1 x 3) + (2 X 1) + (3 X 0) + (1 x - 1) = 4. I den tredje kolumnen,

dx för 3: e kolumnen = 2 × 0 = 0

I den fjärde kolumnen,

dx för den 4: e kolumnen = (1 x 3) + (1 x 2) + (2 x 1) + (1 x - 1) = 6.

I den femte kolumnen,

dx för 5: e kolumnen = (2 x 2) + (1 x 1) + (1 X 0) = 5.

Steg 6:

Beräkna nu dx.dy varje rad - X genom att multiplicera dx- posterna i varje rad med dy poster i varje rad. Beräkna sedan dx.dy för varje fördelningskolonn - Y genom att multiplicera dyposter för varje kolumn med dx- posterna i varje kolumn.

Steg 7:

Ta nu den algebraiska summan av värdena för kolumnerna fdx, fdx 2, dy och dx.dy (för distribution - X). Ta den algebraiska summan av värdena på raderna fdy, fdy 2, dx och dx.dy (för distribution - Y)

Steg 8:

Σ. dx.dy av X-distribution = Σ dx.dy av Y-distribution

Σ fdx = totalt dx rad (dvs Σ dx )

Σ fdy = summan av dy kolumnen (dvs Σ dy )

Steg 9:

Symbolernas värden som hittades

Σ fdx = 13, Σ fd 2 x = 39

Σ fdy = 22, Σ fd 2 y = 60

Σ dx.dy = 29 och N = 20.

För att beräkna korrelationskoefficienten i ett korrelationstabell kan följande formel tillämpas:

Vi kan markera det i nämnaren av formel (31) tillämpar vi formeln för en x och en y med undantag för nej jag. Vi noterar här att C x, C y, σ x, σ v uttrycks i enheter av klassintervaller (dvs. i enhet av i). Således, när man använder σ x och σ y, används inga i. Detta är önskvärt eftersom alla produktavvikelser, dvs, Σ dx.dy ' s är i intervallenheter.

Således beräknar vi:

Tolkning av korrelationskoefficienten:

Bara beräkning av korrelation har ingen betydelse förrän och om vi inte bestämmer hur stor måste koefficienten vara för att vara signifikant och vad säger korrelation oss om data? Vad menar vi med det erhållna värdet av korrelationskoefficienten?

Feltolkning av korrelationsfaktorn:

Ibland misstolkar vi värdet av korrelationskoefficienten och etablerar orsak och effekt-förhållandet, dvs en variabel som orsakar variationen i den andra variabeln. Vi kan faktiskt inte tolka på det här sättet om vi inte har en bra logisk bas.

Korrelationskoefficienten ger oss en kvantitativ bestämning av graden av förhållandet mellan två variabler X och Y, inte information om typen av samband mellan de två variablerna. Orsak innebär en oföränderlig sekvens - A leder alltid till B, medan korrelation helt enkelt är ett mått på ömsesidig koppling mellan två variabler.

Till exempel kan det finnas en hög korrelation mellan missanpassning och ångest:

Men på grundval av hög korrelation kan vi inte säga att felanpassning orsakar ångest. Det kan vara möjligt att hög ångest är orsaken till felanpassning. Detta visar att missanpassning och ångest är ömsesidigt associerade variabler. Tänk på ett annat exempel.

Det finns en hög korrelation mellan kompetens inom ett ämne i skolan och prestationen i ämnet. I slutet av skolans undersökningar kommer detta att spegla orsakssamband? Det kan eller kanske inte.

Aptitude i studien av ämnet orsakar definitivt variation i ämnets uppnådda, men hög uppnåelse av den studerande i ämnet är inte bara resultatet av den höga förmågan. det kan också bero på de andra variablerna.

Vid tolkning av korrelationskoefficientens storlek med avseende på orsak och effekt är det därför lämpligt om och endast om de variabler som undersöks ger en logisk grund för sådan tolkning.

Faktorer som påverkar storleken på korrelationskoefficienten:

Vi bör också vara medvetna om följande faktorer som påverkar korrelationskoefficientens storlek och kan leda till fel tolkning:

1. Storleken på "r" är mycket beroende av variabiliteten av uppmätta värden i det korrelerade provet. Ju större variabilitet desto högre blir korrelationen, allt annat är lika.

2. Storleken på 'r' ändras när en utredare väljer en extrem grupp av ämnen för att jämföra dessa grupper med avseende på vissa beteenden. "R" erhållen från de kombinerade data från extrema grupper skulle vara större än "r" erhållet från ett slumpmässigt prov av samma grupp.

3. Lägga till eller släppa de extrema fallen från gruppen kan leda till förändring på storleken av "r". Tillägg av det extrema fallet kan öka storleken på korrelationen, medan släppa de extrema fallen sänker värdet på "r".

Användning av produkt moment r:

Korrelation är ett av de mest använda analytiska förfarandena inom pedagogisk och psykologisk mätning och utvärdering. Det är användbart i:

jag. Beskriv graden av korrespondens (eller förhållande) mellan två variabler.

ii. Prediktion av en variabel - den beroende variabeln på basis av oberoende variabel.

III. Validera ett test; t.ex. ett gruppintelligensprov.

iv. Bestämning av testets grad av objektivitet.

v. Utbildning och yrkesvägledning och beslutsfattande.

vi. Bestämning av testets tillförlitlighet och giltighet.

vii. Att bestämma rollen av olika korrelerar till en viss förmåga.

viii. Faktoranalyssteknik för bestämning av faktorbelastningen av de underliggande variablerna i mänskliga förmågor.

Förutsättningar för produktmomentet r :

1. Normal fördelning:

De variabler från vilka vi vill beräkna korrelationen ska normalt fördelas. Antagandet kan läggas från slumpmässig provtagning.

2. Linjäritet:

Produkt-moment korrelationen kan visas i rak linje som är känd som linjär korrelation.

3. Kontinuerlig serie:

Mätning av variabler på kontinuerliga serier.

4. Homoscedasticitet:

Det måste uppfylla tillståndet för homoscedasticitet (lika stor variation).

3. Spearmans Rank Correlation Coefficient:

Det finns vissa situationer inom utbildning och psykologi där föremålen eller individerna kan rankas och ordnas i ordning enligt merit eller färdighet i två variabler och när dessa 2 uppsättningar av led är covary eller har en överenskommelse mellan dem, mäter vi graden av relation genom rangkorrelation .

Återigen finns det problem där förhållandet mellan mätningarna är olinjärt och kan inte beskrivas av produkt-momentet r.

Till exempel, utvärderingen av en grupp studenter på grundval av ledarskapsförmåga, beställning av kvinnor i en skönhetskonkurrens, eleverna rankas i preferens eller bilderna kan rangordnas enligt deras estetiska värden. Anställda kan rankas av handledare på arbetsprestanda.

Skolbarn kan rankas av lärare om social anpassning. I sådana fall kan objekt eller individer rankas och ordnas i enlighet med merit eller kompetens på två variabler. Spearman har utvecklat en formel som heter Rank Correlation Coefficient för att mäta omfattningen eller graden av korrelation mellan 2 uppsättningar led.

Denna koefficient för korrelation betecknas med grekiska bokstaven ρ (kallad Rho) och ges som:

var, p = rho = Spearmans Rank Correlation Coefficient

D = Skillnad mellan parade led (i varje fall)

N = Totalt antal objekt / personer rankade.

Egenskaper för Rho (ρ):

1. I rangkorrelationskoefficienten baseras observationerna eller mätningarna av den bivariära variabeln på ordinalskalan i form av ledningar.

2. Koefficientens storlek påverkas direkt av storleken på rangskillnaderna.

(en) Om raderna är desamma för båda testen kommer varje rangskillnad att vara noll och i slutändan kommer D 2 att vara noll. Detta innebär att korrelationen är perfekt; dvs 1, 00.

(B) Om rangskillnaderna är mycket stora, och bråkdelen är större än en, blir korrelationen negativ.

Förutsättningar för Rho (p):

jag. N är liten eller data är dåligt skevda.

ii. De är fria eller oberoende av vissa egenskaper hos befolkningsfördelningen.

III. I många situationer används rankningsmetoder där kvantitativa mätningar inte är tillgängliga.

iv. Även om kvantitativa mätningar finns tillgängliga, ersätts ledningar för att minska aritmetiskt arbete.

v. Sådana test beskrivs som icke parametriska.

vi. I sådana fall består data av uppsättningar ordinaltal, 1: a, 3: e, .... Dessa ersätts med kortnummer 1, 2, 3, ........., N för beräkningsändamål. Substitutionen av kardinalen för ordinära tal förutsätter alltid lika intervall.

I. Beräkning av p från testresultat:

Exempel 1:

Följande data ger betyg av 5 studenter i matematik och generell vetenskap:

Beräkna korrelationen mellan de två serierna av testresultat enligt Rank Difference Method.

Värdet av korrelationskoefficienten mellan poäng i matematik och generell vetenskap är positiv och måttlig.

Steg för beräkning av Spearmans Co-efficacy of Correlation:

Steg 1:

Ange eleverna, namnen eller deras serienummer i kolumn 1.

Steg 2:

I kolumn 2 och 3 skriv betyg av varje elev eller individ i prov I och II.

Steg 3:

Ta en uppsättning poäng i kolumn 2 och tilldela en rang av 1 till högsta poäng, vilket är 9, en rang av 2 till nästa högsta poäng som är 8 och så vidare tills det lägsta poänget får en rang lika med N; vilket är 5

Steg 4:

Ta II-uppsättningen poäng i kolumn 3 och tilldela rank 1 till högsta poäng. I den andra uppsättningen är högsta poängen 10; därmed få rank 1. Nästa högsta poäng för B-elev är 8; därmed är hans rang 2. Rangen för student C är 3, rangen för E är 4 och rangordningen för D är 5.

Steg 5:

Beräkna skillnaden i röster för varje elev (kolumn 6).

Steg 6:

Kontrollera summan av skillnaderna som registrerats i kolumn 6. Det är alltid noll.

Steg 7:

Varje skillnad i rad av kolumn 6 är kvadrerad och registreras i kolumn 7. Hämta summan ΣD 2 .

Steg 8:

Sätt värdet på N och 2D 2 i formeln för Spearmans samverkande effekt av korrelation.

2. Beräkning från rankningsdata:

Exempel 2:

I en talkonkurrens bedömde Prof. Mehrotra och Prof. Shukla 10 elever. Deras bedömningar var i led, som presenteras nedan. Bestäm i vilken utsträckning deras domar var överens.

Värdet av samverkan av korrelation är + .83. Detta visar en hög grad av överenskommelse mellan de två domarna.

3. Beräkning av p (Rho) för bundna rader:

Exempel 3:

Följande data ger poängen av 10 elever på två provprov med en klyfta på 2 veckor i Trial I och Trial II.

Beräkna korrelationen mellan poängen av två försök med rangskillnadsmetod:

Korrelationen mellan försök I och II är positiv och mycket hög. Titta noggrant på de poäng som erhållits av de 10 studenterna på prov I och II i testet.

Finns någon speciell funktion i de poäng som erhållits av de 10 studenterna? Sannolikt kommer ditt svar att vara "ja".

I tabellen ovan i kolumn 2 och 3 hittar du att mer än en elev får samma poäng. I kolumn 2 får eleverna A och G samma poäng viz. 10. I kolumn 3 får eleverna A och B, C och F och G och J samma poäng, som är 16, 24 respektive 14.

Definitivt kommer dessa par att ha samma nivåer; känd som bundna rader. Proceduren för att tilldela raderna till de upprepade poängen är något annorlunda än de icke upprepade poängen.

Titta på kolumn 4. Student A och G har liknande poäng på 10 vardera och de har 6: e och 7: e rang i gruppen. I stället för att tilldela 6: e och 7: e rankningen har medelvärdet av de två rangerna, dvs 6, 5 (6 + 7/2 = 13/2), tilldelats var och en av dem.

Samma procedur har följts med avseende på poäng på Trial II. I detta fall uppstår band på tre ställen. Studerande C och F har samma poäng och får därigenom den genomsnittliga rankningen av (1 + 2/2 = 1, 5). Student A och B har rankposition 5 och 6; därmed tilldelas 5, 5 (5 + 6/2) rang varje. På samma sätt har student G och J tilldelats 7, 5 (7 + 8/2) rang varje.

Om värdena upprepas mer än två gånger kan samma procedur följas för att tilldela ledningarna:

Till exempel:

Om tre elever får en poäng på 10, vid 5: e, 6: e och 7: e rang, kommer varje en av dem att få en rang på 5 + 6 + 7/3 = 6.

Resten av procedurens steg som följs för beräkning av p (rho) är desamma som förklarades tidigare.

tolkning:

Värdet av ρ kan också tolkas på samma sätt som Karl Pearsons korrelationskoefficient. Det varierar mellan -1 och + 1. Värdet + 1 står för en perfekt positiv överenskommelse eller relation mellan två uppsättningar ledningar medan ρ = - 1 innebär ett perfekt negativt förhållande. I händelse av ingen relation eller överenskommelse mellan rang, värdet av ρ = 0.

Fördelar med Rank Difference Metod:

1. Spearmans Rank Order koefficient för korrelationsberäkning är snabbare och enklare än (r) beräknad av Pearson's Product Moment Method.

2. Det är en godtagbar metod om data är tillgängliga endast i ordinär form eller antal parade variabler är mer än 5 och inte större än 30 med minst eller några bindningar i led.

3. Det är ganska lätt att tolka p.

begränsningar:

1. När intervalldata omvandlas till rangordnade data försvinner informationen om storleken på poängskillnaderna; t ex i tabell 5.10, om D i prov II får poäng från 18 upp till 21, är hans rang bara 4.

2. Om antalet fall är mer, blir det ett tråkigt jobb att ge dem en rankning.