Koncept av Chi-Square-test

I denna artikel kommer vi att diskutera begreppet chi-square test.

Chi-kvadrattestet användes för att testa att alleler segregerar på Mendeliska principer. Det krävs en jämförelse mellan förväntade och observerade tal. Den används i statistik för att bedöma betydelsen av samplingsdata. Prof. Fisher utvecklade chi-square test. Symboliskt skrivet som X 2 (uttalas som Ki-square).

Det är en statistisk åtgärd med hjälp av vilken det är möjligt att bedöma betydelsen av skillnaden mellan det observerade genotypiska talet (frekvenser) och det förväntade antalet (frekvenser) som erhållits från ett hypotetiskt universum.

Huruvida det experimentella och förutsagda förhållandet är bra eller inte. Detta kan testas av Chi Square Test. Detta test bestämmer att under ett försöksprocedur som handlar om kvantitativa data kan viss variation, som kallas "experimentfel", tillskrivas riskfel ensam.

Detta kan beräknas med följande formel:

X 2 = Σ = (observerat värde - förväntat värde) 2 / förväntat värde

Låt oss ta exemplet av förhållandet mellan fenotyp och genotyp av experiment som utförs av Mendel. Genom att tillämpa X 2 visar resultaten att de observerade frekvenserna överensstämmer med de förutsagda förhållandena. Data från Mendeles faktiska experiment ges i följande tabell. Variationerna i det förväntade och förutsäga förhållandet beror på experimentellt fel ensamt.

Mendel observerade i sitt experiment förhållandet som 9: 3: 3: 1 i dihybridkors i F2-generationen medan förhållandet i monohybridkors i F2-generationen var 1: 2: 1. Han hittade 315 rundor, gula frön, 101 rundor, gröna frön, 108 rynkor, gula frön och 32 rynkor, gröna frön.

Så det förväntade antalet av varje fenotyp är 556 (9/16) = 312, 75 runda, gula frön; 556 (3/16) = 104, 25 runda. Gröna frön; 556 (3/16) = 104, 25 rynka, gula frön och 556 (1/16) = 34.75 rynka, gröna frön. Chi-kvadraten visar om skillnaden mellan det faktiska och det förväntade förhållandet beror på experimentellt fel eller inte.

Det beräknade Chi-kvadratvärdet är 0, 470, vilket får genom att appliceras med följande formel:

X 2 = Σ = (observerat värde - förväntat värde) 2 / förväntat värde

Graden av frihet krävs för beräkningen av X 2, antalet oberoende begränsningar bestämde antalet grader av frihet (eller df). Graden av frihet är ett mått på antalet oberoende variabler som är närvarande i ett givet experiment.

Det sägs att risken för fel endast påverkar en oberoende variabel. I Mendels-experimenten angivna ovan är variablerna endast 4 så graden av frihet är 4 -1 = 3. Antalet av tre fenotypiska klasser bestäms, numret på den fjärde klassen är fixerat.

För att ta reda på sannolikheten måste vi kontakta Chi-kvadratbordet.

Bordet ges som under:

Hypotesen överensstämmer aldrig eller inte med P-värdet. Resultaten av utredaren som är acceptabla eller oacceptabla med avseende på hypotesen, utvärderar resultaten av de Chi-kvadratiska observationerna. De 5 procentenheterna (0-05) på bordet brukar väljas som en godtycklig standard för att bestämma betydelsen eller godheten i passformen.

Tabellvärdet för X 2 för 3 grader av frihet vid 5% -nivån är 7, 82, ett chi-kvadratvärde är 0, 47 vilket är lägre än tabellvärdet, varför det är korrekt. Med andra ord kan det sägas att en sannolikhet vid 5% signifikansnivå är 7, 82 vilket är mer / större därför är hypotesen korrekt. Om det är mindre än 5%, avvisas sedan.

Låt oss ta ett annat exempel för att förstå tillämpningen av chi-square test. Genetisk teori säger att barn som har en förälder av blodtyp A och den andra av blodtyp B alltid kommer att vara av en av de tre typerna A, AB, B och att andelen av de tre typerna i genomsnitt kommer att vara som 1: 2 : 1. Ett prov på 300 barn samlades-30% visade sig vara typ A, 45% - typ AB och resten-typ B.

Tabellvärdet X 2 för (3 - 1) 2d.f. vid 5% (0, 05) nivå av betydelse är 5, 99. Det beräknade värdet av chi-kvadrat är 4, 5 vilket är mindre än tabellvärdet och kan hänföras till att ha skett på grund av experimentfelets chansfel. Detta stöder den teoretiska hypotesen om teorin om arv (segregering av alleler) att A, AB och B står i andelen 1: 2: 1.

Ett annat exempel i detta sammanhang är följande:

Andelen bönor i fyra grupper nämligen A, B, C och D bör vara 9: 3: 3: 1. En bonde sådde 1600 bönor. Resultaten av hans experiment visar att i fyra grupper är data 882, 313, 287 och 118. Stöder experimentresultatet teorin om att de är i förhållandet 9: 3: 3: 1?

Med nollhypotesen att experimentresultaten ger stöd för teorin är de förväntade frekvenserna:

9/10 x 1600, 3/16 x 1600, 3/16 x 1600, 1/16 x 1600 = 900 300 300 100

Således:

Tabellvärdet för X 2 för 3 df vid 5% signifikansnivå = 7 815.

Eftersom det beräknade värdet på X 2 är mindre än tabellvärdet kan hypotesen accepteras och resultaten är i linje med teorin.

Chi-kvadrattestet används också för att bestämma om befolkningen är i Hardy-Weinberg Equilibrium.

En användning av Hardy-Weinberg-metoden är att förutsäga frekvensen för individuell homozygot för en skadlig recessiv allel. Dessa författare har upptäckt att en slumpmässig population (panmictic) utan mutationer, inget urvalstryck, ingen genetisk drift och ingen migrering, tenderar de relativa frekvenserna för varje gen (allel) att förbli konstant från generation till generation.

Lagen berättar genotypfrekvenser till genfrekvenser i slumpmässiga parningspopulationer, allelerna som segregerar vid ett givet lokus kan enkelt beräkna de förväntade genotypfrekvenserna i den populationen. Detta kallas Hardy-Weinberg Law eller kallas ofta som lag för jämviktslagen.

När vi känner till allelernas frekvenser i befolkningen är det möjligt att beräkna de frekvenser med vilka genotypen kommer att finnas närvarande i avkomman från den generationen. Befolkningen av sexuellt reproducerande diploida organismer vid ett locus med två alleler vid frekvenserna p och q, efter en generation av slumpmässig parning, skulle genotypens frekvenser vara AA, Aa och aa kommer att vara p2, 2pq, q2.

Låt oss ta ett exempel på att två alleler av genen AA dominerar medan aa dvs allelen är recessiv gen. Enligt Mendels arvslagen skulle genotypförhållandet vara 25% AA (homozygot dominant), 50 skulle vara Aa (heterozygot) och 25% skulle vara aa (homozygot recessiv).

Den statistiska formeln för denna lag är p 2 + 2pq + q 2 . Enligt Mendels lagar bör följande vara genetisk kombination.

Detta visar att alleler är konstanta från generation till generation.

Tillämpningen av chi-square testet är något annorlunda när man ansöker om Hardy-Weinberg-lagen eftersom den behandlar frekvenser av förväntad genotyp snarare än siffror. Graden av frihet tas n-2 i stället för n-1.