Orsaker och metoder för genomsekvensering

Sekvensering av genomerna är sofistikerad, komplex och kräver specialteknik. Ett segment på 500-800 bp kan sekvenseras. Men genomerna är mycket stora, t.ex. E. coli med 4, 2 x 10 6 bp och 3, 2 x 10 9 bp för människor.

Sålunda krävs för segmentering små segment. Sådana segment produceras genom att slumpmässigt bryta genomiskt DNA i små fragment. Sådana fragment överlappar vanligen andra fragment i sina ändar. Fragment klonas i en vektor för att alstra ett genomiskt bibliotek av organism.

Skäl för fullständig sekvensering av ett genom:

(i) Det tillhandahåller information som grund för upptäckten av gener och ger genomsökning.

(ii) Det representerar de möjliga relationerna mellan generna.

(iii) Sekvensering av genomer tillhandahåller en uppsättning verktyg för ytterligare experiment.

(iv) Genetisk information av en organism görs tillgänglig från gensekvensen.

(v) Fullständig genetisk sekvensering av en organism tillhandahåller all genetisk information som krävs för att bilda en organism.

Metoder som används för genomsekvensering:

(i) Riktad sekvensering av bakteriella artificiella kromosom (BAC) contig:

Bakteriella artificiella kromosomer är helt enkelt plasmider avsedda för kloning av mycket långa segment (dvs 100 000 till 300 000 bp) DNA. Dessa vektorer används för att skapa genomiska bibliotek där insättningsstorleken är 80-100 kb. DNA-fragment av tusentals baspar klonas in i BAC-vektorn.

Det genomiska biblioteket screenas genom att lokalisera vanliga restriktions-kloner som kallas contigs. Medlemmarna av contig innehåller några överlappande regioner för att tillåta exakt bestämning av deras plats i contig.

Det ultimata målet med fysiska kartläggningsmetoder är att få en komplett contig för varje kromosom av genomet. De mappade contiggen sekvenseras genom att bryta stora DNA-fragment i små segment. Varje klon i contig sekvenseras. Nukleotidsekvensen identifieras ensam genom klonbasis tills fullständigt genom sekvenseras.

(ii) Slumpmässig hagelgevärssekvensering eller Bottom up approach:

Det är möjligt att klona i en organisme vilken som helst önskad gen från en annan organism genom skottning. För detta hela genomet av första organismen digereras med restriktionsendonukleas för att producera en slumpmässig blandning av fragment.

Slumpmässiga (shotgim) -bibliotek av genomiskt DNA är konstruerade i små dvs 2, 0 kb och medium, dvs 10 kb insättningsplasmidvektorer tillsammans med BAC-biblioteket genom genomisk hagelgevär (80-100 kb). Fragment införs i plasmidvektorn och de rekombinanta plasmiderna transformeras till den önskade värdcellen.

I skottpistolsekvensering sekventeras slumpvis valda kloner tills kloner i det genomiska biblioteket analyseras. Med andra ord kan vi säga att i slumpmässiga skottpistol-sekvenseringskromosomer delas upp i sektioner och sedan delas genomsnittet av genomiskt DNA i miljoner små segment och alla segmenten sekvenseras på ett opartiskt sätt.

Områden av överlappande DNA matchas som bildade större och större segment av genomiskt DNA. DNA-sekvensering utförs i båda ändar av insatser av slumpmässigt valda kloner från både de små och medelläsa plasmidbiblioteken för att ge åtminstone tre gånger täckningen av genomet.

Små DNA-fragment införs slumpmässigt i olika plasmidmolekyler. Vid överlappande insatser kommer de alla från samma genomiska plats men från olika regioner skiftas antingen till vänster eller till höger i förhållande till varandra.

De överlappande fragmenten är inriktade antingen i coting eller i en sekvens för den berörda regionen (skottpistolmetoden). Prokaryotiska genomerna har lite respektive DNA- och skottpistolsekvensering ger bra resultat. Eukaryoter bär många upprepade sekvenser.

Allt detta leder till förvirring. Överlappning av fragment utnyttjas emellertid i monteringsfasen genom beräkningsövning. Datorprogram identifierar de överlappande sekvenserna och förenar dem med en kontinuerlig sträcka. Denna process har framgångsrikt applicerats för sekvensering av alla mikrobiella genomsekvenser publicerade av Celera Genomics.