KOMPERATİF GENOMİK “Principles of Genome Analysis and Genomics S.B. Primrose and R.M. Twyman Bölüm 7 s. 113-132” Amacı; farklı organizmaların genom yapısındaki farklılık ve benzerliklerin ortaya çıkarılmasıdır. İnsanlar ve diğer organizmalar arasındaki farklılıklar bizim genomumuza nasıl yansıtılır? İnsanlar, meyve sinekleri, solucanlar, bitkiler, mayalar ve bakterilerde proteinlerin sayı ve tipleri ne kadar benzerdir? sorularına cevap aranmaktır. Önemli hücresel fonksiyonları kodlayan DNA dizilerinin türler arasında korunmuş oluşabileceği mantığı temel alınarak; *Birincisi kaba düzeyde, yani organizmanın orijinin belirlenmesi *İkincisi lokal düzeyde evrim sürecinin anlaşılması komperatif genomik analizleri ile ortaya çıkarılabilmektedir. Karşılaştırma yapılabilecek ideal türler; *şekli, *fizyolojisi mümkün olabildiği kadar benzer olanlar ile *davranışı *genomları fonksiyonel olmayan dizilerin ayrılması için yeterli zamana sahip olacak kadar yavaş evrimleşmiş olan türlerdir. Farklı organizmalarda genom organizasyonunu karşılaştırmak için ; Ortolog Paralog genlerin ayırdedilmesi gereklidir. Ortologlar; aynı fonksiyonu kodlayan ve vertikal alçalma ile yavaş evrimleşen farklı organizmalardaki homolog genlerdir. Ortologlar mutasyonların yavaş olarak birikmesi ile ortaya çıkar. Paraloglar; benzer fakat özdeş olmayan fonksiyonları kodlayan bir organizmadaki homolog genlerdir. Paraloglar mutasyon birikiminin ardından gen duplikasyonu ile meydana gelir. Tüm canlı organizmalarda veya çoğunda ortak olan birçok biyokimyasal aktivite vardır: örneğin sitrik asit döngüsü, ATP üretimi, nükleotit sentezi, DNA replikasyonu, vs. Her bir durumda anahtar proteinlerin ortolog olacağı düşünülebilir. ‘evrensel protein aileleri’nin tüm archae, eubacteria ve ökaryotlar tarafından paylaşıldığı tanımlanmıştır. Protein evrimi Protein dizilerinin ve üç-boyutlu yapılarının analizi, çoğu proteinin farklı domainlerden oluştuğunu göstermiştir. Mozaik proteinler olarak adlandırılan metazoalarda fazla bulunmaktadır. Mozaik proteinlerin başlıcaları ekstrasellüer veya membrana bağlı proteinlerin ekstrasellüler parçalarını oluştururlar ve bu nedenle çok hücreliliğin evriminde önemli bir rol oynayabilirler. Mozaik proteinin tek tek domainleri evrimsel olarak hareketlidir, bunun anlamı evrim sürecinde yayılırlar ve akraba olmayan proteinlerde ortaya çıkarlar . proteinler Mozaik proteinler metazoada en yaygın olmasına rağmen tek hücreli organizmalarda da bulunur. Üç ana alemin temsilcilerini içeren (Archaea, Eubacteria ve Eukarya) çok sayıda mikrobiyal genom sekanslandığı için domainlerin evrimsel hareketliliğini belirlemek olasıdır. Prokoryatlarda karşılaştırmalı genomik Genom büyüklüğü 0.58 Mb (Mycoplasma genitalism) ile 8 Mb (Saccharopolyspora erythraea) arasında değişiklik gösterir. Gen yoğunluğu, tüm türler karşısında belirgin şekilde benzerdir ve yaklaşık DNA’nın her kilobazı 1 gendir. Büyük prokaryotik genomlar küçük olanlardan daha fazla gen içerir. Bunun tersi, insan genomu Drosophila’nın sadece iki katı gen içerir. Genomlarının tamamı sekanslanmış eubacteria ve archaebacteri’lerin genom büyüklükleri Minimal Genom M. genitalium’un genomu 0.58 Mb’dir ve bugüne kadar tanımlanan en küçük dizidir. Serbest yaşayan hücresel organizmayla uyumlu minimal genom nedir? Minimal genomu belirlemek için minimal protein seti tanımlanmalıdır. Minimal protein seti Ortolog gruplar ve buna ek olarak gen duplikasyonu takiben seçici gen kaybının olduğu paralogları içeren genlerin clusterları tanımlanarak belirlenebilir. Bu yöntem 4 eubacteria, bir archaebacteria ve bir mayaya uygulandığında ortolog gruplarının 816 clusterı (COGs) tanımlandı. Bunların 327’si üç alemin temsilcilerini içermektedir (Mushegian 1999). 327 protein seti temel alınarak tüm anahtar biyosentetik yolları yeniden oluşturmak mümkündür. Bu analiz 3 archeabacteria ve 12 eubacteriadan elde edilen dizi datası ile tekrar edildiğinde minimal protein seti 322 COG’ye düşürüldü. Büyük genomların analizi Genel kural olarak prokaryotik genom büyüklüğü arttıkça paralog sayısının artması da beklenir. ORF sayısı ve büyüklükleri kıyaslanır. Horizontal gen transferi Horizontal, veya lateral, gen transferi, farklı evrimsel soylar arasındaki genetik değişimdir. İki bakteriyel termofilin genom analizi, genlerin %2025’inin eubacteriadan ziyade archaebacteria genlerine daha benzer olduğunu göstermiştir. Bu arkaeal-benzeri genler genomdaki clusterlarda oluşmuştur ve belirgin farklı nükleotid kompozisyonuna sahiptir ve horizontal gen transfer ile ortaya çıkabilmektedir. Garcia-Vallve et al. (2000) tüm genom genlerinin horizontal gen transferi aracılığıyla kazanılıp kazılmadığını saptamak için istatistik yöntemi geliştirmişlerdir. Bu yöntem, G+C içeriği, kodon kullanımı, amino asit kullanımı ve gen pozisyonu analizini temel alır. Bu yöntem, 24 sekanslanmış genoma uygulandığında genlerin %1.5-14.5’unun horizontal olarak transfer edildiğini ve bu genlerin çoğunun sadece bir veya iki soyda var olduğunu göstermiştir. Akraba bakterilerde karşılaştırmalı genomik Çok yakın akrabalarda, gen içeriği ve gen sırasının karşılaştırılması ile bugünün bakteri populasyonunun şekillenmesini sağlayan evrimsel işlemlerin anlaşılması daha kolaylaşmıştır. Evrimsel terimlere göre, en yakın akraba organizmalar, aynı türün farklı izolatlarıdır. Alm et al. (1999) Helicobacter pylori’ nin iki soyunun tüm sekansını karşılaştırmışlardır ve her soy için özgül olan genlerin sadece %6’sının çok benzer olduğunu bulmuşlardır. H. pylori, genomunun %4’ünden fazlası restriksiyon – modifikasyon (R-M) sistemlerini kodlar. R-M genlerinin çoğu her iki suşta da ortak olmasına rağmen, fonksiyonel olan genler iki suşta farklıdır. Suşa spesifik genlerin tümü aktifken, paylaşılan genlerin çoğu inaktiftir. Bu sonuçlar, H. pylori’nin daima yeni R-M sistemleri kazandığını ve eskilerini inaktive ettiğini göstermektedir. Karşılaştırmanın bir sonraki düzeyi, aynı cinsin farklı türleri arasındaki benzerlikleri ve farklılıkların tayinidir Salmonella (S. typhi ve S. typhimurium)’nın iki serovarı tamamiyle sekanslanmıştır ve karşılaştırmalar yaygın synteny bulunan diğer yakın akraba olan E. coli ile yapılmıştır. S. typhi’ye özgü 601 gen (%13.1) ve S. typhimurium’a özgü 479 gen (%10.9) vardır. S. tyhpi’ye özgü ve E. coli‘ye akraba 1505 gen (%32.7) ve E. coli’ye özgü S. typhi’ye akraba 1220 gen (%28.4). Fark, S. typhi’de 204 ve diğerinde sadece 39 pseudogenin varlığıdır. S. typhi sadece insanları infekte ederken, S typhimurium memelilerin geniş aralığını enfekte edebilmesidir. Bu pseudogen içeriğindeki farklılığa bağlı olabilir, çünkü S. typhi’deki pseudogenlerin çoğu housekeeping fonksiyonlarda yer alır ve virulans elemanlarındadır. Karşılaştırmalı organel genomiği Mitokondriyal genomların karşılaştırılması mtDNA tüm ökaryotlarda aynı temel role sahiptir: mtDNA fonksiyonel mitokondrinin oluşumu için gerekli olan sınırlı sayıda RNA ve proteinleri kodlar. mtDNA’nın genetik rolü evrensel olarak korunmuş gibi görünmesine rağmen, bu genom hem konformasyon ve büyüklüğünde, hem de gerçek gen içeriği, düzenleme ve ekspresyonunda varyasyon gösterir “atasal” ve “türemiş” mtDNA Mitokondrilerin bakteriyal endosimbiyontun soyundan geldiğine inanılır: nukleuslu bir hücrede kurulmuştur ve bir atasal mitokondriyal genom bu eubacterial atasının izlerine sahiptir. Atasal prototip mtDNA’sı heterotropik kamçılı bir protozoon olan Reclinomonas americana’dır. Bu organizmanın mtDNA’sı, diğer tamamı sekanslanmış mtDNA’larda bulunan, tüm protein kodlayan genleri içeren 97 gene sahiptir. Türemiş mitokondriyal genomlar, atasal paternden radikal olarak ayrılmışlardır. İntrasellüler gen transferi Mitokondrinin temel fonksiyonu oksidatif fosforilasyon üzerinden ATP üretimidir. En az 21 gen oksidatif fosforilasyon için önemli proteinleri kodlar ve tüm bu genlerin mtDNA’da yer alması beklenmektedir. Elde edilen sekans dataları, çoğu mitokondriyal genomların anahtar genleri olmadığını göstermektedir ve bu eksik genler nükleusta bulunabilir. 25 farklı legumenin analizi ile bazı cinslerinde mitokondriyal cox2 genin mitokondride yer aldığı, bazılarında nükleusta ve bazılarında ise iki genomda da bulunduğu belirlenmiştir. Her iki genin transkribe edildiği tek bir cins bulunmasına rağmen, genin iki kopyasının bulunduğu çoğu durumda sadece bir gen transkripsiyonel olarak aktiftir. Horizontal gen transferi Grup I intronlar, genetik çaprazlamalarda allelleri içeren intronlardan, alleli olmayan intronlara etkili dağılımı katalizleyen nispeten uzun hedef bölgeleri ile bölgeye özgül endonükleazları kodlar. Bu intron, test edilen 281 angiospermden 48’inin mitokondriyal cox1 geninde saptanmıştır. İntron ve konakçı genom için sekans datasına dayanarak bu intron, bağımsız olarak konakçı bitkilere çapraz-türler arası horizontal transfer aracılığıyla birçok farklı şekilde kazanılmış gibi görünmektedir. Verici ve alıcının her bir bireydeki özdeşlikleri belirlenmiş değildir. Grup I introna zıt olarak, angiosperm mtDNAdaki diğer 23 intron grup II’ ye aittir ve vertikal şekilde iletilmektedir. Ökaryotlarda karşılaştırmalı genomik Minimal ökaryotik genomlar Serbest yaşayan tek hücreli ökaryotun minimal genom büyüklüğü nedir ve minimal bakteriyal genom ile nasıl karşılaştırılması yapılır? Ökaryotik ve prokaryotik bir hücre arasındaki temel genetik farklılıklar nelerdir? Çok hücrelilerin koordinasyonu için ihtiyaç duyulan ilave genetik bilgiler nelerdir? Hayvanlarda, omurgalı genomu ve memeli genomu için minimum büyüklükler nedir? Çiçekli bir bitki için minimum genom büyüklüğü nedir? Çoğu ökaryotik genom, büyük miktarda kodlanmayan DNA içerir ve bu sorular hem genom büyüklüğü hem de kodlanan protein sayısı dikkate alınarak cevaplandırılmalıdır. Ökaryotik bir parazit olan Encephalitozoon cuniculi genomu 2.9 Mb ve yakın akrabası olan Encephalitozoon intestinalis ‘in genomu 2.3 Mb Bu genomlar rDNA’dan çok az repetitif DNA ve 2000’den daha az gen içermektedir. Çok hücreli organizmalardan Arabidopsis, Caenorhabditis ve Drosophila benzer sayıda protein (11000- 18000) kodlar. Bu, çok çeşitli çok hücreli ökaryotların gelişimi gerçekleştirmek ve çevresine tepki vermek için gereksinim duyulan minimal karmaşıklık olabilir. Omurgalılar arasında, Japon puffer fish (Fugu rubripes) bugüne kadar tanımlanan en küçük genoma sahiptir, fakat insan gibi diğer omurgalılara benzer gen içeriğine sahiptir. Fugu genomunun analizi, genlerinin yoğun olarak paketlendiğini göstermektedir. Bugüne kadar tanımlanan en küçük memeli genomu bir yarasa türü olan Miniopterus genomudur. Genom büyüklüğü insanlarınkinin %50’si kadardır, fakat bu küçüklük genom yoğunlunun ya da genlerin kaybının bir sonucudur. Evrimsel anlamda oldukça uzak olan organizmaların genomlarının repetitif elementlerinin sayı ve tipleri karşılaştırılır. Çünkü bunlar gen sayılarından ziyade genom büyüklüğündeki başlıca farklılıkları açıklamaktadır. Gen düzeyinde, intron ve ekzon yapısındaki farklılıklar, belirgin olarak ayrı olan Arabidopsis ile farklı ökaryotik genomlarda görülebilmektedir Üç hayvan genomu karşısında tercih edilen ekzon büyüklüğünün korunması, splaysing mekanizmasının ekzona dayalı içeriğinin korunmuş olduğunu göstermektedir. Çoğu ökaryotik proteinler çok sayıda farklı domainlerden oluşur. *Genom sekanslarının analizi insan proteinlerinde tanımlanan domainlerin %90’ından fazlasının Drosophila ve Caenorhabditis proteinlerinde de bulunduğunu ortaya çıkarmıştır. *Bu nedenle, omurgalı evrimi birkaç yeni domainin keşfini gerektirmiştir. Domainlerin yeni kombinasyonları bazı yeni proteinler oluşturmaktadır. Çoğu proteinler domainlerin mozaikleri olmasına rağmen, sekanslanan genomların herhangi biri tarafından kodlanan proteinlerin yüksek yüzdesi diğer sekanslanan genomlarda ortoloğa sahiptir. *Örneğin, tahmin edilen insan proteinlerinin %60’ının maya, sinek, nematod veya bitki proteinlerinde dizi benzerliği vardır ve sinek proteinlerinin %61’i, nematod proteinlerinin %43’ü ve maya proteinlerinin %46’sı insan kopyalarına (karşılık) sahiptir. Hem Drosophila hem de Caenorhabditis’te ortoloğa sahip 1523 insan proteini vardır Gen sırasının karşılaştırılması Farklı organizmalarda gen sırasının karşılaştırılması moleküler filogeniyi geliştirmek için kullanılan çoğu araçtan biridir. Ökaryotlarda inversiyonların oranı prokaryotlardakinden daha yüksektir ve transkripsiyonun yönünün gen oryantasyonu üzerine etkisi daha azdır. Synteninin başlıca faydası, çok iyi haritalanmış organizmadaki gen lokasyonu hakkındaki bilginin iyi haritalanmamış akrabalarında aynı genin yerini bulmak için kullanılabilmesidir. Bakterilerden lateral gen transferi Tüm insan DNA dizisinin ayrıntılı incelenmesi, 113 ile 223 arasındaki genin bakterilerden insanlara veya dört omurgalı atasından birine transfer edildiğini göstermiştir. Lateral gen transferinin kanıtı, bakteriyal genlere çok benzer dizilerin insan genomunda bulunurken omurgasızlarda bulunmamasıdır. Bakterilerden lateral gen transferinin olasılığını yeniden saptamak için her bir aday gen için filogenetik ağaçlar oluşturulur. Eğer omurgalı bir gen dizisi, bakteriyal dizilerin clusterında kısa diziler halinde yer alıyorsa gen lateral olarak bakteriden transfer edilmiştir. Benzer lateral gen transferinin bir olası örneği putativite N-acetylneuraminate lyase genidir. Filogenetik footprinting Protein sekansları DNA dizilerinden daha yavaş hızda evrim geçirdiği ve bu nedenle ortolog ve parologları protein düzeyinde saptamak daha kolay olduğu için protein dizilerinin karşılaştırılması ile daha fazla ilgilenilmektedir. DNA dizilerinin karşılaştırılması bilgilendirici olabilir, çünkü gen sekansları, kodlanmayan DNA dizilerinden daha yavaş evrimleşme eğilimindedir. Komperatif DNA sekans analizi genler, düzenleyici diziler, splays bölgeler ve bağlanma bölgeleri gibi fonksiyonel elementleri tanımlamak için mutasyon oranlarındaki bu lokal farklılıktan faydalanır. Bu, filogenetik footprinting olarak bilinen bir işlem olan ortolog DNA sekanslarının saptanması ile gerçekleştirilir. Yeni genlerin kaynağı nedir? Sekanslanmış ökaryotik genomların analizleri prokaryotlarda karşılığı olmayan binlerce geni kodladığını göstermektedir. Bu genlerin kaynakları nelerdir? Çoğu yeni gen modifiye edilmiş eski bir gen olabilir. *von Willebrand A, fibronektin tip III, immünoglobulin ve SH3 modülleri gibi protein-protein etkileşimlerinde yer alan domainler yüksek ökaryotlarda büyük proliferasyon gösterir, fakat prokaryotlar ve düşük ökaryotlarda homologlara sadece uzak bir akrabalık vardır. Yeni ökaryotik domainlerin çoğunun α- helikal yapıda olması, bu domainlerin, prokaryotlarda ve özellikle ökaryotlarda çok fazla bulunan, kondanse sarılmış yapılardan yavaş yavaş evrimleşmiş olabileceğini gösterir. Yeni genlerin bir kaynağı transpozable elementler olabilir. *Nekrutenko & Li (2001) protein kodlayan bölgelerde bir yada birçok transpozable elementlere sahip ve insan ve rat ortologları olmayan iki fare geni bulmuşlardır. Bu nedenle, transpozable elementlerin insersiyonu yeni genler oluşturabilmektedir.