(Microsoft PowerPoint - KOMPERAT\335F GENOM\335K son2)

advertisement
KOMPERATİF
GENOMİK
“Principles of Genome Analysis and Genomics
S.B. Primrose and R.M. Twyman
Bölüm 7 s. 113-132”
Amacı; farklı organizmaların genom
yapısındaki farklılık ve benzerliklerin
ortaya çıkarılmasıdır.
İnsanlar
ve
diğer
organizmalar
arasındaki farklılıklar bizim genomumuza
nasıl yansıtılır?
İnsanlar, meyve sinekleri, solucanlar,
bitkiler,
mayalar
ve
bakterilerde
proteinlerin sayı ve tipleri ne kadar
benzerdir?
sorularına cevap aranmaktır.
Önemli hücresel fonksiyonları kodlayan
DNA
dizilerinin
türler
arasında
korunmuş oluşabileceği mantığı temel
alınarak;
*Birincisi
kaba
düzeyde,
yani
organizmanın orijinin belirlenmesi
*İkincisi lokal düzeyde evrim sürecinin
anlaşılması
komperatif genomik analizleri ile ortaya
çıkarılabilmektedir.
Karşılaştırma yapılabilecek ideal türler;
*şekli,
*fizyolojisi
mümkün olabildiği kadar
benzer olanlar ile
*davranışı
*genomları fonksiyonel olmayan dizilerin
ayrılması için yeterli zamana sahip olacak
kadar yavaş evrimleşmiş olan
türlerdir.
Farklı organizmalarda genom
organizasyonunu karşılaştırmak için ;
Ortolog
Paralog
genlerin ayırdedilmesi gereklidir.
Ortologlar; aynı fonksiyonu kodlayan ve vertikal alçalma
ile yavaş evrimleşen farklı organizmalardaki homolog
genlerdir.
Ortologlar mutasyonların yavaş olarak birikmesi ile
ortaya çıkar.
Paraloglar; benzer fakat özdeş olmayan fonksiyonları
kodlayan bir organizmadaki homolog genlerdir.
Paraloglar
mutasyon birikiminin ardından gen
duplikasyonu ile meydana gelir.
Tüm canlı organizmalarda veya çoğunda ortak
olan birçok biyokimyasal aktivite vardır:
örneğin sitrik asit döngüsü, ATP üretimi,
nükleotit sentezi, DNA replikasyonu, vs.
Her bir durumda anahtar proteinlerin ortolog
olacağı düşünülebilir.
‘evrensel protein aileleri’nin tüm archae,
eubacteria
ve
ökaryotlar
tarafından
paylaşıldığı tanımlanmıştır.
Protein evrimi
Protein dizilerinin ve üç-boyutlu yapılarının analizi,
çoğu proteinin farklı domainlerden oluştuğunu
göstermiştir.
Mozaik proteinler olarak adlandırılan
metazoalarda fazla bulunmaktadır.
Mozaik proteinlerin başlıcaları ekstrasellüer veya
membrana bağlı proteinlerin ekstrasellüler parçalarını
oluştururlar ve bu nedenle çok hücreliliğin evriminde
önemli bir rol oynayabilirler.
Mozaik proteinin tek tek domainleri evrimsel olarak
hareketlidir, bunun anlamı evrim sürecinde yayılırlar
ve akraba olmayan proteinlerde ortaya çıkarlar .
proteinler
Mozaik proteinler metazoada en yaygın
olmasına
rağmen
tek
hücreli
organizmalarda da bulunur.
Üç ana alemin temsilcilerini içeren
(Archaea, Eubacteria ve Eukarya) çok
sayıda mikrobiyal genom sekanslandığı
için domainlerin evrimsel hareketliliğini
belirlemek olasıdır.
Prokoryatlarda karşılaştırmalı
genomik
Genom büyüklüğü 0.58 Mb (Mycoplasma genitalism) ile
8 Mb (Saccharopolyspora erythraea) arasında
değişiklik gösterir.
Gen yoğunluğu, tüm türler karşısında belirgin şekilde
benzerdir ve yaklaşık DNA’nın her kilobazı 1 gendir.
Büyük prokaryotik genomlar küçük olanlardan daha
fazla gen içerir.
Bunun tersi, insan genomu Drosophila’nın sadece iki
katı gen içerir.
Genomlarının tamamı sekanslanmış
eubacteria ve archaebacteri’lerin genom
büyüklükleri
Minimal Genom
M. genitalium’un genomu 0.58 Mb’dir ve
bugüne kadar tanımlanan en küçük
dizidir.
Serbest yaşayan hücresel organizmayla
uyumlu minimal genom nedir?
Minimal genomu belirlemek için minimal
protein seti tanımlanmalıdır.
Minimal protein seti
Ortolog gruplar ve buna ek olarak gen duplikasyonu
takiben seçici gen kaybının olduğu paralogları içeren
genlerin clusterları tanımlanarak belirlenebilir.
Bu yöntem 4 eubacteria, bir archaebacteria ve bir
mayaya uygulandığında ortolog gruplarının 816 clusterı
(COGs) tanımlandı. Bunların 327’si üç alemin
temsilcilerini içermektedir (Mushegian 1999).
327 protein seti temel alınarak tüm anahtar
biyosentetik yolları yeniden oluşturmak mümkündür.
Bu analiz 3 archeabacteria ve 12 eubacteriadan elde
edilen dizi datası ile tekrar edildiğinde minimal
protein seti 322 COG’ye düşürüldü.
Büyük genomların analizi
Genel kural olarak prokaryotik genom
büyüklüğü arttıkça paralog sayısının artması
da beklenir. ORF sayısı ve büyüklükleri
kıyaslanır.
Horizontal gen transferi
Horizontal, veya lateral, gen transferi, farklı evrimsel
soylar arasındaki genetik değişimdir.
İki bakteriyel termofilin genom analizi, genlerin %2025’inin eubacteriadan ziyade archaebacteria genlerine daha
benzer olduğunu göstermiştir. Bu arkaeal-benzeri genler
genomdaki clusterlarda oluşmuştur ve belirgin farklı
nükleotid kompozisyonuna sahiptir ve horizontal gen
transfer ile ortaya çıkabilmektedir.
Garcia-Vallve et al. (2000) tüm genom genlerinin horizontal
gen transferi aracılığıyla kazanılıp kazılmadığını saptamak
için istatistik yöntemi geliştirmişlerdir. Bu yöntem, G+C
içeriği, kodon kullanımı, amino asit kullanımı ve gen
pozisyonu analizini temel alır.
Bu yöntem, 24 sekanslanmış genoma uygulandığında
genlerin %1.5-14.5’unun horizontal olarak transfer
edildiğini ve bu genlerin çoğunun sadece bir veya iki soyda
var olduğunu göstermiştir.
Akraba bakterilerde karşılaştırmalı genomik
Çok yakın akrabalarda, gen içeriği ve gen sırasının
karşılaştırılması ile bugünün bakteri populasyonunun
şekillenmesini sağlayan evrimsel işlemlerin anlaşılması daha
kolaylaşmıştır.
Evrimsel terimlere göre, en yakın akraba organizmalar, aynı
türün farklı izolatlarıdır.
Alm et al. (1999) Helicobacter pylori’ nin iki soyunun tüm
sekansını karşılaştırmışlardır ve her soy için özgül olan
genlerin sadece %6’sının çok benzer olduğunu bulmuşlardır.
H. pylori,
genomunun %4’ünden fazlası restriksiyon –
modifikasyon (R-M) sistemlerini kodlar. R-M genlerinin
çoğu her iki suşta da ortak olmasına rağmen, fonksiyonel
olan genler iki suşta farklıdır. Suşa spesifik genlerin tümü
aktifken, paylaşılan genlerin çoğu inaktiftir. Bu sonuçlar, H.
pylori’nin daima yeni R-M sistemleri kazandığını ve
eskilerini inaktive ettiğini göstermektedir.
Karşılaştırmanın bir sonraki düzeyi, aynı cinsin
farklı türleri arasındaki benzerlikleri ve
farklılıkların tayinidir
Salmonella (S. typhi ve S. typhimurium)’nın iki serovarı
tamamiyle sekanslanmıştır ve karşılaştırmalar yaygın
synteny bulunan diğer yakın akraba olan E. coli
ile
yapılmıştır.
S. typhi’ye özgü 601 gen (%13.1) ve S. typhimurium’a özgü
479 gen (%10.9) vardır.
S. tyhpi’ye özgü ve E. coli‘ye akraba 1505 gen (%32.7) ve
E. coli’ye özgü S. typhi’ye akraba 1220 gen (%28.4). Fark,
S. typhi’de 204 ve diğerinde sadece 39 pseudogenin
varlığıdır.
S. typhi sadece insanları infekte ederken, S typhimurium
memelilerin geniş aralığını enfekte edebilmesidir. Bu
pseudogen içeriğindeki farklılığa bağlı olabilir, çünkü S.
typhi’deki
pseudogenlerin
çoğu
housekeeping
fonksiyonlarda yer alır ve virulans elemanlarındadır.
Karşılaştırmalı organel genomiği
Mitokondriyal genomların
karşılaştırılması
mtDNA tüm ökaryotlarda
aynı temel role sahiptir:
mtDNA
fonksiyonel
mitokondrinin oluşumu için
gerekli olan sınırlı sayıda
RNA ve proteinleri kodlar.
mtDNA’nın
genetik
rolü
evrensel olarak korunmuş
gibi görünmesine rağmen,
bu
genom
hem
konformasyon
ve
büyüklüğünde,
hem
de
gerçek
gen
içeriği,
düzenleme
ve
ekspresyonunda varyasyon
gösterir
“atasal” ve “türemiş” mtDNA
Mitokondrilerin bakteriyal endosimbiyontun
soyundan geldiğine inanılır: nukleuslu bir
hücrede kurulmuştur
ve bir atasal
mitokondriyal genom bu eubacterial atasının
izlerine sahiptir.
Atasal prototip mtDNA’sı heterotropik kamçılı
bir protozoon olan Reclinomonas americana’dır.
Bu organizmanın mtDNA’sı, diğer tamamı
sekanslanmış mtDNA’larda bulunan, tüm
protein kodlayan genleri içeren 97 gene
sahiptir. Türemiş mitokondriyal genomlar,
atasal paternden radikal olarak ayrılmışlardır.
İntrasellüler gen transferi
Mitokondrinin temel fonksiyonu oksidatif fosforilasyon
üzerinden ATP üretimidir. En az 21 gen oksidatif
fosforilasyon için önemli proteinleri kodlar ve tüm bu
genlerin mtDNA’da yer alması beklenmektedir.
Elde edilen sekans dataları, çoğu mitokondriyal
genomların anahtar genleri olmadığını göstermektedir
ve bu eksik genler nükleusta bulunabilir.
25 farklı legumenin analizi ile bazı cinslerinde
mitokondriyal cox2 genin mitokondride yer aldığı,
bazılarında nükleusta ve bazılarında ise iki genomda da
bulunduğu belirlenmiştir.
Her iki genin transkribe edildiği tek bir cins
bulunmasına rağmen, genin iki kopyasının bulunduğu
çoğu durumda sadece bir gen transkripsiyonel olarak
aktiftir.
Horizontal gen transferi
Grup I intronlar, genetik çaprazlamalarda allelleri
içeren intronlardan, alleli olmayan intronlara etkili
dağılımı katalizleyen nispeten uzun hedef bölgeleri ile
bölgeye özgül endonükleazları kodlar.
Bu intron, test edilen 281 angiospermden 48’inin
mitokondriyal cox1 geninde saptanmıştır.
İntron ve konakçı genom için sekans datasına
dayanarak bu intron, bağımsız olarak konakçı bitkilere
çapraz-türler arası horizontal transfer aracılığıyla
birçok farklı şekilde kazanılmış gibi görünmektedir.
Verici ve alıcının her bir bireydeki özdeşlikleri
belirlenmiş değildir. Grup I introna zıt olarak,
angiosperm mtDNAdaki diğer 23 intron grup II’ ye
aittir ve vertikal şekilde iletilmektedir.
Ökaryotlarda karşılaştırmalı genomik
Minimal ökaryotik genomlar
Serbest yaşayan tek hücreli ökaryotun minimal genom
büyüklüğü nedir ve minimal bakteriyal genom ile nasıl
karşılaştırılması yapılır?
Ökaryotik ve prokaryotik bir hücre arasındaki temel
genetik farklılıklar nelerdir?
Çok hücrelilerin koordinasyonu için ihtiyaç duyulan ilave
genetik bilgiler nelerdir?
Hayvanlarda, omurgalı genomu ve memeli genomu için
minimum büyüklükler nedir?
Çiçekli bir bitki için minimum genom büyüklüğü nedir?
Çoğu ökaryotik genom, büyük miktarda kodlanmayan DNA
içerir ve bu sorular hem genom büyüklüğü hem de kodlanan
protein sayısı dikkate alınarak cevaplandırılmalıdır.
Ökaryotik bir parazit olan Encephalitozoon cuniculi genomu 2.9
Mb ve yakın akrabası olan Encephalitozoon intestinalis ‘in genomu
2.3 Mb
Bu genomlar rDNA’dan çok az repetitif DNA ve 2000’den daha
az gen içermektedir.
Çok hücreli organizmalardan Arabidopsis, Caenorhabditis ve
Drosophila benzer sayıda protein (11000- 18000) kodlar. Bu, çok
çeşitli çok hücreli ökaryotların gelişimi gerçekleştirmek ve
çevresine tepki vermek için gereksinim duyulan minimal
karmaşıklık olabilir.
Omurgalılar arasında, Japon puffer fish (Fugu rubripes) bugüne
kadar tanımlanan en küçük genoma sahiptir, fakat insan gibi diğer
omurgalılara benzer gen içeriğine sahiptir. Fugu genomunun
analizi, genlerinin yoğun olarak paketlendiğini göstermektedir.
Bugüne kadar tanımlanan en küçük memeli genomu bir yarasa türü
olan Miniopterus genomudur. Genom büyüklüğü insanlarınkinin
%50’si kadardır, fakat bu küçüklük genom yoğunlunun ya da
genlerin kaybının bir sonucudur.
Evrimsel anlamda oldukça uzak olan organizmaların
genomlarının repetitif elementlerinin sayı ve tipleri
karşılaştırılır. Çünkü bunlar gen sayılarından ziyade
genom
büyüklüğündeki
başlıca
farklılıkları
açıklamaktadır.
Gen düzeyinde, intron ve ekzon yapısındaki
farklılıklar,
belirgin
olarak
ayrı
olan
Arabidopsis ile farklı ökaryotik genomlarda
görülebilmektedir
Üç
hayvan
genomu
karşısında tercih edilen ekzon büyüklüğünün
korunması, splaysing mekanizmasının ekzona
dayalı
içeriğinin
korunmuş
olduğunu
göstermektedir.
Çoğu ökaryotik proteinler çok sayıda farklı domainlerden
oluşur.
*Genom
sekanslarının
analizi
insan
proteinlerinde
tanımlanan domainlerin %90’ından fazlasının Drosophila ve
Caenorhabditis proteinlerinde de bulunduğunu ortaya
çıkarmıştır.
*Bu nedenle, omurgalı evrimi birkaç yeni domainin keşfini
gerektirmiştir. Domainlerin yeni kombinasyonları bazı yeni
proteinler oluşturmaktadır.
Çoğu proteinler domainlerin mozaikleri olmasına rağmen,
sekanslanan genomların herhangi biri tarafından kodlanan
proteinlerin yüksek yüzdesi diğer sekanslanan genomlarda
ortoloğa sahiptir.
*Örneğin, tahmin edilen insan proteinlerinin %60’ının maya,
sinek, nematod veya bitki proteinlerinde dizi benzerliği
vardır ve sinek proteinlerinin %61’i, nematod proteinlerinin
%43’ü ve maya proteinlerinin %46’sı insan kopyalarına
(karşılık) sahiptir.
Hem Drosophila hem de Caenorhabditis’te
ortoloğa sahip 1523 insan proteini vardır
Gen sırasının karşılaştırılması
Farklı organizmalarda gen sırasının karşılaştırılması
moleküler filogeniyi geliştirmek için kullanılan çoğu
araçtan biridir.
Ökaryotlarda
inversiyonların
oranı
prokaryotlardakinden
daha
yüksektir
ve
transkripsiyonun yönünün gen oryantasyonu üzerine
etkisi daha azdır.
Synteninin başlıca faydası, çok iyi haritalanmış
organizmadaki gen lokasyonu hakkındaki bilginin iyi
haritalanmamış akrabalarında aynı genin yerini bulmak
için kullanılabilmesidir.
Bakterilerden lateral gen transferi
Tüm insan DNA dizisinin ayrıntılı incelenmesi, 113 ile 223
arasındaki genin bakterilerden insanlara veya dört omurgalı
atasından birine transfer edildiğini göstermiştir.
Lateral gen transferinin kanıtı, bakteriyal genlere çok
benzer
dizilerin
insan
genomunda
bulunurken
omurgasızlarda bulunmamasıdır.
Bakterilerden lateral gen transferinin olasılığını yeniden
saptamak için her bir aday gen için filogenetik ağaçlar
oluşturulur.
Eğer omurgalı bir gen dizisi, bakteriyal
dizilerin clusterında kısa diziler halinde yer alıyorsa gen
lateral olarak bakteriden transfer edilmiştir.
Benzer lateral gen transferinin bir olası örneği putativite
N-acetylneuraminate lyase genidir.
Filogenetik footprinting
Protein sekansları DNA dizilerinden daha yavaş hızda
evrim geçirdiği ve bu nedenle ortolog ve parologları
protein düzeyinde saptamak daha kolay olduğu için
protein dizilerinin karşılaştırılması ile daha fazla
ilgilenilmektedir.
DNA dizilerinin karşılaştırılması bilgilendirici olabilir,
çünkü gen sekansları, kodlanmayan DNA dizilerinden
daha yavaş evrimleşme eğilimindedir.
Komperatif DNA sekans analizi genler, düzenleyici
diziler, splays bölgeler ve bağlanma bölgeleri gibi
fonksiyonel elementleri tanımlamak için mutasyon
oranlarındaki bu lokal farklılıktan faydalanır. Bu,
filogenetik footprinting olarak bilinen bir işlem olan
ortolog
DNA
sekanslarının
saptanması
ile
gerçekleştirilir.
Yeni genlerin kaynağı nedir?
Sekanslanmış
ökaryotik
genomların
analizleri
prokaryotlarda karşılığı olmayan binlerce geni
kodladığını göstermektedir. Bu genlerin kaynakları
nelerdir?
Çoğu yeni gen modifiye edilmiş eski bir gen olabilir.
*von
Willebrand
A,
fibronektin
tip
III,
immünoglobulin ve SH3 modülleri gibi protein-protein
etkileşimlerinde
yer
alan
domainler
yüksek
ökaryotlarda büyük proliferasyon gösterir,
fakat
prokaryotlar ve düşük ökaryotlarda homologlara
sadece uzak bir akrabalık vardır.
Yeni ökaryotik domainlerin çoğunun α- helikal yapıda
olması, bu domainlerin, prokaryotlarda ve özellikle
ökaryotlarda çok fazla bulunan, kondanse sarılmış
yapılardan yavaş yavaş evrimleşmiş olabileceğini
gösterir.
Yeni genlerin bir kaynağı transpozable elementler
olabilir.
*Nekrutenko & Li (2001) protein kodlayan bölgelerde
bir yada birçok transpozable elementlere sahip ve
insan ve rat ortologları olmayan iki fare geni
bulmuşlardır. Bu nedenle, transpozable elementlerin
insersiyonu yeni genler oluşturabilmektedir.
Download