Tcoffee©: Çok amaçlı dizi hizalama programı

advertisement
73
Tcoffee©: Çok amaçlı dizi hizalama programı
Yazarlar: C. NOTREDAME, L. HOLME D.G. HIGGINS, J. HERINGA, O.
O'SULLIVAN, K SUHRE, C. ABERGEL
Lisans: Açık kaynak, ücretsiz yazılım
Tcoffee’ye kısa bir bakış
T-coffee "Ağaç Bazlı Tutarlılık Uyum Amaç
Fonksiyonunun
Değerlendirilmesi"
anlamına
gelmektedir. Çoklu dizi hizalaması yapmak için
kullanılan yeni bir programdır. Biraz daha uzun
çalışma zamanı pahasına diğer programlardan daha
kesin hizalama sağlamaktadır. ClustalW gibi
progresif bir program kullanmasına rağmen aynı
zamanda hizalanmış bütün sekansları ifade eden
bütün sekans setiyle karşılaştırmaktadır. Tcoffee
sekansları hizalamak için matris yer değişimini
direkt olarak kullanmamasıdır. Tcoffee ve
ClustalW arasındaki ana fark Tcoffee'nin sekansları
hizalamak için matris yer değişimini direkt olarak
kullanmamasıdır.. Başlıca dizi ve yapıların
hizalanması için EXPRESSO, bir hizalamanın
kesinliğini değerlendirmek için CORE, birçok
alternatif çoklu dizi hizalamalarını tek olarak
birleştirmek için Mcoffee gibi çok farklı
uygulamalar ve modüllere sahiptir. Kısaca, Tcoffee
DNA, RNA ve protein dizileri ve yapılarının çoklu
dizi hizalamasını kullanma, hesaplama ve
değerlendirme için bir alet topluluğuymuş gibi
tanımlanabilir.
Tcoffee ve araştırmaya katkısı
Son zamanlarda, moleküler biyoloji alanındaki
birçok araştırmacı orijinal araştırmaları süresince
çoklu dizi hizalaması yapmak, manipüle etmek,
hesaplamak ve değerlendirmek için Tcoffee
modüllerini kullanmaktadır. Tcoffee birkaç yıl önce
üretilmiş ve geliştirilmiş olmasına rağmen, birçok
derlenmiş eşdüzey makalede atıfta bulunulmuştur.
Ancak atıf sayısı hala ClustalW ile karşılaştırılamaz. Sonuçları hızlı elde etme özelliğine ilaveten,
açık kaynak ücretsiz yazılım lisansı ve çok
fonksiyonlu etkili modülleri, Tcoffee’yi çoklu dizi
hizalaması için en kullanışlı programlardan biri
yapar.
Tcoffee’nin avantajları ve dezavantajları
Avantajları
- Diğer metodlardan daha kesin karşılaştırmalar
ortaya koyar.
- Yapı hizalama, hesaplama ve hizalamaları
birleştirme için CORE, Mcoffee ve EXPRESSO
gibi birçok farklı aletle ve modülle donatılmıştır.
- Tcoffee; FASTA, Swiss-Prot ve PIR (Protein
Information Resource, Protein bilgi kaynağı) da
dahil birçok input formatını düzenlemek için
açabilir.
- Tcoffee çeşitli fomatlarda dizi hizalaması yapar.
Bundan dolayı başka bir program için bir input
olarak kullanılabilir. Ayrıca (.html) ve (pdf)
formatında bu hizalamanın kalitesini belirten bir
arka plan üzerinde her kalıntının göründüğü
yerde renklendirilmiş bir hizalama yapar.
- Neighbor Joining metodunu kullanarak Newick
formatında doğru filogenetik ağaç oluşturabilir.
- DNA, RNA veya Protein dizileri listesiyle
çalışabilir.
- Tcoffee CORE sunucusunu kullanarak herhangi
çoklu dizi hizalamasının kalitesini değerlendirebilir.
Dezavantajları
-
Çoklu
dizileri
karşılaştırmada
diğer
programlardan daha uzun zaman alır.
ClustalW’e göre sınırlı sayıda derlenmiş
eşdüzey dergide atıfta bulunulmuştur. Ancak bu
sayı her gün hızlıca artmaktadır.
74
Yazılım Dizaynı
T-Coffee bir açık kaynak ücretsiz yazılımdır.
Verilen bir dizi seti (Protein, DNA ya da RNA) için
çoklu dizi hizalaması oluşturmaktadır. Tcoffee’nin
en son versiyonu 5.65’tir. UNIX ya da Microsoft
Windows/Cywin ile çalışır. Sürüm 2.00 ve üzeri
yapıları ve dizileri birleştirebilir. Bu dizaynda
Bioperl kullanır. Arabirim karmaşık olmayan terim
ve anlatımlarla kendiliğinden anlaşılır.
EXPRESSO, Taylor ve Orengo tarafından yazılan
bir program olan SAP’ı kullanarak yapıları hizaya
sokar. Dizileri ve yapıları Kenji Mizuguchi’den bir
dizi paketi (Cambridge üniversitesinde Tom
Blundell’s Laboratuarında geliştirilen) olan
FUGUE’yi
kullanarak
hizaya
sokar.
www.tcoffee.org üzerinde CORE sunucusu en
yaygın formatların (MSF, ALN, FASTA ve PIR)
herhangi biriyle çoklu dizi hizalama kalitesini
değerlendirebilir.
Kullanımda sınırlamalar
-
Tcoffee için input maksimum dizi sayısı 50 ve
maksimum dizi uzunluğu 2000’e kadar
sınırlandırılmıştır.
- Veriler sunucu üzerinde sadece dokuz gün
kullanılabilir
olarak
kalacaktır.
Sonra
silinecektir.
- Kaynaklarını kullanırken Tcoffee yazarlarına
atıfta
bulunmak
önemlidir.
Örneğin,
Tcoffee’nin sınırlı sürümünü kullanırsanız
belirtilen makaleye atfedin:Notredame, D. Higgins, J. Heringa . T-Coffee: A
novel method for multiple sequence alignments.
Journal of Molecular Biology, Vol 302, pp205217, 2000.
Aksi takdirde, kullandığınız sunucuya karşılık
gelen
makaleye
atıfta
bulunun
(www.tcoffee.org üzerindeki her sunucuyla
alakalı “cite” tuşuna tıklayarak).
Tcoffee’nin aygıtları, belirli özellikleri ve
yeni özellikler
Hizalama
TCOFFEE (normal ya da gelişmiş düzeyde): Çoklu
dizi hizalama ve ilişkilendirilmiş filogenetik
ağacı hesaplar.
EXPRESSO (3DCoffee) (normal ya da gelişmiş
düzeyde): Bu sunucu yapı temelli Çoklu Dizi
Hizalamalarını hesaplar.
MCOFFEE (normal ya da gelişmiş düzeyde):
Birkaç çoklu dizi hizalama paketininin (PCMA,
Poa, Mafft, Muscle, T-Coffee, ClustalW,
ProbCons, DialignT) output’unu (çıkış)
birleştirerek çoklu dizi hizalama ve ilişkilendirilmiş filogenetik ağacı hesaplar.
COMBINE (normal ya da gelişmiş düzeyde): iki
(veya daha fazla) çoklu dizi hizalamalarını tek
bir tanesinde birleştirir.
RCOFFEE (normal ya da gelişmiş düzeyde):
RNAplfold tarafından oluşturulan tahmini
ikincil yapıları kullanarak Kodlanmayan RNA
Dizilerinin Çoklu Dizi Hizalaması.
Değerlendirme
CORE (normal ya da gelişmiş düzeyde):
Hizalamanızı ve kötü kısımlarının mavi iyi
olanların kırmızı olduğu renkli çıktılarınızı
değerlendirir. Hizalamanız en azından dört dizi
içermelidir.
iRMSD-APDB (normal ya da gelişmiş düzeyde):
İkili olarak doğru bir şekilde hizalanmış ya da
yapıları bilinen dizilerin çoklu hizalamasında
sütunların oranını tahmin eden APDB
kullanarak Çoklu Dizi Hizalamasını değerlendirir.
Dünya çapında
sunucuları listesi
kullanılabilir
Tcoffee
- www.tcoffee.org
- http://tcoffee.vital-it.ch/cgibin/Tcoffee/tcoffee_cgi/index.cgi
- http://www.es.embnet.org/Services/MolBio/tcoffee/
- http://www.ebi.ac.uk/t-coffee/
Ahmed MANSOUR
Genetik Bölümü,
Ziraat Fakültesi,
Zagazig Üniversitesi, Mısır
Download