Protein-Protein Etkileşimlerinin Hesaplamalı Yöntemlerle Tahmin Edilmesi Attila Gürsoy Bilgisayar Mühendisliği Koç Üniversitesi Özet Protein-protein etkileşimleri Yapısal benzerlik ve evrimsel korunmuş özellikleri kullanarak protein etkileşimlerinin tahmin edilmesi PRISM: protein-protein etkileşimleri için web tabanlı sunucu ve veritabanı Neden protein-protein etkileşimleri tahmin hesaplarını grid üzerine taşımak istiyoruz? Protein-protein etkileşimleri Vücudumuzdaki birçok biyolojik olay proteinlerin birbirleri ile bağlanıp/ayrışmaları sonucunda geçekleşmektedir (enzim/sübstrat, hormon/reseptör, antikor/antijen bağlanmaları, sinyal iletilmesi, maddelerin hücre içinde taşınması, RNA/DNA sentezlenmesi gibi) Protein etkileşimlerinin oluşmasını sağlayan ana sebepleri anlamak moleküler seviyede bu olayların kontrolu için büyük bir adım olacaktır. İlaç tasarımı Protein etkileşimleri karmaşık bir ağ oluşturur The first model organism interaction maps were generated for yeast, over 5600 interactions involving 69% of the yeast proteins Protein etkileşimlerin bulunması/tahmini Deneysel Yeast 2 Hybrid Hesaplamalı Protein/Gen veri tabanları Dizi İkincil yapılar 3 boyutlu yapı Fonksiyonel anotasyonlar Etkileşim verileri Gen ifade dizileri Protein Veri Bankası http://www.pdb.org 3 boyutlu yapısı bilinen proteinler Şubat 2007: 40000’den fazla protein yapı biligisi Hızla artıyor Ayın proteini (Ocak 2007) İmportin : Taşıyıcı protein Protein etkileşim arayüzü Proteinlerin etkileştiği yüzey bölgeleri. İki protein arayüzeyinin birbirine göre şekilsel ve kimyasal olarak uyumlu olması gerekmektedir. Ara yüzlerdeki bazı kritik ve evrim boyunca korunmuş amino asitlerde önemli. Bilinen protein yapılarını kullanarak protein etkileşimlerini tahmin etmek Protein Veri Bankasında, protein arayüzlerini bulmamızı saylayacak protein kompleksleri var.(1) Bir arayüzün, başka bir yüzeye benzerliğini hesaplayarak (2) IL 1 2 Geometrik benzerlik Kimyasal benzerlik Evrimsel korunum Bu arayüz üzerinden potansiyel olarak etkileşebilecek proteinler bulunabilir (3) IR 3 TL TR … TL x TR Arayüzey benzerlik tanımı Yapısal benzerlik Evrimsel bezerlik Üç boyutlu uzayda en az farkı vercecek uygun transformasyonu bulmak “Geometrik hashing” Arayüzler yapısal olarak hizalanıp, korunmuş “sıcak amino asitler” bulunabilir. Yüzey çıkarma: NACESS Yapısal hizalama: Multiprot S. Hubbard and J. Thornton. NACCESS v2.1.1 - atomic solvent accessible area calculations, 1996. http://wolf.bms.umist.ac.uk/naccess/. M. Shatsky, R. Nussinov, and H. J. Wolfson. MULTIPROT - a multiple protein structural alignment algorithm. In Lecture Notes in Computer Science, volume 2452, pages 235–250. Springer Verlag, 2002. Sonuçlar: Tahmin edilen etkileşimler PVB’den 2002 yılından alınmış protein yapıları kullanarak 67 arayüzey 6000 hedef protein 1 işlemci kullanarak yaklaşık 1 ay hesaplama süresi Doğrulanmış tahminler Doğrulanmış bir etkileşim Verfied in literature RAD50 - DNA double-strand break repair protein (1l8dB) ↔ BRCA1 Breast cancer susceptibility protein (1miuA) via 1aq5AC Doğrulanmış bir başka etkileşim MDM2 - P53 tumor supressor inhibitor (1ycqA) ↔ Growth factor receptor bound protein (1azeA) via 1azeAB Literatürde doğrulanmamış fakat yüksek olasıklı bir etkileşim Not directly verified literature but strong evidence exists Vitamin D binding protein (1et1[AB]) ↔ Parathyroid hormone 1kxpD via1cosAC PRISM http://prism.ccbb.ku.edu.tr PRISM: web tabanlı mimari PRISM Server (http://prism.ccbb.ku.edu.tr) Web Server (Apache) Client Relational Database (MySQL) PHP External Programs PRISM Arayüz veritabanı ve sorgulama Arayüz detayları, 3d görüntüleme Online Help System Personal History Navigation Menu Context Sensitive Help PRISM Tahmin edilmiş protein etkileşimlerin sorgulanması Etkileşim algoritması yeni yapılar için çalıştırılarak, var olan arayüzeyler aracılığıyla etkileşmesi sorgulanabilir PRISM Etkileşimlerin ağ olarak görüntülenmesi Etkileşimlerin fonksiyonel benzerliklerine göre gruplama annotation Parent_of annotates Neden Grid: Şu andaki sonuçlar: Yaklaşık 6000 protein yapısı ve 67 arayüzey için (2002 PVB), 1 aylık bir hesaplama zamanı gerekti. Biyolojik verilerde ve algoritmalarda devamlı iyileşmeler oluyor Şu anda PVB’de 40000 yapı var Daha fazla arayüzey Arayüzeyleri daha iyi kategorize etme imkanı (kristal, biyolojik) Benzerlik hesabının daha iyi yapılması 40000 protein, 2000 arayüz için bir CPU zamanı yaklaşık 240 gün Paralel versiyonu (MPI) süreyi önemli ölçüde kısaltıyor Gride uyarlamanın avantajları Daha hızlı. Algoritmada bağımsız bir çok iş var Kullandığımız “yüzey çıkarma”, “dizi hizalama” ve “yapısal hizalama” hesapları Grid üzerinden servis olaraka alınabilir (yaygın). Yeni algoritmalar geliştirildikçe, otomatik olarak yeni algoritmaları kullanabilmek Protein yapı bilgisine uzaktan hesap sırasında erişebilmek Yeni data geldikçe güncelleme Hesaplanan etkileşim verileri diğer araştırmacılara grid üzerinden servis olarak verilebilir. Gride uyarlama G-PPI: Protein-protein Interaction Prediction Application Koç Universitesi Attila Gürsoy, Özlem Keskin, Cengiz Ulubaş Bilkent Üniversitesi Cevdet Aykanat, Eray Özkural Şu andaki durum Bir yerel bilgisayarda çalışan paralel versiyon Prototip grid uyarlaması Bonn Presentation 24 Results DB Prototip Mimari Interaction Prediction Service Surface Extraction Service Computing Element Surface Extraction Service Resource Broker Computing Element Similarity Scoring Service Computing Element Similarity Scoring Service Computing Element Protein Structure DB Protein Interface DB Storage Element Storage Element Surface DB Storage Element Similarity Scores DB Storage Element