Doğrulanmış bir etkileşim - TR-Grid

advertisement
Protein-Protein
Etkileşimlerinin Hesaplamalı
Yöntemlerle Tahmin Edilmesi
Attila Gürsoy
Bilgisayar Mühendisliği
Koç Üniversitesi
Özet




Protein-protein etkileşimleri
Yapısal benzerlik ve evrimsel korunmuş
özellikleri kullanarak protein etkileşimlerinin
tahmin edilmesi
PRISM: protein-protein etkileşimleri için web
tabanlı sunucu ve veritabanı
Neden protein-protein etkileşimleri tahmin
hesaplarını grid üzerine taşımak istiyoruz?
Protein-protein etkileşimleri

Vücudumuzdaki birçok
biyolojik olay proteinlerin
birbirleri ile
bağlanıp/ayrışmaları
sonucunda geçekleşmektedir
(enzim/sübstrat, hormon/reseptör,
antikor/antijen bağlanmaları, sinyal
iletilmesi, maddelerin hücre içinde
taşınması, RNA/DNA sentezlenmesi
gibi)


Protein etkileşimlerinin
oluşmasını sağlayan ana
sebepleri anlamak moleküler
seviyede bu olayların kontrolu
için büyük bir adım olacaktır.
İlaç tasarımı
Protein etkileşimleri karmaşık bir ağ
oluşturur
The first model organism interaction maps were generated for yeast, over 5600
interactions involving 69% of the yeast proteins
Protein etkileşimlerin bulunması/tahmini

Deneysel



Yeast 2 Hybrid
Hesaplamalı
Protein/Gen veri tabanları






Dizi
İkincil yapılar
3 boyutlu yapı
Fonksiyonel anotasyonlar
Etkileşim verileri
Gen ifade dizileri





Protein Veri Bankası
http://www.pdb.org
3 boyutlu yapısı
bilinen proteinler
Şubat 2007:
40000’den fazla
protein yapı biligisi
Hızla artıyor
Ayın proteini (Ocak 2007)
İmportin : Taşıyıcı protein
Protein etkileşim arayüzü



Proteinlerin etkileştiği
yüzey bölgeleri.
İki protein arayüzeyinin
birbirine göre şekilsel ve
kimyasal olarak uyumlu
olması gerekmektedir.
Ara yüzlerdeki bazı kritik
ve evrim boyunca
korunmuş amino asitlerde
önemli.
Bilinen protein yapılarını kullanarak protein etkileşimlerini
tahmin etmek


Protein Veri Bankasında,
protein arayüzlerini
bulmamızı saylayacak
protein kompleksleri var.(1)
Bir arayüzün, başka bir
yüzeye benzerliğini
hesaplayarak (2)




IL
1
2
Geometrik benzerlik
Kimyasal benzerlik
Evrimsel korunum
Bu arayüz üzerinden
potansiyel olarak
etkileşebilecek proteinler
bulunabilir (3)
IR
3
TL
TR
…
TL x TR
Arayüzey benzerlik tanımı

Yapısal benzerlik



Evrimsel bezerlik



Üç boyutlu uzayda en az
farkı vercecek uygun
transformasyonu bulmak
“Geometrik hashing”
Arayüzler yapısal olarak
hizalanıp, korunmuş “sıcak
amino asitler” bulunabilir.
Yüzey çıkarma: NACESS
Yapısal hizalama: Multiprot
S. Hubbard and J. Thornton. NACCESS v2.1.1 - atomic solvent accessible area calculations, 1996.
http://wolf.bms.umist.ac.uk/naccess/.
M. Shatsky, R. Nussinov, and H. J. Wolfson. MULTIPROT - a multiple protein structural alignment algorithm. In Lecture Notes
in Computer Science, volume 2452, pages 235–250. Springer Verlag, 2002.
Sonuçlar: Tahmin edilen etkileşimler

PVB’den 2002 yılından
alınmış protein yapıları
kullanarak



67 arayüzey
6000 hedef protein
1 işlemci kullanarak
yaklaşık 1 ay hesaplama
süresi
Doğrulanmış tahminler
Doğrulanmış bir etkileşim
Verfied in literature
RAD50 - DNA double-strand break repair protein (1l8dB) ↔ BRCA1 Breast cancer susceptibility protein (1miuA) via 1aq5AC
Doğrulanmış bir başka etkileşim
MDM2 - P53 tumor supressor inhibitor (1ycqA) ↔ Growth factor receptor
bound protein (1azeA) via 1azeAB
Literatürde doğrulanmamış fakat yüksek
olasıklı bir etkileşim
Not directly verified literature but strong evidence exists
Vitamin D binding protein (1et1[AB]) ↔ Parathyroid hormone 1kxpD via1cosAC
PRISM http://prism.ccbb.ku.edu.tr
PRISM: web tabanlı mimari
PRISM Server
(http://prism.ccbb.ku.edu.tr)
Web Server
(Apache)
Client
Relational
Database
(MySQL)
PHP
External
Programs
PRISM Arayüz veritabanı ve sorgulama
Arayüz detayları, 3d görüntüleme
Online Help System
Personal History
Navigation Menu
Context Sensitive Help
PRISM


Tahmin edilmiş
protein
etkileşimlerin
sorgulanması
Etkileşim
algoritması yeni
yapılar için
çalıştırılarak, var
olan arayüzeyler
aracılığıyla
etkileşmesi
sorgulanabilir
PRISM Etkileşimlerin ağ olarak görüntülenmesi
Etkileşimlerin fonksiyonel benzerliklerine
göre gruplama
annotation
Parent_of
annotates
Neden Grid:
Şu andaki sonuçlar:
 Yaklaşık 6000 protein yapısı ve 67 arayüzey için (2002 PVB), 1
aylık bir hesaplama zamanı gerekti.
 Biyolojik verilerde ve algoritmalarda devamlı iyileşmeler oluyor
 Şu anda PVB’de 40000 yapı var
 Daha fazla arayüzey
 Arayüzeyleri daha iyi kategorize etme imkanı (kristal, biyolojik)
 Benzerlik hesabının daha iyi yapılması
 40000 protein, 2000 arayüz için bir CPU zamanı yaklaşık 240 gün
 Paralel versiyonu (MPI) süreyi önemli ölçüde kısaltıyor
Gride uyarlamanın avantajları






Daha hızlı. Algoritmada bağımsız bir çok iş var
Kullandığımız “yüzey çıkarma”, “dizi hizalama” ve
“yapısal hizalama” hesapları Grid üzerinden servis
olaraka alınabilir (yaygın).
Yeni algoritmalar geliştirildikçe, otomatik olarak
yeni algoritmaları kullanabilmek
Protein yapı bilgisine uzaktan hesap sırasında
erişebilmek
Yeni data geldikçe güncelleme
Hesaplanan etkileşim verileri diğer araştırmacılara
grid üzerinden servis olarak verilebilir.
Gride uyarlama

G-PPI: Protein-protein Interaction Prediction Application
 Koç Universitesi
 Attila Gürsoy, Özlem Keskin, Cengiz Ulubaş
 Bilkent Üniversitesi
 Cevdet Aykanat, Eray Özkural

Şu andaki durum


Bir yerel bilgisayarda çalışan paralel versiyon
Prototip grid uyarlaması
Bonn Presentation
24
Results DB
Prototip Mimari
Interaction Prediction
Service
Surface
Extraction
Service
Computing Element
Surface
Extraction
Service
Resource
Broker
Computing Element
Similarity
Scoring
Service
Computing Element
Similarity
Scoring
Service
Computing Element
Protein
Structure DB
Protein
Interface DB
Storage Element
Storage Element
Surface DB
Storage Element
Similarity
Scores DB
Storage Element
Download