GENOMİK VERİ BİLİMİ VE KÜMELEME Deniz TANIR Matematik Bölümü, Ege Üniversitesi Bornova, İzmir, Türkiye e-mail: [email protected] Özet: Her canlının yaşam kodunu tutan DNA dizileri, soyut olarak A, C, G ve T harfleriyle uzun diziler halinde bulunmaktadır. Bu dizilerin tanımlanması ve düzenlenmesi bir çok kalıtsal hastalığın tanısı ve tedavisi için önemli rol oynamaktadır. Başta insan genom projesi olmak üzere birçok türün genom dizilimini bulmak için yürütülen birçok proje, çok ilerlemiştir hatta sonuçlanmıştır. Elde edilen sonuçlarla birlikte artan genomik veri hacmi bir çok gereksinim doğurmuştur. Bunlardan bir tanesi de büyük miktardaki verilerin toplanıp saklandığında örüntüleri belirlemektir. Bu nedenle büyük ölçekteki gen ifade çalışmalarında önemli bir amaç genlerin ya da örneklerin biyolojik olarak önemli alt kümelerini bulmaktır. Seminerin konusu veri biliminde klasik bir problem olan kümeleme algoritmalaları ve bu algoritmaların gen ifadelerinde uygulanabilirliği üzerine olacaktır.