Anlamsal Bilgi Yönetiminde Üst Veri Sistemlerinin ve Ontolojilerin Kullanımı Yaşar Tonta Hacettepe Üniversitesi Bilgi ve Belge Yönetimi Bölümü [email protected] yunus.hacettepe.edu.tr/~tonta/ 1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir 1 Plan • • • • • • • Durum saptaması Bibliyografik denetim FRBR, RDA Anlamsal Web Bağlı Veriler Sorgu Sistemleri Sonuç 1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir 2 Durum saptaması • • • • • • Web Hızlı bilgi artışı Dijital yerliler Sosyal ağlar Kullanıcılar tarafından üretilen üst veriler Kişiselleştirme 1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir 3 Kütüphane kataloğu: “Fiyatı yüksek vasat ürün” (Lloyd Sokvitne) • “Kullanıcılarımız basitlik ve anında ödül bekliyor ve bizi kütüphaneleri Amazon, Google, ve iTunes standartlarına göre yargılıyorlar. Bizim mevcut sistemlerimiz bunların yanında soluk kalıyor” (University of California, 2005, s. 7). Beyond the OPAC: Future Directions for Web-Based Catalogues Canberra: AustralianCommitteeon Cataloging, 18 September 2006.(http://www.nla.gov.au/lis/stndrds/grps/acoc/papers2006.html) 4 Düzenin Üç Düzeni 1. Nesnelerin kendilerinin düzenlenmesi 2. Nesnelerin üst verilerinin düzenlenmesi 3. Bit’lerin düzenlenmesi 1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir 5 Üst Veri • Yapay • Yapıcı • İşlem yapılabilir Kaynak: Coyle, K. (2010 January). Library Data in a Modern Context. Library Technology Reports, 46(1): 1-13. http://alatechsource.metapress.com/content/p3022442071g7655/fulltext.pdf 1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir 6 FRBR Kavramsal Modeli • Varlık-İlişki Veri Modeline dayanır Kullanıcı görevleri • Bul • Belirle • Seç • Sağla • İlişkilendir • Diğer olası görevler: – Telif hakları – Koruma BBY220 7 FRBR 1. Grup Varlıklar 1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir 8 Örnek – İnce Memed 1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir 9 Kataloğun işlevleri (Cutter, Rules for a Dictionary Catalog, 1876) • Bilinen bir kitabın yazarına, eseradına ve konusuna göre bulunmasını sağlamak • Bir kütüphanenin, bir yazarın belirli bir konudaki, belirli bir yazın türünde sahip olduğu kitapları göstermek • Bir kitabın seçiminde yardımcı olmak – Basımı açısından (bibliyografik olarak) – Özelliği açısından (yazınsal/konusal) BBY220 10 FRBR 2. Grup Varlıklar 1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir 11 FRBR 3. Grup Varlıklar 1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir 12 MARC’ta FRBR Varlıkları ve İlişkileri Kaynak: C. Oliver, Introducing RDA. Chicago: ALA, 2010. http://www.alastore.ala.org/pdf/9780838998908_excerpt.pdf 1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir 13 RDA: Resource Description and Access • • • • Kullanıcı gereksinimlerinin yanıtlanması Maliyet etkinliği Esneklik Süreklilik Kaynak: C. Oliver, Introducing RDA. Chicago: ALA, 2010. http://www.alastore.ala.org/pdf/9780838998908_excerpt.pdf 1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir 14 AACR2 - RDA Kaynak: http://www.loc.gov/catdir/cpso/RDAtest/rdaexamples.html 1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir 15 Anlamsal Web, 2001 “Anlamsal Web ayrı bir Web değil ama şimdikinin bir uzantısıdır. Anlamsal Web bilgiye iyi tanımlanmış anlam verilerek bilgisayarlarla insanların daha iyi işbirliği yaparak çalışmasını sağlar.” - Tim Berners-Lee, James Hendler and Ora Lassila; Scientific American, May 2001 BThaber Platform Bilgi ve Doküman Yönetimi, 30 Mart 2010, İTÜ Süleyman Demirel Kongre Merkezi, İstanbul 16 Anlamsal Web Mimarisi–Tim Berners-Lee Kaynak: http://www.w3c.org/2000/Talks/1206-xml2k-tbl/ BThaber Platform Bilgi ve Doküman Yönetimi, 30 Mart 2010, İTÜ Süleyman Demirel Kongre Merkezi, İstanbul 17 DBpedia 1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir 18 Dbpedia İstatistikleri Kaynak: Christian Bizer, Jens Lehmann, Georgi Kobilarov, Sören Auer, Christian Becker, Richard Cyganiak, Sebastian Hellmann: – A Crystallization Point for the Web of Data. Journal of Web Semantics: Science, Services and Agents on the World Wide Web, Issue 7, Pages 154–16 1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir 19 Türkçe DBpedia Henüz Yok 1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir 20 Wikipedia: Akasya Durağı 1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir 21 DBPedia: Akasya Durağı 1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir 22 Kongre Kütüphanesi Bağlı Veri Hizmeti 1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir 23 VIAF 1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir 24 Anlamsal Bilgi Yönetimi • Mevcut bilgilerin %20’si yapısal, %80’i yapısal olmayan metin halinde • Mevcut bilgilerin tanımları sınırlı • Makinece işlenebilir tanımlar gerekli (ör., RDF, OWL, XML) BThaber Platform Bilgi ve Doküman Yönetimi, 30 Mart 2010, İTÜ Süleyman Demirel Kongre Merkezi, İstanbul 25 Ontoloji Aracılığıyla Bilgi Bütünleştirmesi Kaynak: Warren ve Davies, 2007, s. 182 BThaber Platform Bilgi ve Doküman Yönetimi, 30 Mart 2010, İTÜ Süleyman Demirel Kongre Merkezi, İstanbul 26 Metindeki Varlıkların Bilgi Tabanındakilerle Karşılaştırılması Kaynak: Warren ve Davis, 2007 1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir 27 Shirky: Abartılı Ontoloji Kaynak: www.shirky.com/writings/ontology_overrated.html 1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir 28 Sadece Bağlantılar Kaynak: www.shirky.com/writings/ontology_overrated.html 1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir 29 Veri kalitesi ve yorum sorunları • Veri kalitesiyle ilgili semantik farklılıklar • Yorum sorunları (metrik sistem, “yıl” son 12 ay, takvim yılı, mali yıl…) Kaynak: Madnick ve Zhu, 2006, s. 462, 466 BThaber Platform Bilgi ve Doküman Yönetimi, 30 Mart 2010, İTÜ Süleyman Demirel Kongre Merkezi, İstanbul 30 Bağlı Veri 1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir 31 Bağlı Veri Kütüphaneler İçin Niçin Önemli? • Kütüphane kaynakları Web’de daha kolay bulunur • Kütüphane üst verilerine dayanan daha yaratıcı uygulamalar geliştirilebilir • Etkin kataloglama ve yenilik fırsatları sunar Kaynak: http://lodlam.net/2012/08/09/linked-data-for-libraries-video-from-oclc/ 1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir 32 Sözcüklerin kullanımı • • • • • • “ACCIDENT” “event” “incident” “situation” “problem” “difficulty” • “unfortunate situation” • “the subject of your last letter” • “what happened last week was…” • “Mr. A: We all know why we are here.” BThaber Platform Bilgi ve Doküman Yönetimi, 30 Mart 2010, İTÜ Süleyman Demirel Kongre Merkezi, İstanbul 33 Zadeh’ye Göre Arama Motorları • Yetersiz • İki değerli mantıkla işliyor, • Çıkarsama yapamıyorlar Kaynak: Zadeh, 2005, 2006) 1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir 34 Soru Yanıt Sistemlerine Dönüşüm • Dünya bilgisi • İlgililik (istatistiksel/anlamsal) – q: Vera’nın yaşı kaçtır? – p: Vera, Irene ile yaşıttır – r: Irene 65 yaşındadır • Algılama temelli bilgiden çıkarsama yapma – İki değerli mantık ve olasılık geçerli değil • Esas sorun doğal dil anlama sorunu Kaynak: Zadeh, 2005, 2006) 1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir 35 Sorunlar • Sorgu oluşturma – Eş anlamlı sözcükler (“çöp teorisi”) • Anlam yokluğu – “Telekom şirketi Türkiye Nebi Fışkın Müdür” – “10 Mayıstaki toplantısında İstanbul’da yerleşik Mobilfon yönetim kurulu Nebi Fışkın’ı CEO olarak atadı” • Bağlam yokluğu – Kullanıcının hangi bağlamda bilgi aradığı – COntext INterchange (COIN) • Sonuçların sunulması – Kullanıcılar ilk ekrandan sonrasına bakmıyorlar Kaynak: Warren ve Davies, 2007, s. 179-181 BThaber Platform Bilgi ve Doküman Yönetimi, 30 Mart 2010, İTÜ Süleyman Demirel Kongre Merkezi, İstanbul 36 Swanson’ın Yetersizlik Ön Kabulleri • Yanıt bulunmadıkça soru kesin olarak oluşturulamaz • Makine arama isteklerini uygun arama terimlerine çevirecek şekilde programlanamaz • Makineler anlamı tanıyamaz • Ya ustaca yapılmış ilgililik değerlendirmelerine ya da çok etkili mekanik süreçlere sahip olabilirsiniz, ama ikisine birden sahip olamazsınız Kaynak: Swanson, 1988 1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir 37 Sonuç • FRBR ve RDA geliştirilmeli • Kütüphane verileri web’in bir paçası olmalı • Kütüphanelerde geliştirilen ontolojiler web’e aktarılmalı • Kütüphaneler bağlı açık veri modeline geçmeye özendirilmeli 1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir 38 Anlamsal Bilgi Yönetiminde Üst Veri Sistemlerinin ve Ontolojilerin Kullanımı Yaşar Tonta Hacettepe Üniversitesi Bilgi ve Belge Yönetimi Bölümü [email protected] yunus.hacettepe.edu.tr/~tonta/ 1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir 39