Anlamsal Bilgi Yönetiminde Üst Veri Sistemlerinin ve Ontolojilerin

advertisement
Anlamsal Bilgi Yönetiminde
Üst Veri Sistemlerinin ve
Ontolojilerin Kullanımı
Yaşar Tonta
Hacettepe Üniversitesi
Bilgi ve Belge Yönetimi Bölümü
[email protected]
yunus.hacettepe.edu.tr/~tonta/
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
1
Plan
•
•
•
•
•
•
•
Durum saptaması
Bibliyografik denetim
FRBR, RDA
Anlamsal Web
Bağlı Veriler
Sorgu Sistemleri
Sonuç
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
2
Durum saptaması
•
•
•
•
•
•
Web
Hızlı bilgi artışı
Dijital yerliler
Sosyal ağlar
Kullanıcılar tarafından üretilen üst veriler
Kişiselleştirme
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
3
Kütüphane kataloğu: “Fiyatı yüksek
vasat ürün” (Lloyd Sokvitne)
• “Kullanıcılarımız basitlik ve anında ödül bekliyor ve bizi
kütüphaneleri Amazon, Google, ve iTunes standartlarına göre
yargılıyorlar. Bizim mevcut sistemlerimiz bunların yanında
soluk kalıyor” (University of California, 2005, s. 7).
Beyond the OPAC: Future Directions for Web-Based Catalogues Canberra: AustralianCommitteeon Cataloging, 18 September 2006.(http://www.nla.gov.au/lis/stndrds/grps/acoc/papers2006.html)
4
Düzenin Üç Düzeni
1. Nesnelerin kendilerinin
düzenlenmesi
2. Nesnelerin üst verilerinin
düzenlenmesi
3. Bit’lerin düzenlenmesi
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
5
Üst Veri
• Yapay
• Yapıcı
• İşlem
yapılabilir
Kaynak: Coyle, K. (2010 January). Library Data in a Modern Context. Library Technology Reports, 46(1): 1-13. http://alatechsource.metapress.com/content/p3022442071g7655/fulltext.pdf
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
6
FRBR Kavramsal Modeli
• Varlık-İlişki Veri Modeline
dayanır
Kullanıcı görevleri
• Bul
• Belirle
• Seç
• Sağla
• İlişkilendir
• Diğer olası görevler:
– Telif hakları
– Koruma
BBY220
7
FRBR 1. Grup Varlıklar
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
8
Örnek – İnce Memed
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
9
Kataloğun işlevleri (Cutter, Rules for a
Dictionary Catalog, 1876)
• Bilinen bir kitabın yazarına, eseradına ve
konusuna göre bulunmasını sağlamak
• Bir kütüphanenin, bir yazarın belirli bir konudaki,
belirli bir yazın türünde sahip olduğu kitapları
göstermek
• Bir kitabın seçiminde yardımcı olmak
– Basımı açısından (bibliyografik olarak)
– Özelliği açısından (yazınsal/konusal)
BBY220
10
FRBR 2. Grup Varlıklar
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
11
FRBR 3. Grup Varlıklar
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
12
MARC’ta FRBR Varlıkları ve İlişkileri
Kaynak: C. Oliver, Introducing RDA. Chicago: ALA, 2010. http://www.alastore.ala.org/pdf/9780838998908_excerpt.pdf
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
13
RDA: Resource Description and Access
•
•
•
•
Kullanıcı gereksinimlerinin yanıtlanması
Maliyet etkinliği
Esneklik
Süreklilik
Kaynak: C. Oliver, Introducing RDA. Chicago: ALA, 2010. http://www.alastore.ala.org/pdf/9780838998908_excerpt.pdf
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
14
AACR2 - RDA
Kaynak: http://www.loc.gov/catdir/cpso/RDAtest/rdaexamples.html
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
15
Anlamsal Web, 2001
“Anlamsal Web ayrı
bir Web değil ama
şimdikinin bir
uzantısıdır. Anlamsal
Web bilgiye iyi
tanımlanmış anlam
verilerek
bilgisayarlarla
insanların daha iyi
işbirliği yaparak
çalışmasını sağlar.”
- Tim Berners-Lee,
James Hendler and
Ora Lassila; Scientific
American, May 2001
BThaber Platform Bilgi ve Doküman Yönetimi, 30 Mart 2010, İTÜ Süleyman Demirel Kongre Merkezi, İstanbul
16
Anlamsal Web Mimarisi–Tim Berners-Lee
Kaynak: http://www.w3c.org/2000/Talks/1206-xml2k-tbl/
BThaber Platform Bilgi ve Doküman Yönetimi, 30 Mart 2010, İTÜ Süleyman Demirel Kongre Merkezi, İstanbul
17
DBpedia
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
18
Dbpedia İstatistikleri
Kaynak: Christian Bizer, Jens Lehmann, Georgi Kobilarov, Sören Auer, Christian Becker, Richard Cyganiak, Sebastian Hellmann:
– A Crystallization Point for the Web of Data. Journal of Web Semantics: Science, Services and Agents on the World Wide Web, Issue 7, Pages 154–16
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
19
Türkçe DBpedia Henüz Yok
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
20
Wikipedia: Akasya Durağı
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
21
DBPedia: Akasya Durağı
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
22
Kongre Kütüphanesi Bağlı Veri Hizmeti
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
23
VIAF
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
24
Anlamsal Bilgi Yönetimi
• Mevcut bilgilerin
%20’si yapısal,
%80’i yapısal
olmayan metin
halinde
• Mevcut bilgilerin
tanımları sınırlı
• Makinece
işlenebilir
tanımlar gerekli
(ör., RDF, OWL,
XML)
BThaber Platform Bilgi ve Doküman Yönetimi, 30 Mart 2010, İTÜ Süleyman Demirel Kongre Merkezi, İstanbul
25
Ontoloji Aracılığıyla Bilgi Bütünleştirmesi
Kaynak: Warren ve Davies, 2007, s. 182
BThaber Platform Bilgi ve Doküman Yönetimi, 30 Mart 2010, İTÜ Süleyman Demirel Kongre Merkezi, İstanbul
26
Metindeki Varlıkların Bilgi Tabanındakilerle
Karşılaştırılması
Kaynak: Warren ve Davis, 2007
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
27
Shirky: Abartılı Ontoloji
Kaynak: www.shirky.com/writings/ontology_overrated.html
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
28
Sadece Bağlantılar
Kaynak: www.shirky.com/writings/ontology_overrated.html
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
29
Veri kalitesi ve yorum sorunları
• Veri
kalitesiyle
ilgili semantik
farklılıklar
• Yorum
sorunları
(metrik
sistem, “yıl” son 12 ay,
takvim yılı,
mali yıl…)
Kaynak: Madnick ve Zhu, 2006, s. 462, 466
BThaber Platform Bilgi ve Doküman Yönetimi, 30 Mart 2010, İTÜ Süleyman Demirel Kongre Merkezi, İstanbul
30
Bağlı Veri
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
31
Bağlı Veri Kütüphaneler İçin Niçin Önemli?
• Kütüphane kaynakları
Web’de daha kolay
bulunur
• Kütüphane üst
verilerine dayanan daha
yaratıcı uygulamalar
geliştirilebilir
• Etkin kataloglama ve
yenilik fırsatları sunar
Kaynak: http://lodlam.net/2012/08/09/linked-data-for-libraries-video-from-oclc/
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
32
Sözcüklerin kullanımı
•
•
•
•
•
•
“ACCIDENT”
“event”
“incident”
“situation”
“problem”
“difficulty”
• “unfortunate situation”
• “the subject of your
last letter”
• “what happened last
week was…”
• “Mr. A: We all know
why we are here.”
BThaber Platform Bilgi ve Doküman Yönetimi, 30 Mart 2010, İTÜ Süleyman Demirel Kongre Merkezi, İstanbul
33
Zadeh’ye Göre Arama Motorları
• Yetersiz
• İki değerli mantıkla işliyor,
• Çıkarsama yapamıyorlar
Kaynak: Zadeh, 2005, 2006)
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
34
Soru Yanıt Sistemlerine Dönüşüm
• Dünya bilgisi
• İlgililik (istatistiksel/anlamsal)
– q: Vera’nın yaşı kaçtır?
– p: Vera, Irene ile yaşıttır
– r: Irene 65 yaşındadır
• Algılama temelli bilgiden çıkarsama yapma
– İki değerli mantık ve olasılık geçerli değil
• Esas sorun doğal dil anlama sorunu
Kaynak: Zadeh, 2005, 2006)
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
35
Sorunlar
• Sorgu oluşturma
– Eş anlamlı sözcükler (“çöp teorisi”)
• Anlam yokluğu
– “Telekom şirketi Türkiye Nebi Fışkın Müdür”
– “10 Mayıstaki toplantısında İstanbul’da yerleşik
Mobilfon yönetim kurulu Nebi Fışkın’ı CEO olarak
atadı”
• Bağlam yokluğu
– Kullanıcının hangi bağlamda bilgi aradığı
– COntext INterchange (COIN)
• Sonuçların sunulması
– Kullanıcılar ilk ekrandan sonrasına bakmıyorlar
Kaynak: Warren ve Davies, 2007, s. 179-181
BThaber Platform Bilgi ve Doküman Yönetimi, 30 Mart 2010, İTÜ Süleyman Demirel Kongre Merkezi, İstanbul
36
Swanson’ın Yetersizlik Ön Kabulleri
• Yanıt bulunmadıkça soru kesin olarak
oluşturulamaz
• Makine arama isteklerini uygun arama
terimlerine çevirecek şekilde
programlanamaz
• Makineler anlamı tanıyamaz
• Ya ustaca yapılmış ilgililik
değerlendirmelerine ya da çok etkili mekanik
süreçlere sahip olabilirsiniz, ama ikisine
birden sahip olamazsınız
Kaynak: Swanson, 1988
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
37
Sonuç
• FRBR ve RDA geliştirilmeli
• Kütüphane verileri web’in bir paçası olmalı
• Kütüphanelerde geliştirilen ontolojiler
web’e aktarılmalı
• Kütüphaneler bağlı açık veri modeline
geçmeye özendirilmeli
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
38
Anlamsal Bilgi Yönetiminde
Üst Veri Sistemlerinin ve
Ontolojilerin Kullanımı
Yaşar Tonta
Hacettepe Üniversitesi
Bilgi ve Belge Yönetimi Bölümü
[email protected]
yunus.hacettepe.edu.tr/~tonta/
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
39
Download