uzaktan algılamada ileri sınıflandırma tekniklerinin karşılaştırılması

advertisement
T.C.
GEBZE YÜKSEK TEKNOLOJİ ENSTİTÜSÜ
MÜHENDİSLİK VE FEN BİLİMLERİ ENSTİTÜSÜ
UZAKTAN ALGILAMADA İLERİ
SINIFLANDIRMA TEKNİKLERİNİN
KARŞILAŞTIRILMASI VE ANALİZİ
İsmail ÇÖLKESEN
YÜKSEK LİSANS TEZİ
JEODEZİ VE FOTOGRAMETRİ MÜHENDİSLİĞİ
ANABİLİM DALI
TEZ DANIŞMANI
Doç. Dr. Taşkın KAVZOĞLU
GEBZE
2009
ii
ÖZET
TEZİN BAŞLIĞI:
Uzaktan Algılamada İleri Sınıflandırma Tekniklerinin
Karşılaştırılması ve Analizi
YAZAR ADI
:
İsmail ÇÖLKESEN
Global ve yerel ölçekteki birçok uygulamada yeryüzüne ait doğru ve hassas bilgilere
ihtiyaç duymaktadır. Bu bilgiler çevre kalitesinin analizi, şehircilik faaliyetleri, doğal
kaynakların yönetimi ve planlanması gibi çeşitli uygulamalar için önemli birer kaynak
durumundadır. Uzaktan algılama teknolojileri farklı konumsal ve spektral çözünürlüklerde,
değişik zaman aralıklarında yeryüzünü görüntüleyebilme kabiliyetine sahip olduğundan bu
bilgilerin elde edilmesinde önemli bir kaynak durumundadır. Bu geniş çalışma alanı içerisinde
uzaktan algılamanın en yoğun olarak kullanıldığı alan arazi örtüsü ve arazi kullanımının
belirlenmesidir. Uzaktan algılanmış görüntülerin sınıflandırılması arazi örtüsü ve/veya arazi
kullanımına ait bilgilerinin elde edilmesinde kullanılan en yaygın yöntemdir. Sınıflandırma
sonucu elde edilen tematik haritaların analizi ve yorumlanması ile yeryüzüne ait bilgilere
ulaşmak mümkün olmaktadır. Doğru ve güncel tematik haritaların kullanımı herhangi bir
çalışmanın başarı oranını artırabilir. Literatürde 1972’de ilk uydu görüntüsünün elde
edilmesinden günümüze kadar birçok sınıflandırma yöntemi geliştirilmiş ve çeşitli
derecelerde başarılar elde edilmiştir. Bu yöntemler arasında istatistiksel bir temele dayanan en
çok benzerlik sınıflandırıcısı en yaygın kullanılanıdır. Parametrik yaklaşımların istatistiksel
kabullere dayalı yapıları nedeniyle, son yıllarda uzaktan algılanmış görüntülerin
sınıflandırılmasında parametrik olmayan yöntemler (yapay sinir ağları, destek vektör
makineleri ve karar ağaçları) kullanılmaktadır.
Bu tez çalışmasının ikinci bölümünde uzaktan algılama ve temel esasları, sayısal
görüntü analizi, sınıflandırma yöntemleri ve çeşitli uydu sistemleri hakkında genel bilgiler
verilmiştir. Çalışmanın üçüncü bölümünde, son yıllarda uzaktan algılamada kullanılan ileri
sınıflandırma tekniklerinden destek vektör makineleri, karar ağaçları, karar ağacı iyileştirme
algoritmaları, yapay sinir ağları ve K-star sınıflandırıcıları ile ilgili literatür taraması
yapılmıştır. Çalışmanın dördüncü bölümü olan uygulama kısmında ise Gebze ilçesini
kapsayan Landsat ETM+ (1997) ve Terra ASTER (2002) görüntülerinin söz konusu
yöntemler ile sınıflandırılarak arazi örtüsü ve kullanımının belirlenmesi amaçlanmıştır. Bu
yöntemler ve elde edilen sonuçlar etkili faktörlerde (parametreler) göz önüne alınarak detaylı
iii
bir şekilde analiz edilmiştir. Sınıflandırıcıların sahip olduğu parametreler ve bu parametrelerin
sınıflandırma doğruluğuna etkileri muhtemel parametre kombinasyonları kullanılarak
incelenmiştir. Son olarak metotların kullanımları ve performansları en çok benzerlik yöntemi
ile karşılaştırılmıştır.
İleri sınıflandırma algoritmaları uzaktan algılanmış görüntülerin sınıflandırılmasında
etkili yöntemlerdir. Özellikle parametrik olmayan yapılarıyla destek vektör makineleri, yapay
sinir ağları, iyileştirilmiş karar ağaçları ve K-star sınıflandırıcıları en önemlileridir. Yüksek
genelleştirme kabiliyetleri ve sınıflandırma performanslarının yanında matematiksel ifadeleri
zor ve karmaşıktır. Sınıflandırma öncesinde kullanıcı tarafından belirlenmesi gereken çeşitli
parametrelere sahiptirler. Parametre seçimi sınıflandırma performanslarını önemli ölçüde
etkilediğinden en uygun parametre değerlerinin belirlenmesinin bu yöntemlerinin
kullanımında karşılaşılan en önemli problem olduğu söylenebilir. En çok benzerlik
sınıflandırıcısı basit bir matematiksel ifadeye sahip olmasına karşın bu çalışmada
değerlendirilen sınıflandırıcılarla karşılaştırıldığında sınıflandırma doğruluğu açısından daha
düşük sonuçlar üretmektedir. Elde edilen sonuçlar ileri sınıflandırma tekniklerinin uzaktan
algılanmış görüntülerin sınıflandırılmasında geleneksel sınıflandırıcılara göre iyi ve etkili bir
alternatif olduklarını göstermektedir.
iv
SUMMARY
TITLE
:
Comparing and Analyzing of Advanced Classifier Techniques in
Remote Sensing
NAME
: İsmail ÇÖLKESEN
Accurate and precise information about the Earth’s surface are required for many
applications at global and local scales. This information is invaluable sources in various
applications, such as environmental quality analysis, urban activities, managing and planning
of natural resources. Having a capability of monitoring the Earth’s surface at various spatial
and temporal scales, the remote sensing technology is the only source providing such
information. Within this wide application area determination of land cover and land use
information has been is the most concentrated issue in remote sensing field. Classification of
remotely sensed images has been the way of obtaining to land cover and land use information.
It is possible to acquire such information through the analysis and interpreting of thematic
maps produced after the classification process. The use of accurate and up to date thematic
maps can increase the success rate of any application. Numerous classification algorithms
have been developed and applied in the literature for the classification of remotely sensed
image since the first satellite image was acquired in 1972. Among these algorithms the
maximum likelihood classifier has been the most widely used one that is based on statistical
theory. In order to avoid the assumptions of the parametric approaches, non-parametric
methods (i.e. artificial neural networks, support vector machines and decision trees) have been
recently introduced for the classification of remote sensing images.
In the introduction part of this thesis, general information about the basic principles of
remote sensing, digital image analysis, classification techniques and various satellite systems
are given. In the second part, literature review about the advanced classification techniques
namely support vector machines, decision trees, decision tree enhancement algorithms,
artificial neural networks and K-star classifier are discussed. In the application part (Section
4), the classifiers were employed to determine land cover/use types of Gebze district of
Kocaeli using Landsat ETM+ (1997) and Terra ASTER (2002) images. The methods and their
results were analyzed in detail considering the effective factors (i.e. parameters). Parameters
of the classifiers and their effects on the classification accuracy were also examined by
v
applying possible combinations of the parameters. At the end, comparisons of the methods
were made in terms of their use and performances with the benchmark classifier, the
maximum likelihood.
Advanced classifier algorithms have been reported to be effective in the classification of
remotely sensed images. Especially, support vector machines, neural networks, enhanced
decision trees and K-star classifiers with their non-parametric natures are the most important
ones. Despite they have significant generalization capability and high classification
performances, their mathematical expressions are difficult and complex. In addition, they
have parameters that need to be defined by the analyst before the classification process. It can
be said that determining the optimum parameters is the main problem encountered in the use
of these methods since parameter choices significantly affect the classification performances.
The maximum likelihood classifier has a simple mathematical expression, but they produce
lower results in terms of classification accuracy compared to the classifier considered in this
research. Results show that advanced classifiers are good and effective alternatives to the
traditional parametric classifier for the classification of remotely sensed imagery.
vi
TEŞEKKÜR
Yüksek lisans tez çalışmamda, tez konusunun seçiminden hazırlanmasına
kadar tüm aşamalarında değerli görüşlerinden ve bilgisinden istifade ettiğim tez
danışmanım değerli hocam Sayın Doç.Dr. Taşkın Kavzoğlu’na,
Tez araştırması süresince değerli fikirleri yol gösteren Yrd.Doç.Dr Halis
Saka’ya ve bölümümüzde görev yapmakta olan değerli öğretim elemanlarına,
Bana, her konuda ilgisini ve desteğini hiçbir zaman eksik etmeyen sevgili eşim
Solmaz Çölkesen’e ve değerli aileme;
Teşekkürlerimi sunarım.
vii
İÇİNDEKİLER DİZİNİ
Sayfa
ÖZET
ii
SUMMARY
iv
TEŞEKKÜR
vi
İÇİNDEKİLER DİZİNİ
vii
ŞEKİLLER DİZİNİ
xi
TABLOLAR DİZİNİ
xv
1. GİRİŞ
1
2. UZAKTAN ALGILAMA VE TEMEL ESASLARI
4
2.1. Işık Kaynağı ve Elektromanyetik Enerji
4
2.2. Atmosferik Etkiler
6
2.3. Atmosferik Pencereler ve Nesnelerin İmzası
7
2.4. Uzaktan Algılamada Çözünürlük Kavramı
11
2.4.1. Konumsal Çözünürlük
12
2.4.2. Spektral Çözünürlük
14
2.4.3. Radyometrik Çözünürlük
14
2.4.5. Zamansal Çözünürlük
15
2.5. Uzaktan Algılamada Görüntü Analiz Sistemleri
16
2.5.1. Ön İşlem
16
2.5.2. Görüntü İyileştirme
18
2.5.3. Görüntü Dönüşümleri
19
2.5.4. Görüntü Sınıflandırma ve Analiz
20
2.5.4.1. Kontrolsüz Sınıflandırma
21
2.5.4.2. Kontrollü Sınıflandırma
22
2.5.4.2.1. En Kısa Uzaklık Sınıflandırıcısı
23
2.5.4.2.2. Paralel Kenar Sınıflandırıcısı
24
2.5.4.2.3. Mahalanobis Uzaklığı Sınıflandırıcısı
25
2.5.4.2.4. En Çok Benzerlik Sınıflandırma Algoritması
26
2.6. Uzaktan Algılama Uyduları
2.6.1. LANDSAT Uydu Sistemi
27
27
viii
2.6.2. TERRA Uydu Sistemi
29
2.6.3. SPOT Uydu Sistemi
29
3. UZAKTAN ALGILAMADA İLERİ SINIFLANDIRMA TEKNİKLERİ
3.1. Destek Vektör Makineleri
31
31
3.1.1. Doğrusal Olarak Ayrım Yapılabilen Veriler
33
3.1.2. Doğrusal Olmayan Veriler
37
3.1.3. Doğrusal Olmayan Destek Vektör Makineleri
41
3.1.4. Çok Sınıflı Destek Vektör Makineleri
43
3.1.5. DVM ile Sınıflandırmada Veri Ön İşleme ve Model Seçimi
46
3.2. Karar Ağaçları
3.2.1. Karar Ağacı Oluşturulmasında Kullanılan Yöntemler
48
51
3.2.1.1. Aşağıdan-Yukarıya Yaklaşımı
52
3.2.1.2. Yukarıdan-Aşağıya Yaklaşımı
52
3.2.1.2.1. Karar Ağaçlarında Dallanma Kriterleri ve Öznitelik Seçimi
54
3.2.1.2.2. Bilgi Kazancı ve Bilgi Kazanç Oranı Kriterleri
54
3.2.1.2.3. Gini İndeksi
57
3.2.1.2.4. Towing Kuralı
58
3.2.1.2.5. Ki-Kare Olasılık Tablo İstatistiği ( χ 2 )
58
3.2.1.3. Melez Yaklaşım
59
3.2.1.4. Gelişme-Budama Yöntemi
60
3.2.2. Veri Ayırma Yöntemine Dayalı Karar Ağacı Sınıflandırma Algoritmaları
60
3.2.2.1. Tek değişkenli Karar Ağaçları
61
3.2.2.2. Çok Değişkenli Karar Ağaçları
62
3.2.2.3. Melez Karar Ağacı Sınıflandırıcısı
64
3.2.3. Karar Ağaçlarının Budanması
65
3.2.4. Karar Ağaçlarının İyileştirilmesinde Kullanılan Yöntemler
68
3.2.4.1. Hızlandırma
69
3.2.4.2. Torbalama
71
3.2.4.3. Çoklu Hızlandırma
73
3.2.4.4. Rastgele Orman
73
3.2.4.5. DECORATE Algoritması
75
3.3. Yapay Sinir Ağları
3.3.1. Biyolojik ve Yapay Sinir Ağlarının Çalışma Prensibi
75
76
ix
3.3.2. Yapay Sinir Ağlarının Sınıflandırılması
3.3.2.1. Yapılarına Göre Yapay Sinir Ağları
79
79
3.3.2.1.1. İleri Beslemeli Yapay Sinir Ağları
79
3.3.2.1.2. Geri Beslemeli Yapay Sinir Ağları
80
3.3.2.2. Öğrenme Algoritmalarına Göre Yapay Sinir Ağları
80
3.3.2.2.1. Kontrollü Öğrenme
80
3.3.2.2.2. Kontrolsüz Öğrenme
81
3.3.2.2.3. Takviyeli Öğrenme
81
3.3.3. Çok Katmanlı Perseptron
3.3.3.1. Öğrenme Algoritmaları
3.3.4. Yapay Sinir Ağları ile Görüntü Sınıflandırma
3.4. Örnek Tabanlı Öğrenme ve K-Star Sınıflandırıcısı
4. UYGULAMA
81
82
85
87
93
4.1. Çalışma Alanı
93
4.2. Uygulama Konusu ve Amacı
94
4.3. Kullanılan Veri ve Yazılımlar
94
4.4. Uygulama Aşamaları
95
4.4.1. Uydu Görüntülerinin Geometrik Düzeltilmesi ve Yeniden Örneklenmesi
95
4.4.2. Arazi Örtüsü Sınıfları ve Eğitim Alanlarının Belirlenmesi
96
4.4.3. Uydu Görüntülerinin Sınıflandırılması
97
4.4.3.1. En Çok Benzerlik Yöntemi ile Sınıflandırma
98
4.4.3.2. Destek Vektör Makineleri ile Sınıflandırma
99
4.4.3.2.1. Polinom Kernel Fonksiyonu ile Sınıflandırma
100
4.4.3.2.2. Radyal Tabanlı Kernel Fonksiyonu ile Sınıflandırma
104
4.4.3.2.3. Pearson VII Fonksiyonu ile Sınıflandırma
108
4.4.3.3. Karar Ağaçları ile Sınıflandırma
111
4.4.3.3.1. C4.5 Karar Ağacı Algoritması ile Sınıflandırma
111
4.4.3.3.2. Karar Ağacı İyileştirme Algoritmaları ile Sınıflandırma
115
4.4.3.3.2.1. Hızlandırma Algoritması İle Sınıflandırma
115
4.4.3.3.2.2. Torbalama Algoritması İle Sınıflandırma
117
4.4.3.3.2.3. Çoklu Hızlandırma Algoritması İle Sınıflandırma
119
4.4.3.3.2.4. Rastgele Orman Algoritması İle Sınıflandırma
122
4.4.3.3.2.5. DECORATE Algoritması İle Sınıflandırma
125
x
4.4.3.4. Yapay Sinir Ağları ile Sınıflandırma
128
4.4.3.5. K-Star Algoritması İle Sınıflandırma
129
5. SONUÇLAR VE ÖNERİLER
132
KAYNAKLAR DİZİNİ
139
ÖZGEÇMİŞ
153
xi
ŞEKİLLER DİZİNİ
Şekil
Sayfa
2.1. Elektromanyetik dalgalar.
5
2.2. Elektromanyetik spektrum ve uzaktan algılamada kullanılan bölgeleri.
6
2.3. Toprak, bitki ve su için genelleştirilmiş spektral yansıtım grafiği.
10
2.4. Uzaktan algılama uyduları için anlık görüş alanının açısal ve uzunluk
olarak ifadesi.
13
2.5. Konumsal çözünürlük kavramı. (a) 1 metre, (b) 10 metre, (c) 30 metre
çözünürlüklü görüntüler.
13
2.6. En kısa uzaklık (spektral uzaklık) sınıflandırıcısı.
24
2.7. Paralelkenar sınıflandırıcısı.
25
3.1. İki sınıflı bir problemde verileri ayıran hiper düzlemler.
32
3.2. İki sınıflı bir problemde en uygun hiper düzlem, sınır ve destek
vektörleri.
32
3.3. Doğrusal olarak ayrılabilen veri setleri için hiper düzlemin
belirlenmesi.
35
3.4. Doğrusal olarak ayrılamayan veri seti.
38
3.5. Ayrım yapılamayan veri setleri için hiper düzlemler.
38
3.6. Doğrusal olmayan verin yüksek boyutlu uzaya dönüşümü ve verinin
doğrusal olarak ayrılması.
41
3.7. Beş boyutlu bir özellik uzayı ve üç sınıf için bir sınıflandırma ağacı.
Şekilde xi özellik değerlerini,η i eşik değerlerini ve Y ise sınıf
etiketlerini göstermektedir.
51
3.8. Tek değişkenli karar ağacının paralel eksenli karar sınırları.
61
3.9. Çok değişkenli karar ağacı sınıflandırıcısı için karar sınırları.
63
3.10. Melez karar ağacı sınıflandırıcısına ait örnek bir yapı.
64
3.11. Karar ağacı sınıflandırıcısının birleşimi olan sınıflandırıcı.
69
3.12. Biyolojik nöronun genel yapısı ve bileşenleri.
77
xii
3.13. Yapay nöronun genel yapısı ve bileşenleri.
78
3.14. Dört tabakalı ileri beslemeli basit bir çok katmanlı perseptron ağı.
82
4.1. Çalışma alanı haritası.
93
4.2. En çok benzerlik yöntemiyle elde edilen tematik haritalar.
(a) Landsat ETM+ görüntüsü, (b) Terra ASTER görüntüsü.
99
4.3. Landsat ETM+ uydu görüntüsü için düzenleme parametresi C’deki
değişimlerin sınıflandırma doğruluğuna etkisi.
101
4.4. Terra ASTER uydu görüntüsü için düzenleme parametresindeki (C)
değişimlerin sınıflandırma doğruluğuna etkisi.
101
4.5. Landsat ETM+ uydu görüntüsü için polinom derecesindeki (d)
değişimlerin sınıflandırma doğruluğuna etkisi.
102
4.6. Terra ASTER uydu görüntüsü için polinom derecesindeki (d)
değişimlerin sınıflandırma doğruluğuna etkisi.
102
4.7. Polinom kernel fonksiyonu kullanılarak elde edilen tematik haritalar.
(a) Landsat ETM+ görüntüsü, (b) Terra ASTER görüntüsü.
103
4.8. Landsat ETM+ uydu görüntüsü için düzenleme parametresi C’deki
değişimlerin sınıflandırma doğruluğuna etkisi.
104
4.9. Terra ASTER uydu görüntüsü için düzenleme parametresi C’deki
değişimlerin sınıflandırma doğruluğuna etkisi.
105
4.10. Landsat ETM+ uydu görüntüsü için Gama parametresindeki ( γ )
değişimlerin sınıflandırma doğruluğuna etkisi.
106
4.11. Terra ASTER uydu görüntüsü için Gama parametresindeki ( γ )
değişimlerin sınıflandırma doğruluğuna etkisi.
106
4.12. Radyal Tabanlı kernel fonksiyonu kullanılarak elde edilen tematik
haritalar. (a) Landsat ETM+ görüntüsü, (b) Terra ASTER görüntüsü.
107
4.13. Landsat ETM+ uydu görüntüsü için düzenleme parametresindeki (C)
değişimlerin sınıflandırma doğruluğuna etkisi.
109
4.14. Terra ASTER uydu görüntüsü için düzenleme parametresindeki (C)
değişimlerin sınıflandırma doğruluğuna etkisi.
109
4.15. PUK fonksiyonu kullanılarak elde edilen tematik haritalar.
(a) Landsat ETM+ görüntüsü, (b) Terra ASTER görüntüsü.
110
4.16. Landsat ETM+ görüntüsünün sınıflandırılması için (a) budama
öncesi, (b) budama sonrası oluşturulan modeller.
114
xiii
4.17. C4.5 algoritması ve ön budama yöntemiyle oluşturulan tematik
haritalar. (a) Landsat ETM+ görüntüsü (b) Terra ASTER görüntüsü.
114
4.18. Landsat ETM+ için oluşturulacak modelde seçilecek iterasyon sayısı
ve elde edilen sınıflandırma doğrulukları.
115
4.19. Terra ASTER için oluşturulacak modelde seçilecek iterasyon sayısı
ve elde edilen sınıflandırma doğrulukları.
116
4.20. Hızlandırma algoritması ile elde edilen tematik haritalar.
(a) Landsat ETM+ görüntüsü, (b) Terra ASTER görüntüsü.
116
4.21. Landsat ETM+ için oluşturulacak modelde seçilecek iterasyon sayısı
ve elde edilen sınıflandırma doğrulukları.
117
4.22. Terra ASTER için oluşturulacak modelde seçilecek iterasyon sayısı
ve elde edilen sınıflandırma doğrulukları.
118
4.23. Torbalama yöntemiyle elde edilen tematik haritalar.
(a) Landsat ETM+ görüntüsü, (b) Terra ASTER görüntüsü.
118
4.24. Landsat ETM+ için alt komitelerin sayısı ve sınıflandırma
doğrulukları.
119
4.25. Landsat ETM+ için iterasyon sayısı ve sınıflandırma doğrulukları.
120
4.26. Terra ASTER için oluşturulacak modelde seçilecek alt komitelerin
sayısı ve elde edilen sınıflandırma doğrulukları.
120
4.27. Terra ASTER için oluşturulacak modelde seçilecek iterasyon sayısı
ve elde edilen sınıflandırma doğrulukları.
121
4.28. Çoklu hızlandırma algoritması ile elde edilen tematik haritalar.
(a) Landsat ETM+ görüntüsü, (b) Terra ASTER görüntüsü.
122
4.29. Landsat ETM+ görüntüsü için çeşitli sayıdaki özellikler ile genel
sınıflandırma doğruluğundaki değişimler.
123
4.30. Landsat ETM+ görüntüsü için üç özellik kullanılarak oluşturulacak
ağaç sayıları ile genel sınıflandırma doğruluğundaki değişimler.
123
4.31. Terra ASTER görüntüsü için çeşitli sayıdaki özellikler ile genel
sınıflandırma doğruluğundaki değişimler.
124
4.32. Terra ASTER görüntüsü için her bir düğümde iki özellik ile
oluşturulacak ağaç sayıları ve genel sınıflandırma doğruluğundaki
değişimler.
124
4.33. Rastgele orman algoritması ile elde edilen tematik haritalar.
(a) Landsat ETM+ görüntüsü, (b) Terra ASTER görüntüsü.
125
xiv
4.34. DECORATE algoritması kullanılarak elde edilen tematik haritalar.
(a) Landsat ETM+ görüntüsü, (b) Terra ASTER görüntüsü.
127
4.35. Yapay sinir ağları kullanılarak elde edilen tematik haritalar.
(a) Landsat ETM+ görüntüsü, (b) Terra ASTER görüntüsü.
129
4.36. Landsat ETM+ görüntüsü için harmanlama parametresi ve genel
sınıflandırma doğruluğundaki değişimler.
130
4.37. Terra ASTER görüntüsü için harmanlama parametresi ve genel
sınıflandırma doğruluğundaki değişimler.
130
4.38. K-star algoritması kullanılarak elde edilen tematik haritalar.
(a) Landsat ETM+ görüntüsü, (b) Terra ASTER görüntüsü
131
5.1. Landsat ETM+ ve Terra ASTER görüntüsünün sınıflandırılmasında
kullanılan yöntemler ve elde edilen genel sınıflandırma doğrulukları.
132
xv
TABLOLAR DİZİNİ
Tablo
Sayfa
2.1. Landsat uydularının teknik özellikleri
28
2.2. Terra ASTER uydusunun teknik özellikleri
29
2.3. SPOT uydularının teknik özellikleri
30
3.1. Kernel fonksiyonları ve kullanımları
43
3.2. Adaboost yönteminde kullanılan eğitim verilerinin oluşturulması
71
3.3. Torbalama yönteminde kullanılan eğitim verilerinin oluşturulması
72
4.1. En Çok Benzerlik (EÇB) yöntemi ile elde edilen sınıflandırma
doğrulukları
98
4.2. Polinom kernel fonksiyonu için belirlenen en uygun parametre
değerleri ve elde edilen genel sınıflandırma doğrulukları
103
4.3. Radyal Tabanlı Fonksiyon Kerneli için belirlenen en uygun parametre
değerleri ve elde edilen genel sınıflandırma doğrulukları
107
4.4. Pearson VII fonksiyonu için belirlenen en uygun parametre değerleri
ve elde edilen genel sınıflandırma doğrulukları
110
4.5. Landsat ETM+ ve Terra ASTER görüntülerin budama yapılmaksızın
oluşturulan karar ağaçları ile sınıflandırılması ile elde edilen sonuçlar
112
4.6. Landsat ETM+ ve Terra ASTER görüntülerin ön budama yöntemiyle
oluşturulan karar ağaçları ile sınıflandırılması ile elde edilen sonuçlar
113
4.7. DECORATE algoritması için belirlenen en uygun parametre değerleri
ve elde edilen genel sınıflandırma doğrulukları
127
5.1. 1997 ve 2002 yıllarında arazi kullanımında meydana gelen
değişimlerin analizi
137
1
1. GİRİŞ
Uzaktan algılama teknolojilerinin kullanıldığı en önemli uygulama alanlarından
birisi uydu görüntüleri yardımıyla arazi örtüsü ve/veya arazi kullanımının
belirlenerek tematik haritalarının üretilmesidir. Arazi örtüsü ve/veya kullanımının
belirlenmesi gerek planlama gerekse doğal çevrenin korunması açısından son derece
önemlidir. Uzaktan algılama teknolojilerinin sahip olduğu en önemli avantajlar farklı
konumsal, spektral, radyometrik ve zamansal çözünürlüklere sahip görüntüleri
kullanma
imkanı
vermesidir.
Zamansal
çözünürlük
özellikle
arazi
örtüsü/kullanımında meydana gelen değişimlerin tespit edilmesi ve sürdürülebilir
çevre açısından önem kazanmaktadır.
Uydu görüntüleri üzerinden arazi örtüsü/kullanımının belirlenmesi için en
yaygın olarak kullanılan yöntem söz konusu görüntülerin sınıflandırılmasıdır.
Görüntü sınıflandırma işleminin esası görüntü üzerindeki çeşitli spektral özelliklere
sahip piksellerin, önceden belirlenen arazi örtüsü sınıflarından benzer olduğu bir
sınıfa atanması olarak ifade edilebilir. Uzaktan algılamada uydu görüntülerinin
sınıflandırılmasında kontrollü ve kontrolsüz sınıflandırma olarak bilinen iki yaklaşım
vardır. Kontrolsüz sınıflandırma genellikle arazi hakkında herhangi bir ön bilgiye
sahip olunmadığında veya arazi hakkında bir ön bilgi elde etmek için kullanılan bir
yaklaşımdır. Bu yöntemde görüntü piksellerinin sahip olduğu spektral özellikler
kullanılarak benzer özelliklere sahip piksellerin spektral sınıflar oluşturması ile işlem
gerçekleştirilir. Kontrollü sınıflandırma olarak bilinen yaklaşımda sınıflandırma
öncesinde tüm görüntüyü temsil eden ve sınıfları belli olan sınırlı sayıdaki piksellerin
kullanımı söz konusudur.
Kontrollü sınıflandırma yöntemlerinden literatürde en yaygın olarak kullanılan
ve günümüzde görüntü analiz programlarının birçoğunda yer alan yöntem en çok
benzerlik (EÇB) yöntemidir. EÇB istatistiksel bir teoriye dayanan parametrik bir
sınıflandırma yöntemidir. Sınıfların normal dağılımda olduğu varsayımı nedeniyle
sınırlandırmalar söz konusu olmasına rağmen bu yöntem en yaygın kullanılan
sınıflandırma metotlarından birisidir [Wang, 1990; Hansen et al., 1996]. Son yıllarda
2
uzaktan algılanmış görüntülerin sınıflandırılmasında kullanılmaya başlanılan yapay
sinir ağları, destek vektör makineleri, karar ağaçları ve örnek tabanlı sınıflandırıcılar
gibi güçlü ve yüksek genelleştirme kabiliyetine sahip kontrollü sınıflandırma
yöntemleri uygulamalarda yer almaktadır.
Başlangıçta iki sınıflı verilerin sınıflandırılmasında kullanılan destek vektör
makineleri (DVM) sınıflar arasındaki en uygun ayrımı yapan bir hiper düzlemin
belirlenmesi esasına dayanmaktadır. DVM uzaktan algılanmış görüntülerde olduğu
gibi çok sınıflı ve doğrusal olmayan verilerin sınıflandırılmasında kernel
fonksiyonlarını kullanarak veriyi daha yüksek boyutlu bir uzayda görüntülemekte ve
doğrusal olarak ayrımını gerçekleştirmektedir [Huang et al., 2002].
Karar ağaçları (KA) uydu görüntülerinin sınıflandırılması gibi karmaşık
yapıdaki bir sınıflandırma problemini çok aşamalı bir hale getirerek bir karar verme
işlemi gerçekleştirir [Safavaian and Landgrebe, 1991]. Her bir aşamada kullanılan
değişkenlerin sayısına bağlı olarak tek değişkenli veya çok değişkenli karar ağaçları
vardır [Friedl and Brodley, 1997]. Tek değişkenli karar ağaçları genellikle küresel
ölçekte arazi örtüsü sınıflandırmaları için kullanılmaktadır [DeFries et al., 1998;
Hansen et al., 2000]. Çok değişkenli karar ağaçları tek değişkenli karar ağaçlarına
göre daha hassas olmalarına rağmen, daha karmaşık algoritmalar içermektedirler.
Literartürde karar ağaçlarının sınıflandırma performansını arttırmaya yönelik çeşitli
yaklaşımlar geliştirilmiştir. Bunlar arasında en çok kullanılan yaklaşım birden çok
sınıflandırıcının birleştirilerek tek bir sınıflandırıcının elde edilmesi ve sonuç
sınıflandırıcının kullanılması olarak ifade edilen yaklaşımdır [Opitz and Maclin,
1999; Pal and Mather, 2003]. Hızlandırma, torbalama, çoklu hızlandırma, rastgele
orman
ve
DECORATE
algoritmaları
birleştirme
işleminde
kullanılana
algoritmalardan en önemlileridir. Bu algoritmalar temel olarak yeniden örneklenen
eğitim setleri ile sınıflandırıcıların ayrı ayrı eğitilmesi ve sonuçta ortaya çıkan
tahminler ile sınıflandırma işleminin gerçekleştirilmesi işlemlerini içermektedirler.
Yapay sinir ağları insan beynindeki nöronların temel çalışma prensibini esas
alan sınıflandırma yöntemleridir. Eğitim örneklerini kullanarak problemi öğrenmekte
ve test verileri ile yöntemin geçerliliği test edilmektedir. YSA algoritmalarının
istatistiksel kabul gerektirmemeleri, farklı kaynaklardan gelen farklı karakterdeki
3
bilgileri aynı anda kolaylıkla kullanabilmeleri, gürültüyü tolere edebilmeleri ve
öğrenebilme kabiliyetlerinden dolayı bu konuda birçok araştırma yapılmasına neden
olmuştur. Günümüzde birçok yapay sinir ağı modeli geliştirilmiştir [Lippman, 1987].
Bunlar arasında çok katmanlı perseptron (ÇKP) uzaktan algılanan görüntülerin
sınıflandırılmasında en yaygın olarak kullanılan [Paola and Schowengerdt, 1995;
Atkinson and Tatnall, 1997] yöntem olmuştur.
Örnek tabanlı sınıflandırıcılar, pikseller arasındaki spektral uzaklıkların yada
benzerliklerin belirlenmesi ile sınıflandırma işlemini gerçekleştiren yöntemlerdir.
Söz
konusu
uzaklıkların
belirlenmesinde
çeşitli
uzaklık
(benzerlik)
fonksiyonlarından yararlanmaktadırlar. Cleary and Trig (1997) tarafından önerilmiş
K-star sınıflandırıcısı pikseller arasındaki uzaklığın belirlenmesinde bilgi teorisine
dayanan entropik uzaklık ölçüsünü kullanmaktadır.
Bu tez çalışmasında Kocaeli ili, Gebze ilçesini kapsayan 1997 ve 2002 tarihli
Landsat
ETM+
ve
Terra
ASTER
uydu
görüntüleri
üzerinden
arazi
örtüsü/kullanımının belirlenerek, tematik haritaların elde edilmesi amaçlanmıştır.
Sınıflandırma işleminde en çok benzerlik sınıflandırıcısının yanında tez kapsamında
detaylı olarak incelenen ileri sınıflandırma tekniklerinden yapay sinir ağları, destek
vektör makineleri, karar ağaçları ve K-star sınıflandırıcıları kullanılmıştır. Bu
tekniklerin yanında hızlandırma, torbalama, çoklu hızlandırma, rastgele orman ve
DECORATE algoritmaları kullanılarak karar ağacı performansında meydana gelen
değişimler
analiz
edilmiştir.
Söz
konusu
ileri
sınıflandırma
tekniklerinin
kullanımında kullanıcı tarafından belirlenmesi esas olan parametreler ve bu
parametrelerin sınıflandırma sonucuna etkileri araştırılmış ve elde edilen sonuçlar
analiz edilmiştir. Yöntemler için belirlenen en uygun parametre değerleri
kullanılarak oluşturulan modeller ile Landsat ETM+ ve Terra ASTER görüntüleri
sınıflandırılmış ve çalışma alanına ait arazi örtüsü/kullanımını gösteren tematik
haritalar oluşturulmuştur. Çalışmada kullanılan tüm sınıflandırma yöntemleri
karşılaştırılarak uzaktan algılanmış görüntülerin sınıflandırılmasında kullanımları,
olumlu ve olumsuz yönleri değerlendirilerek irdelenmiştir.
4
2. UZAKTAN ALGILAMA VE TEMEL
ESASLARI
Uzaktan algılama bir cisimle direkt temas etmeksizin onun fiziksel özellikleri
hakkında bilgi elde etme bilimi olarak tanımlanmaktadır [Lillesand and Kiefer,
1994]. Yeryüzünden belirli uzaklıkta, atmosferde veya uzayda hareket eden
platformlara yerleştirilmiş ölçüm aletleriyle objelerle fiziksel temasa geçilmeksizin,
yeryüzünün doğal ve yapay objeleri hakkında bilgi alma ve bunları değerlendirme
tekniğidir [Sesören, 1999]. Jeoloji, ormancılık, hidroloji, tarım, şehircilik gibi bilim
dalları uzaktan algılamanın uygulamalarının bulunduğu, bütünleştiği bilim dalıdır.
Uzaktan algılamada uydular üzerinde taşınan algılayıcılar ile yapılan gözlem ve
ölçümler dikkate alınmaktadır. Uzaktan algılama sistemlerinde ölçülen nicelik,
ilgilenilen cisimden yayılan elektromanyetik enerjidir. Uydular veya hava araçları
üzerinde taşınan aletlerle yapılan gözlem ve ölçümlerde elektromanyetik enerjiden
yararlanılır [Kavzoğlu, 2008].
2.1. Işık Kaynağı ve Elektromanyetik Enerji
Uzaktan algılama teknolojileri ile yeryüzündeki objelerin algılanabilmesinde
ilk gereksinim algılanmış enerji hedeften yayılmadıkça hedefi aydınlatmak için bir
enerji kaynağına sahip olunmasıdır. Uzaktan algılamada kullanılan en önemli enerji
kaynağı güneştir. Elektromanyetik enerji elektromanyetik dalgalar olarak yeryüzüne
ulaşır. Işık bir enerjidir ve güneşten gelen elektromanyetik dalgalar halinde
yeryüzüne ulaşır. Bu enerji elektromanyetik radyasyon şeklindedir. Uzaktan
algılamada, enerjinin ışıma yolu ile taşınması elektromanyetik radyasyon olarak
ifade edilir. Şekil 2.1’de genel yapısı gösterilen elektromanyetik radyasyon (EMR)
bir elektriksel alan (E) ve elektriksel alana dik yönde bir manyetik alandan (M)
oluşur. Bu alanlarda ışık hızında hareket eden sinüzoidal yapıdaki dalgaların her ikisi
de yayılma yönüne dik açı yapmaktadırlar.
5
Şekil 2.1. Elektromanyetik dalgalar.
Bir elektromanyetik dalga tepesinden diğerine olan uzaklığa dalga boyu denir.
Birim zamanda sabit bir noktadan geçen dalga sayısı veya saniyedeki titreşim sayısı
frekans olarak adlandırılır. Elektromanyetik enerjinin yayılma hızı aynı ortam
içerisinde her yerde sabit olup 3x108 m/sn dir.
Elektromanyetik spektrum (EMS), 3x108 m/sn hızla hareket eden, dalga
uzunluğu nanometreden kilometreye kadar uzanan sürekli enerji ortamıdır. Bütün
cisimler az veya çok elektromanyetik enerji yayarlar. Elektromanyetik spektrum
yapılan çalışmalarda kolaylık sağlanması açısından belirli bölgelere ayrılmıştır.
Ancak bu bölgeler arasında kesin bir sınır yoktur ve bazı kısımları çakışabilmektedir
[Sesören, 1999]. Şekil 2.2’de elektromanyetik manyetik spektrum ve belirlenen
bölgeleri gösterilmektedir. Bu bölgelerden yaklaşık olarak 0.4 µm ile 0.7 µm arası
görünür bölge olarak adlandırılmakta ve insan gözünün görebildiği dalga boyu
aralığını ifade etmektedir. Görünür bölge dalga boyu aralığı içerisinde 0.4 µm ile 0.5
µm mavi, 0.5 µm ile 0.6 µm yeşil ve 0.6 µm ile 0.7 µm kırmızı renge karşılık gelen
dalga boylarıdır. Kızıl ötesi ışınlar özellikle de yakın kızıl ötesi; bitkilerde var olan
klorofile duyarlıdır. Mikro dalga ışınlar ise yükseklik ve neme ilişkin çalışmalarda
daha çok kullanılır. 0.4 µm 1.5 µm arası bitki, toprak ve kimyasal araştırmalar için
kullanılmaktadır. Termal bantlar yeryüzü ısısını gösterirler. Bu bantlar özellikle
jeolojik çalışmalar için önemlidir. Mineral, petrol ve kimya türü belirlenmesini bu
bantlar yardımıyla yapabilmektedir. Özellikle gece ve gündüz algılanmış görüntüler
bu araştırmalara yardımcı olur. Uzaktan algılanmış görüntülerin bilgisayarda
görüntülenmesinde sadece üç ana renge atama yapabileceğimizden seçeceğimiz üç
bantla False-Color görüntüleme yapılabilir [Kavzoğlu, 2008].
6
Dalga Boyu (metre)
Radyo
Mikrodalga
Kızılötesi
Görünür
Mor Ötesi
X - ışını
Gama - ışını
Frekans (Hz)
Şekil 2.2. Elektromanyetik spektrum ve uzaktan algılamada kullanılan bölgeleri.
2.2. Atmosferik Etkiler
Güneşten yayılan elektromanyetik enerji yeryüzüne ulaşmadan önce yoğun bir
atmosfer tabakasından geçişi ve atmosferi oluşturan bileşenler ile etkileşimi söz
konusudur. Bu enerjinin atmosferi oluşturan bileşenlerle etkileşimi sonucunda enerji
bir takım değişikliklere uğrar. Başka bir ifadeyle verilerin uçak veya uydu alıcıları
tarafından algılanmalarında, algılayıcı ile hedef arasındaki atmosfer ve ışınım
kaynağı ile hedef arasındaki atmosfer verileri etkiler. Atmosfer uzaktan algılama
verilerini saçılma ve soğurulma olmak üzere iki şekilde etkileyebilir. Saçılım,
ışınımın atmosferdeki taneciklerinden yansıması veya kırılması ile oluşur. Bu
tanecikler atmosferi oluşturan gaz molekülleri, toz tanecikleri ve su damlacıklarıdır.
Genel varsayım, ister güneşten gelsin ister yeryüzünden yansısın saçılan ışınımın
zayıflamayıp sadece yeniden yönlendiğidir. Bu yeniden yönlenme genel olarak dalga
boyuna bağlıdır. Saçılmayan ışınım ise, dalga boyuna bağlı olarak atmosfer
tarafından soğurulur ve sonuçta atmosfer, soğurulan bu ışınım tarafından ısınır. Hiç
soğurulma olmaması halinde saf saçılma olur. Bu durumda sadece enerji yeniden
yönlenmiş olur. Uzaktan algılamada saçılımın etkisi, algılayıcının enerjinin bir
bölümünü kaydedememesidir.
7
Saçılım, teorik olarak saçılan ışınımın dalga boyu ile saçılıma neden olan
taneciklerin büyüklüğü arasındaki bağıntıya bağlı olarak üç farklı kategoriye
ayrılabilir. Bunlar Rayleigh, Mie ve Seçici olmayan saçılımlardır.
Rayleigh Saçılımı, ışının dalga boyunun, saçan taneciklerden çok daha büyük
olması halinde oluşur. Bu saçılım sayesinde, gökyüzü mavi görünür. Güneşin
batışındaki kızıllığın nedeni de bu saçılımdır. Güneş ufka yaklaştığında ışınlar
atmosferde daha uzun bir yol kat ettiğinden daha kısa dalga boylu olan ışınımlar
saçılır ve sadece kırmızı ve turuncu gibi daha uzun dalga boylu ışınım gözümüze
gelir. Bu saçılımın etkisini gidermek için hava fotoğrafı çekimi sırasında özel filtreler
konmaktadır. Mie saçılımı, ışığın dalga boyunun atmosferdeki taneciklerle yaklaşık
eşit büyüklüklerde olmasından kaynaklanır. Bu saçılım genellikle puslu atmosferik
koşullardaki spektrum boyunca oluşur ve görüntülerde genel bir kalite düşüklüğü
şeklinde kendini gösterir. Seçici olmayan saçılım ise, taneciklerin ışının dalga
boyundan çok daha geniş olması halinde oluşur. Bu saçılım genellikle atmosferin çok
toz yüklü olması durumunda ortaya çıkar ve elde edilen verilerin önemli ölçüde
zayıflamasına yol açar [Örmeci, 1987].
2.3. Atmosferik Pencereler ve Nesnelerin İmzası
Atmosfer,
güneşten
yeryüzüne
gelen
elektromanyetik
enerjinin
bazı
bölümlerini büyük oranda soğururken, bazı bölümlerinin geçişine izin vermektedir.
Elektromanyetik spektrumun fazla soğrulmadan atmosferden geçen bölümleri
atmosferik pencereler olarak adlandırılmaktadır [Tatar ve Tatar, 2006]. Diğer bir
ifadeyle atmosferik pencereler, elektromanyetik spektrumun radyasyonun geçmesine
izin verdiği kısımlardır [Sesören, 1999]. Elektromanyetik spektrumda atmosferik
pencerelerin bulunduğu dalga boyu bölgelerinde atmosferin içerisinde bulunan
bileşikler güneşten gelen elektromanyetik enerjiyi; soğurma, yansıtma ve saçılma
nedeniyle fazlaca etkilemezler. Bu nedenle, atmosfere gelen enerji pencerelerin
bulunduğu yerlerden geçerek yeryüzüne ulaşabilirken, pencerelerin bulunmadığı
dalga boyu aralıklarında atmosferden hemen hemen hiç geçememekte, dolayısıyla
yer yüzeyine ulaşamamaktadır. Başlıca atmosferik pencereler, mor ötesi, görünür
bölge, termal bölge, mikrodalgalar ve radar bölgelerinde bulunmaktadır. Uzaktan
8
algılama çalışmalarında uygulama konusuna göre bant seçiminde söz konusu
atmosferik pencereler son derece önemlidir. Elektromanyetik enerjinin 400 µm’den
küçük ve 1 µm’nin üzerindeki dalga boyları atmosferin bileşenleri tarafından
soğurulur. Görünür bölge dalga boyu aralığının tamamı bir atmosferik pencereye
oluştururken, kızılötesi dalga boyu aralığının yalnızca bazı bölgelerinde atmosferik
pencereler mevcuttur. Bu nedenle uzaktan algılama uygulamalarında görünür,
kızılötesi ve termal dalga boyları kullanılmaktadır [Sesören, 1999].
Uzaktan algılama dalga uzunluğu ve cismin ısısına bağlı olarak ışıyan enerji
miktarı önemlidir. Elektromanyetik enerji katı, sıvı veya gaz halindeki cisimlerle
temasta şiddet, doğrultu, dalga uzunluğu, polarizasyon ve faz farkı gibi bakımlardan
birçok değişikliğe uğramaktadır. Uzaktan algılamada bu değişiklikler belirlenip,
kayıt edilir. Bu işlem sonucu ortaya çıkan görüntü ve veriler kayıt edilen
elektromanyetik ışınımda değişikliğe neden olan cismin özelliklerinin belirlenmesi
için yorumlanmaktadır [Örmeci, 1987].
Bir cisme veya yüzeye kaynaktan (güneş) gelen enerji geçirilir, yutulur, saçılır
ve/veya yansıtılır. Cisim ve enerji arasındaki bu ilişki uzaktan algılamanın temelini
oluşturmaktadır. Uzaktan algılanmış görüntülerde her element veya objenin yapısına
göre bu objeler farklı şekilde algılanır. Diğer bir ifadeyle, yeryüzü üzerindeki her bir
objenin elektromanyetik enerji ile ilişkisi farklıdır. Uzaktan algılamada buna
nesnelerin imzası veya özel davranışı denir. Yeryüzü üzerindeki objelerin uzaktan
algılama yöntemiyle ayırt edilebilmelerinin en önemli nedeni; yeryüzü üzerinde
bulunan objelerin farklı spektral özelliklere sahip olmasıdır. Uzaktan algılama
sistemleri, seçilen dalga boyu bantlarında yer yüzeyindeki cisimlerden yansıyan ve
yayılan enerji miktarlarındaki değişimleri kayıt etmektedir. Veriler, fotoğrafik
algılayıcılarla doğrudan doğruya fotoğrafik film olarak kaydedilebileceği gibi;
tarayıcı sistemlerle yansıyan veya yayılan enerji manyetik bir banda sayısal olarak
kaydedilebilir. Daha sonra elde edilen bu veriler yeryüzü üzerindeki objelerin
yorumlanması ve analizi için kullanılmaktadır.
Elektromanyetik enerjinin herhangi bir cisimle etkileşimi dalga boyuyla
ilişkilidir. Bir başka deyişle, farklı etkileşimler enerjinin farklı dalga boylarında olur.
Enerji etkileşiminin dalga boyuna bağımlı olması nedeniyle, uzaktan algılayıcılar
9
farklı cisimlerdeki bu değişikliği çeşitli dalga boyları için ayırt edilebilecek şekilde
tasarlanmıştır. Yansıyan, soğurulan ve geçirilen enerji miktarı; yeryüzüne ait
nesnenin türü ve durumuna bağlı olarak değişmektedir. Bu değişiklikler, bir görüntü
üzerindeki farklı nesneleri sınıflandırma olanağı verir. Söz konusu nesne için
yansıyan, soğrulan ve geçirilen enerji her bağımsız dalga boyunda farklılık gösterir.
Bu nedenle herhangi iki nesne bir spektral alanda sınıflandırılamazken, bir başka
dalga boyu bandında çok büyük farklılıklar gösterebilir.
Uzaktan algılanan verilerinin bilgisayar ortamında analiz edilebilmesi için
objelerin spektral özelliklerinin bilinmesi gerekmektedir. Bu nedenle çeşitli bitki
örtülerinin, toprağın, suyun ve ilgilenilen diğer yer yüzeyi özelliklerinin spektral
özelliklerinin bilinmesi, uzaktan algılanan verilerin uygun bir şekilde analizi ve
yorumlanması açısından son derece önemlidir [Maktav ve Sunar, 1991]. Şekil 2.3’te
bitki örtüsü, toprak ve suya ait spektral yansıma eğrileri gösterilmiştir. Şekilde
görüleceği üzere yeşil bitki örtüsünün spektral yansıtımı diğerlerinden farklı olup
dalga boyuna göre değişmektedir. Görünür dalga boylarında (0.4–0.7 µm) özellikle
yeşil bitkilerin yapısında yoğun bir şekilde bulunan klorofil maddesi önemlidir.
Yakın kızılötesi bölgesinde yansıtım önemli derecede artar, çünkü bu bölgede yeşil
yaprak çok az enerji soğurmaktadır. Orta kızıl ötesi bölgede ise su belirli dalga
boylarındaki enerjiyi çok fazla soğurur ve yeşil yapraklar çok fazla nem içerdiğinden
bu su-soğurma bantları bu bölgede baskındır. Bitkilerdeki klorofilin soğurması mavi
ve kırmızı bantlarda gerçekleşir. 0.5–0.6 µm arası klorofil yansıtması mavi ve
kırmızıya göre daha yüksektir. Ancak en yüksek yansıma değeri yakın kızılötesi
bölgesinde oluşur. Görünür dalga boylarında, yeşil bir yaprağa gelen enerjinin büyük
bir kısmı soğurulur ve çok azı yapraktan geçer. Yeşil dalga boylarındaki bu düşük
soğurma sağlıklı yaprakları yeşil olarak görmemize neden olmaktadır. Bitkilerin
yapısında karoten, ksantofil ve antosyanin pigmentleri bulunmaktadır. Yeşil bir bitki
yaşlandıkça yapısındaki klorofil miktarı azalır ve bitki yapısındaki karoten ve
ksantofil pigmentleri baskın hale gelir. Bu durum ağaç yapraklarının son baharda sarı
renk almasının temel nedenidir. Bazı ağaç türlerinin sonbaharda açık kırmızı
görünmesinin nedeni ise aynı şekilde klorofil miktarının azalması ile birlikte ağaç
yapısındaki antosyanin pigmentlerinin baskın hale gelmesidir.[Maktav ve Sunar,
1991].
10
60
Toprak
Yansıtma Oranı (%)
50
Bitki
40
30
Yakın Kızılötesi
20
Su
10
0.3
0.5
0.7
0.9
1.1
1.3
1.5
1.7
1.9
2.1
2.3
Dalga Boyları (µm)
Şekil 2.3. Toprak, bitki ve su için genelleştirilmiş spektral yansıtım grafiği.
Toprak maddelerinin çoğunun spektral özellikleri genellikle bitki örtülerinde
olduğu kadar karmaşık değildir. Toprağın spektral yansıması temel olarak kimyasal
yapısına (mineral ve organik maddeler), optik geometrik saçılmaya (parçacık
büyüklüğü ve pürüzlülük) ve yüzeyin nemlilik durumuna bağlıdır. Büyük tanecikler
arasındaki boşluklarda hava ve su birikir bu da yansıma değerini düşürür. Küçük
tanecikliler daha çok yansıma verir. Nemli olunca daha az yansıma verir. Organik
madde içeriği arttıkça yansıma değeri düşer ve toprak daha koyu gözükür. Demir
oksit miktarı da yansımayı düşürür. Topraktaki nemin belirlenmesinde termal bant
çok önemlidir. Çünkü nemli olan yerde buharlaşma olur ve çevreye göre daha
soğuktur. Yansıtıcı bölgede çok koyu termal bölgede çok açık olan bir toprak organik
içerik açısından zayıftır [Maktav ve Sunar, 1991].
Suyun spektral duyarlılığı dalga boyuna göre değişmektedir. Su ile enerji
arasındaki etkileşimler, suyun mevcut yapısının bir sonucudur ve suyun çeşitli
durumlarından etkilenir. Suyun diğer örtü tiplerinden ayrımı en iyi şekilde yansıtıcı
kızılötesi dalga boyları (yakın kızılötesi ve orta kızılötesi) kullanılarak yapılır. Su
kitlelerinin uzaktan algılama ile konumlandırılması ve sınıflandırılması, en kolay,
yakın kızılötesi dalga boylarında yapılabilir. Diğer taraftan suyun durumunun bazı
yönleri ise, görünür dalga boylarında elde edilen verilerin kullanılması ile en iyi
saptanabilir. Doğal bir ortamda, su çok sığ bile olsa, su kitleleri, yakın kızılötesi ve
11
orta kızıl ötesi dalga boylarının her ikisinde de, gelen enerjinin hemen hemen tümünü
soğurur. Suyun, enerjiyi, yakın ve kızıl ötesi dalga boylarında bu kadar etkin bir
biçimde soğurması nedeniyle, bu dalga boylarında yansıtılacak çok az enerji vardır.
Bu durum, su özelliklerinin, spektrumun yansıtıcı kızılötesi bölgesi boyunca, hem
bitki örtüsünden, hem topraktan daha önemli ve daha farklı bir düşük yansıtıma sahip
olmasına neden olduğundan, uzaktan algılama amaçları açısından oldukça
avantajlıdır. Kızılötesi yansıtımdaki bu tür belirgin farklar, su kitlelerinin kolaylıkla
tanımlanmasını ve haritalanmasını sağlamaktadır [Maktav ve Sunar, 1991].
Yeryüzü üzerindeki çeşitlilik düşünüldüğünde, yer yüzeyi üzerindeki objelerin
spektral özelliklerinin her yerde aynı olmadığı görülmektedir. Hatta herhangi bir
objeye ait spektral özelliklerin dahi coğrafi konuma ve zamana göre değişkenlik
gösterdiği söylenebilir. Örneğin buğday, güneyde olgunlaşmış ve biçilmekte iken,
aynı tarihte kuzeyde halen yeşildir ve bu nedenle buğday tamamen farklı bir spektral
özelliğe sahiptir. Zamana bağlı değişim göz önüne alındığında; örneğin Temmuz
ayında yeşil olan bir orman örtüsü, Eylül sonlarında cinsine bağlı olarak kırmızı, sarı
veya kahverengi olabilir. Çok sayıda yaprak döken ağaçlar ve geniş yeşil alanlara
sahip bölgeler; sonbaharda yapraklar ağaçlardan döküldükten ve çimenler sarardıktan
sonra, birkaç ay öncesine nazaran çok farklı spektral özelliğe sahip olacaklardır. Bu
nedenle, uzaktan algılama verileri için en uygun zamanın belirlenmesinde; yeryüzü
üzerindeki biyolojik çeşitliliğe ait mevsimsel değişimlerin veya zamana göre
değişebilirliğin dikkate alınması gerekir [Kavzoğlu, 2008].
2.4. Uzaktan Algılamada Çözünürlük Kavramı
Çözünürlük genel anlamda ekranda veya monitörde görünen piksel sayısını
ifade ederken uzaktan algılamada görüntüdeki bir pikselin yeryüzündeki karşılığını
ifade etmektedir. Bir resim, görüntü matrisini oluşturmak üzere ızgara biçiminde
küçük alanlara bölündüğü zaman oluşan her elemana resim elemanı ya da piksel adı
verilir. Geometrik ayrım, diğer bir ifadeyle çözünürlük kavramı ile yakından ilişkili
olan piksel sayısı görüntünün en küçük parçasıdır. Her bir piksel Ps x , Ps y boyutunda
bir resim elemanına karşılık gelir. Piksellerin bu Ps x , Ps y boyutuna geometrik
çözünürlük denir [Ayhan, 2003]. Pikseller genellikle kare biçimindedirler.
12
Yeryüzünde bir piksele karşılık gelen alan ne kadar değişik görünüm ve değere sahip
olursa olsun, pikselin bir spektral banttaki değeri tek bir sayı ile ifade edilir.
Sayısal bir görüntü, bir resmin sürekli bir biçimde sayısallaştırılması ile elde
edilebileceği gibi, modern çok bantlı tarayıcılar ve bazı elektronik kameralar ile
direkt olarak elde edilebilirler. Sayısal görüntü elde edebilen bir tarayıcı yapısı
itibariyle belirli bir anda yeryüzünde ancak belirli bir alana ait spektral değeri
kaydeder. Algılayıcının belirli bir anda yeryüzünde görüntüleyebildiği alana anlık
görüş alanı adı verilir. Uzaktan algılamada konumsal, spektral, radyometrik ve
zamansal çözünürlük olmak üzere dört farklı çözünürlük söz konusudur.
2.4.1. Konumsal Çözünürlük
Konumsal çözünürlük veya konumsal ayırma gücü görüntü üzerindeki
objelerin ayırt edilebilirliği ile ilgilidir ve belirlenebilen özelliğin olası en küçük
boyutunu ifade eder. Başka bir ifadeyle; bir görüntüleme sistemi tarafından kayıt
edilebilen iki nesne arasındaki en küçük uzaklık olarak tanımlanan konumsal
çözünürlük amaca bağlı olarak değişik ölçütlerle belirlenebilir [Ayhan, 2003]. Bu
ölçütlerden birisi algılayıcının anlık görüş alanıdır (AGA). Konumsal çözünürlüğün
en genel şekilde tanımı görüntüyü kaydeden sistemin alıcısının anlık görüş alanının
yeryüzünde karşılığı olarak ifade edilebilir. Anlık görüş alanı, uzaktan algılama
uyduları üzerinde bulunan tarayıcı optiğin gücünü ifade eder ve herhangi bir anda
belirli bir yükseklikten algılayıcı sensör ile gözlenen veya kayıt edilen yeryüzüne
karşılık gelen alan olarak tanımlanabilir. Uzaktan algılamada bir sensörün veya
alıcının anlık görüş alanı açısaldır; yeryüzündeki karşılığı da uydu yüksekliğine göre
değişebilmektedir (Şekil 2.4). Bu büyüklük aynı zamanda pikselin boyutuna eşittir.
Anlık görüş alanı açısal ve uzunluk olarak iki şekilde ifade edilebilir.
13
Şekil 2.4. Uzaktan algılama uyduları için anlık görüş alanının açısal ve uzunluk
olarak ifadesi.
Şekilde X-Y noktaları arasındaki mesafe anlık görüş alanıdır ve bu uzaklık
uydu görüntüsünde yaklaşık olarak bir piksele karşılık gelmektedir. Bu uzunluk
algılayıcı tarafından yeryüzünde ayırt edilmesi mümkün olan en küçük uzunluktur.
Şekil 2.5’de aynı bölgeye ait farklı konumsal çözünürlüğe sahip uydu
görüntülerine ait örnekler verilmiştir. Şekilde konumsal çözünürlüğün artmasıyla
görüntüdeki objelerin birbirinden ayırt edilebilirliğinin arttığı ve yorumlanma
açısından daha kolay bir hale geldiği açıkça görülmektedir. Aynı şekilde çözünürlük
azaldıkça objelerin ayırt edilebilmesi ve görüntünün analizi zorlaşmaktadır.
(a)
(b)
(c)
Şekil 2.5. Konumsal çözünürlük kavramı. (a) 1 metre, (b) 10 metre, (c) 30 metre
çözünürlüklü görüntüler.
14
2.4.2. Spektral Çözünürlük
Spektral
çözünürlük,
algılayıcının
kaydedebileceği
elektromanyetik
spektrumun dalga aralıklarını ve sayısını ifade etmektedir. Bu çözünürlük genel
tanımıyla kullanılan bantların sayısını ve genişliğini ifade eder. Spektral çözünürlük
yeryüzündeki
cisimlerin
ve
arazi
türlerinin
uzaktan
algılama
yolu
ile
tanımlanabilmeleri için gerekli olan en önemli özelliktir. Spektral özellik, her cismin
yansıma, yayılma, geçirgenlik ve soğurma özelliği olarak ifade edilebilir.
Algılayıcıların tasarımı da bu spektral özelliklerdeki değişiklikleri fark edecek ve
istenen ayrımları yapabilecek şekilde yapılmıştır. Yeryüzündeki cisimlerin spektral
özellikleri ile kendilerine has özellikleri arasında kuvvetli bir ilişki vardır. Her
spektral bant elektromanyetik spektrumun belirli bir bölümüne duyarlıdır. Bu
bölümlerde başlangıç ve bitiş dalga boyları ya da merkez frekansı ve bant genişliği
biçiminde verilir. Uzaktan algılama aletlerinin spektral ayırma gücü kullanılan bant
genişliği ile belirlenir. Daha iyi spektral çözünürlük özel bir kanal ya da bant için
daha dar dalga boyu aralığı anlamındadır. Teorik olarak spektrum ne kadar çok ve
küçük parçaya ayrılırsa, spektral ayırma gücü de o kadar artar. Bu nedenle en iyi
çözüm en az bant kullanılarak istenilen ayrımı yapabilmektir. Spektrumun
pozisyonu, genişliği ve sayısı hedefe göre düzenlenir. Spektrumun değişik
bölgelerini kullanan çok bantlı görüntülere Multi-Spektral Görüntüler adı verilir. Çok
bantlı veri setleri, her bir tabaka için dijital değerler ile her bir pikselin birleştirildiği
değişken sayıdaki tabakaları içermektedir. Veri içinde her bir tabaka bir bandı
kapsamaktadır. Uzaktan algılama uydularına ait spektral çözünürlük uydunun kaç
bantta görüntü verdiği ve kullanılan her bir bandın genişliğine özelliklerine göre
tanımlanır. Örneğin, Landsat MSS dört bant içinde verileri edinirken, Landsat TM
yedi bantlı bir sistem içinde aynı işlemi gerçekleştirir [Gibson, 2000].
2.4.3. Radyometrik Çözünürlük
Piksellerin yapısı, bir görüntünün uzaysal yapısını tanımlarken, radyometrik
özellikler bir görüntüdeki gerçek bilgiyi ifade etmektedir. Bir filmden ya da bir
algılayıcı tarafından elde edilen görüntünün elektromanyetik enerji miktarına
duyarlılığı, radyometrik çözünürlüğü ifade etmektedir. Yeryüzündeki her bir piksele
karşılık gelen alanlardan yansıyan ışığın şiddetine göre her obje, algılayıcılar
15
tarafından değişik derecelerde kaydedilir. Buna o alıcının radyometrik çözünürlüğü
adı verilir. Kısaca radyometrik çözünürlük, objeleri tanımlamada ve ayırt etmede
kullanılan toplam renk tonu sayısıdır. Derecelendirme veya tonlandırma ne kadar
yüksek olursa, ayırt etme gücü de o kadar yüksek olur. Bir uzaktan algılama
sisteminde radyometrik çözünürlük, siyah ve beyaz renkleri arasında ölçülen gri
derecelerinin sayısını ölçmektedir. Radyometrik çözünürlükte ölçme değeri bit olarak
adlandırılır. Bir bitlik sistem sadece iki gri düzeyini ölçebilmektedir (21=2). 8-bitlik
bir sistemde 256 gri derecesi kaydedilmektedir. Böyle bir sistemde siyah renk dijital
değer olarak sıfıra, beyaz renk ise 255 değerine atanmaktadır. Çoğu uzaktan algılama
sisteminde radyometrik çözünürlük 6-bit ya da daha fazladır [Gibson, 2000].
Birbirlerinden farklı amaçlara hizmet eden uydular farklı radyometrik çözünürlüklere
sahiplerdir. Örneğin, Landsat 1 ve Landsat 3 uyduları 6 bitlik çözünürlüğe sahipken,
Hyperion uydusu 12 bitlik çözünürlüktedir.
2.4.4. Zamansal Çözünürlük
Zaman içindeki değişimleri göstermeleri birçok cisim için ayrımı kolaylaştırıcı
etken olmaktadır. Görüntülerin farklı zamanlarda, değişik zaman aralıklarıyla
alınması çok zamanlı uydu görüntülerin elde edilmesini sağlar. Burada hem iki
görüntü arasındaki zaman farkı hem de alım zamanı önemlidir. Uygun zaman aralığı
amaca bağlı olarak yıl, mevsim, birkaç gün veya hafta olabilir. Uzaktan algılamanın
önemli işlevlerinden biri de zaman içerisindeki değişimleri izlemektir. Bu nedenle
algılayıcı sistemin ayırma gücü özelliklerin belirlenmesinde zamansal ayırma gücü
sistem için tanıtıcı bir özellik olmaktadır [Ayhan, 2003]. Uzaktan algılama sistemleri
için zamansal çözünürlük, aynı alan için hangi sıklıkta verilerin edinildiğini ifade
etmektedir [Gibson, 2000]. Bir alıcının belirli bir noktayı ardışık olarak
algılayabileceği zaman dilimidir. Örneğin, Spot uydusu 26 günde bir aynı noktadan
geçerken Landsat uydularından 1. 2. ve 3. uydular 18 günde bir; 4. 5. ve 6. uydular
ise 16 günde bir aynı noktadan geçerler. Atmosferik etkiler nedeniyle her uydu geçişi
sırasında yapılan kayıt kullanılamamaktadır.
16
2.5. Uzaktan Algılamada Görüntü Analiz Sistemleri
Uzaktan algılanan görüntülerin analiz ve yorumlanması, görüntüler üzerinden
yararlı bilgilerin çıkarılması için görüntüdeki değişik hedeflerin belirlenmesi veya
ölçümünü içerir. Hedefler; noktalar, çizgiler veya alanları içeren doğal veya yapay
özellikler olabilir ve bu hedefler yansıttıkları veya yaydıkları radyasyon yardımıyla
tanımlanabilirler.
Bu
radyasyon
bir
algılayıcı
tarafından
ölçülebilir
veya
kaydedilebilir. Hedefler ve onların çevresi ile arasındaki farkların gözlenmesi ton,
şekil, boyut, desen, doku, gölge ve ilişki gibi görüntü elemanlarının herhangi biri
veya hepsinin kullanılması ile gerçekleştirilir [Ayhan, 2003]. Elde edilen görüntüler
analog veya sayısal formatta olabilirler. Analog formatta görüntülenmiş görüntülerde
hedefin belirlenmesi ve yorumlanması bir yorumlayıcı tarafından manuel veya görsel
olarak yapılır. Sayısal formattaki görüntüler piksellerden oluşmaktadır. Görüntü
üzerindeki her bir piksel parlaklık derecesini gösteren sayısal bir değere sahiptir.
Pikseller bilgisayar ortamında bir araya getirilerek sayısal görüntü elde edilir. Özel
yazılımlarla bilgisayar ortamında piksellerin sayısal değerleri üzerinde sistematik
değişiklikler yapılabilmesi olanağı, görüntülerin sayısal olarak işlenmesi ve
yorumlanması için temel oluşturmaktadır. Görüntü analiz sistemlerinde en yaygın
görüntü işleme fonksiyonları; ön işlem, görüntü iyileştirme, görüntü dönüşümleri,
görüntü sınıflandırma ve analizidir [Lillesand and Kiefer, 1994].
2.5.1. Ön İşlem
Ön işlemler, elde edilen sayısal uydu görüntüsüne ait verilerden istenilen
bilgilerin veya özelliklerin elde edilmesi için gerekli olan hazırlıkları içerir ve bunlar
radyometrik ve geometrik düzeltmeler olarak sınıflandırılır. Ön işlem aşamasında
uydu görüntüleri radyometrik ve geometrik düzeltmelere tabii tutulurlar. Bazen bu
işlemlere görüntü restorasyonu veya rektifikasyonu adı verilir. Ön işlemde amaç,
algılayıcı ve platformdan kaynaklanan radyometrik ve geometrik bozulmaları
ortadan
kaldırmaktır.
Radyometrik
düzeltmeler,
algılayıcı
düzensizlikleri,
istenmeyen algılar, atmosferik gürültülerin düzeltilmesi ve sensör tarafından ölçülen
radyasyonun doğru şekilde gösterimi için gerekli dönüşümleri içerir. Geometrik
sapmalar ise birçok faktöre bağlıdır. Bunlar; algılayıcı aygıt optiğinin yapısı, tarama
sistemlerinin hareketi, platform hareketi, platformun yüksekliği, arazinin eğimi ve
17
yeryüzünün küreselliğidir [Kavzoğlu, 2008]. Uydu platformlarına monte edilmiş
algılayıcılardan elde edilen görüntüler ham hallerinde bazı hatalar ve eksiklikler
içerirler. Bu hataların ve eksikliklerin düzeltilmesi, istenen amaca uygun olarak
yapılacak uygulamalar öncesinde gerçekleştirdiğimizden dolayı bu tip işlemlere ön
işlemler adı verilir. Düzeltmelerin bazıları yer istasyonlarında yapılmasına rağmen,
kullanıcı tarafından da düzeltme yapılmasına sıkça gerek duyulmaktadır. Bu
düzeltmelerden
birisi,
atmosferik
etkilerin
giderilmesi
amacıyla
yapılan
düzeltmelerdir. Fakat bazı özel durumlarda bu düzeltmeye gerek duyulmaz. Tek bir
zamanda belirli bir alandaki bitki örtüsünün veya diğer özelliklerin analizlerinin
yapılmasında araştırmacı piksellerin asıl değerlerinden çok bu piksellerin birbirlerine
göre göreceli değerleri ile ilgilenildiğinden piksel değerlerinin atmosferik etkilerden
arındırılması gereksizdir. Fakat değişik zamanlarda elde edilen görüntülerin
kullanılmasında atmosferik etkilerin giderilmesi gerekir. Geometrik ve radyometrik
düzeltmeler görüntü iyileştirme ve görüntü sınıflandırma işlemlerinden önce
yapılması gereken ön işlemlerdir.
Geometrik düzeltmenin amacı, görüntüyü geometrik olarak gerçek dünyaya en
yakın şekle dönüştürmektir. Geometrik sapmaların birçoğu sistematik olduğundan
uygun modeller oluşturularak giderilebilir. Sistematik olmayan veya rastgele hatalar
modellenemez. Geometrik düzeltme, bilinen bir koordinat sistemine dönüşüm
yapılarak sağlanabilir. Geometrik düzeltme işlemi ile ham haldeki uydu görüntüsü,
bulunduğu resim koordinat sisteminden, görüntü üzerinde ve arazideki koordinatları
bilinen uygun sayı ve konumdaki yer kontrol noktaları yardımıyla arazi koordinat
sistemine dönüştürülür. Bu işleme görüntüden haritaya geçiş denir. Ham haldeki
görüntünün geometrik olarak düzeltilmesinde kullanılan bir diğer yöntem görüntüden
görüntüye dönüşümdür. Bu yöntemde daha önce coğrafik olarak referanslandırılmış
diğer bir görüntü yardımıyla, her iki görüntüdeki ortak noktalar kullanılarak
geometrik düzeltme işlemi gerçekleştirilir [Mather, 1987].
Uydu görüntüleri geometrik olarak düzeltilip kullanıcı tarafından belirlenmiş
herhangi bir koordinat sistemine bağlandıktan sonra ortaya çıkan görüntü eğiminden
dolayı oluşan piksellere yeni değerlerin atanması gerekir. Diğer bir ifadeyle,
geometrik olarak düzeltilmiş görüntü üzerindeki piksellere ait sayısal bilgiler
geometrik dönüşüm sonucunda olması gerekenden farklı olabilirler. Bu nedenle
18
düzeltilmiş görüntüdeki yeni piksellerin sayısal değerlerinin belirlenmesinde yeniden
örnekleme adı verilen bir işlem kullanılır. Yeniden örnekleme ile geometrik dönüşüm
öncesinde görüntüdeki orijinal sayısal piksel değerleri yardımıyla yeni piksel
değerleri hesaplanır. En yakın komşuluk, bilineer enterpolasyon ve kübik eğri olarak
bilinen üç farklı yöntem yeniden örnekleme işleminin gerçekleştirilmesinde
kullanılmaktadır. En yakın komşuluk yönteminde, orjinal görüntüde yeni piksel
konumuna en yakın sayısal piksel değerlerinden faydalanılarak düzeltilmiş piksel
değerleri hesaplanır. Bu metot basit bir mantığa dayanır ve orijinal değerler
değişmediğinden en çok tercih edilen yöntemdir. Bilineer enterpolasyon yönteminde,
orijinal görüntüde yeni piksel konumuna en yakın dört pikselin ortalama ağırlığı
kullanılarak yeni piksel değerleri hesaplanır. Bu durumda orjinal piksel değerleri
değişir ve yeni piksel değerleri oluşur. Kübik eğri yöntemi ile yeniden örnekleme
işleminde orijinal görüntüde yeni piksel konumunu çevreleyen sekiz pikselli bir
bloğun ağırlıklı ortalaması kullanılarak yeni piksel değeri hesaplanır. Bilineer
enterpolasyonda olduğu gibi bu metotta tamamen yeni piksel değerleriyle sonuçlanır.
Bir görüntüdeki bozukluklar ya da gürültüler; düzensizlikler ya da verinin
alınması ve veri iletimi esnasında meydana gelen olaylardan dolayı olabilir.
Bozuklukların ortak yapısı sistematik kayıplar içermesi ya da bant alımı esnasındaki
kayıplardır. Kayıp hatlar bant alımı esnasındaki değişim ve sürüklenmeden dolayı
meydana gelir. Kayıp hatlar normal olarak, hattın altında ya da üstündeki değerlerle
ya da her ikisinin ortalaması yeni bir hatla düzeltilir. Radyometrik bir düzeltmenin
gerçekleştirilmesi bazı filtreleme yöntemlerinin kullanılmasıyla da yapılabilmektedir
[Altuntaş ve Çorumluoğlu, 2002].
2.5.2. Görüntü İyileştirme
Görüntü iyileştirme işlemi, görüntünün görsel yorumlama ve anlaşılmasını
artırmak için yapılır. Görüntü üzerinde zıtlık ve netlik düzeltmeleri ve çeşitli
filtreleme teknikleriyle aynı ham görüntüden farklı renkli görüntüler üretilmesi
işlemidir [Tatar ve Tatar, 2006]. Hedeflerin farklı durumlarından dolayı spektral
yansımalarındaki büyük değişimlerle ilgili radyometrik düzeltmeler, bütün
hedeflerde optimum kontrast ve parlaklık gösterimi için hesaplanabilir. Bu nedenle,
her uygulama ve her görüntü için, mutlaka alanın tanınması ve yansıma değerlerinin
19
dağıtımı gereklidir [Sabins, 1987]. En yaygın olarak kullanılan örüntü iyileştirme
yöntemleri
lineer
kontrast
artırımı,
histogram
eşitleme,
yoğunluğa
göre
derecelendirme ve sahte renk (pseudo-color) dönüşümüdür.
Lineer kontrast artırımı yöntemi ile görüntüdeki minimum piksel değeri sıfıra,
maksimum piksel değeri de 255 değerine atanması için lineer enterpolasyon metodu
geliştirilir. Eğer renkli bir görüntü elde edilecekse, bu işlem üç bant için ayrı ayrı
yapılır ve sonra sonuçlar üç ana renk olan kırmızı, yeşil ve mavi (KYM)’ye atanır.
Histogram eşitleme yönteminde sadece minimum ve maksimum değerler yerine
görüntüdeki tüm piksel değerlerinin oluşturduğu histogram dikkate alınarak daha
karmaşık bir görüntü iyileştirme yapılabilir. Böylece histogramın boyutları ve şekli
dikkate alınmış olur. Bu metotta görüntüdeki her bir derecenin (renk tonunun)
yaklaşık olarak eşit sayıda piksel içerdiği kabulü yapılır. Histogram eşitleme görüntü
iyileştirme teknikleri arasında en çok kullanılan ve en iyi sonuç veren metottur. Bu
teknikte kenar gruplar birleştirilirken orta gruplar daha ayrık hale getirilip görüntü
kalitesi iyileştirilir. Yoğunluğa göre derecelendirme yönteminde amaç, ard arda gelen
bazı piksel değerlerini bir grup altında birleştirip; kırmızı, yeşil ve mavi (KYM)
olarak tanımlanmış bir renkle ifade etmektir. Sonuçta 0–255 aralığındaki değerler
birkaç renkle ifade edilir. Özellikle siyah-beyaz görüntülerdeki homojen alanların
renkli şekilde görüntülenmesinde kullanılır. Bu dönüşümle 256 renkli bir görüntüden
birkaç renge dönüşüm yapıldığından, görüntüdeki ayrıntılar kaybolur. Sahte renk
dönüşümü ile tek bir bandın gri tonlar yerine yalancı olara renklendirilmesidir. Bu
işlemi gerçekleştirmek için asal bir KYM histogram dönüşümü kullanılır. Ayrıntılı
bilgi Mather (1987) den elde edilebilir.
2.5.3. Görüntü Dönüşümleri
Görüntü dönüşümleri yardımıyla görüntüde yer alan farklı fiziksel özellikler
arasındaki
ayrımın
ve
görüntünün
görsel
yorumlanabilirliğinin
arttırılması
amaçlanmaktadır. Bunu gerçekleştirmek için ise çeşitli sayısal filtreleme matrisleri
kullanılır. Görüntüdeki farkların vurgulanması, kenar çizgilerinin vurgulanması ya da
giderilmesi işlemleri için farklı sayı matrisleri kullanılmaktadır. Görüntüler üzerinde
matris işlemlerine benzer şekilde tüm temel matematiksel işlemler (toplama,
çıkarma, çarpma, bölme) gerçekleştirebilir. Bölme işlemi, özellikle topoğrafik
20
etkilerin azaltılmasına ve giderilmesine olanak sağlar. Sayısal filtreleme yönteminde
her bir pikselin yeni gri renk tonları hesaplanmaktadır. Piksellerin yeni gri tonları
yalnızca ortaya çıkarılacak detaya bağlı değil komşu piksellere de bağlıdır. Uzaysal
frekans filtreleme de denilen bu işlemde, bir görüntüde istenilen detayı ortaya
çıkarabilmek için; yüksek, orta ve düşük frekanslı filtrelerden birisi kullanır.
2.5.4. Görüntü Sınıflandırma ve Analiz
Ham halde elde edilen uydu görüntülerinden yeryüzüne ait bilgilerin elde
edilmesi için çeşitli istatistiksel analizler ve yorumlama teknikleri kullanılmaktadır.
Verileri bilgiye dönüştürebilmek için en yaygın yöntem uydu görüntülerinin
sınıflandırılmasıdır. Uzaktan algılamada sınıflandırma, cisimlerin farklı spektral
yansıtma değerleri esasına dayanarak orijinal görüntüdeki her görüntü elemanını ait
olduğu özellik grubuna ayırma işlemidir. Ayırt etme ya da tanıma problemi her
pikselin, algılama yapılan spektral bantlara göre farklılık gösteren sayısal değerler
kümesinden yaralanılarak aşılmaktadır [Mather, 1987]. Sınıflandırmada amaç,
yeryüzü üzerinde aynı spektral özellikleri taşıyan nesnelerin gruplandırılmasıdır.
Sınıflandırmanın yapılabilmesi için çok spektrumlu veri kullanılır. Her bir piksele ait
spektral özellik verisi sınıflandırma için nümerik değerleri oluşturur. Her nesne
çeşidi doğasındaki spektral yansıtım ve yutulmaya bağlı olarak farklı sayılarla ifade
edilirler. Sınıflandırma, tematik bilgi çıkarmak için kullanılan en önemli yöntemdir.
Sınıflandırma sonucu elde edilen görüntü tematik harita olarak adlandırılmaktadır.
Tematik harita haline getirilen yani sınıflandırılan görüntü, bir harita projeksiyonuna
dönüştürüldüğünde coğrafi bilgi sistemlerinde kullanılabilir [Jehnsen, 1996].
Sınıflandırma işlemi, genel olarak şu adımları içerir:
1. Yeryüzü özelliklerini ortaya koyabilecek sınıfların belirlenmesi ve
kontrol alanlarının seçimi. Çalışma bölgesine ait bilgilerin toplanılması için
arazi çalışmasının yapılması, sınıflandırmada kullanılmak üzere mevcut
verilerin ve haritaların temini.
2. Çalışma amacına göre görüntülerin ve çalışılacak spektral bantların
seçimi.
21
3. Tespit
edilen
sınıflara
ait
kontrol
alanlarından
yararlanarak
sınıflandırılmada kullanılmak üzere eğitim ve test verilerinin oluşturulması.
4. Çalışma
amacına
yönelik
olarak
uygun
bir
sınıflandırma
algoritmasının seçimi ve uygulanması.
5. Sınıflandırılmış görüntü için doğruluk analizi ve elde edilen tematik
haritaların yorumlanması.
Sınıflandırma işleminde, sınıfların oluşturulması, yapılacak çalışmanın amacına
ve ölçeğine bağlı olmaktadır [Kavzoğlu, 2008]. Ayrıca, çalışmada kullanılacak
spektral aralığın belirlenmesi, yeterli doğrulukta ve sayıda kontrol alanlarının seçimi
ve sınıflandırılmış görüntülerde doğruluk değerlendirilmesinin yapılması, bu işlemin
gerçekleştirilmesinde büyük önem taşımaktadır.
Sınıflandırma işleminde genel olarak kontrollü ve kontrolsüz sınıflandırma
olarak adlandırılan iki yaklaşım vardır. Kontrollü sınıflandırma farklı spektral
grupları temsil eden kontrol alanları kullanılarak spektral ayrılabilirlik incelemekte,
buna karşılık kontrolsüz sınıflandırmada ise spektral olarak ayrılabilir sınıflar
belirlenmekte ve bunlardan bilgi elde etme yoluna gidilmektedir [Süslü, 2007].
2.5.4.1. Kontrolsüz Sınıflandırma
Kontrolsüz sınıflandırma yöntemi, görüntü üzerindeki piksellerin kullanıcı
müdahalesi
olmaksızın
belirli
algoritmalar
kullanılarak
otomatik
olarak
kümelendirilmesi veya gruplandırılması temeline dayanmaktadır. Kontrolsüz
sınıflandırma; görüntüdeki veri tanımlanamadığında başvurulan yöntemdir. Çalışma
alanına ait yeterli bilginin olmaması ve bölgenin genel yapısı hakkında ön bilgiye
gereksinim duyulan çalışmalarda bu sınıflandırma yöntemi kullanılmaktadır. Bu
yöntemde, arazi örtüsü tipini bilinmesine gerek yoktur, öncelikle görüntü üzerinde
sınıf sayıları belirlenir. Kontrolsüz sınıflandırmada görüntü üzerindeki piksellere ait
farklı bantlardaki sayısal değerler kullanılarak benzer piksellerin otomatik olarak
bulunması ve bu piksellerin bir sınıfa atanması temel alınmaktadır. Ortak özelliklere
sahip veya benzer pikseller sembol, değer ya da sınıf etiketine atanır, gerektiğinde de
aynı tip sınıflarla birleştirilir [URL–1]. Kontrolsüz sınıflandırma sonucu oluşacak
22
sınıflar, spektral sınıflardır [Lillesand et al., 2007]. Elde edilen bu spektral sınıfların
ne olduğu önceden bilinmemekte olup, daha sonra o bölgeye ait topoğrafik haritalar,
hava fotoğrafları ve mevcut yardımcı bilgilerle karşılaştırılarak oluşturulan sınıfların
doğal özellikleri belirlenebilmektedir [Özkan, 1998].
Kontrolsüz sınıflandırma da karar kuralı olarak minimum uzaklık kullanır.
Pikseller, görüntünün sol üst köşesinden başlanarak soldan sağa ve satır satır analiz
edilir. Aday piksel ile her bir küme ortalaması arasında spektral uzaklık hesaplanır ve
en yakın kümeye atanır. Tam otomatik bir sınıflandırma yöntemi olan kontrolsüz
sınıflandırmada pikseller arasındaki spektral uzaklıklar, Mahalonobis ve Öklit
uzaklığı gibi formüllerle hesaplanır. Öncelikle istenilen sınıf sayısı kadar oluşturulan
kümenin ortalaması hesaplanır ve her iterasyondan sonra, her bir kümenin yeni
ortalaması hesaplanılarak, bu ortalamalar bir sonraki iterasyon kümelerinin
tanımlanmasında kullanılır. Kontrolsüz sınıflandırmada küme merkezleri geçici
olarak hesaplanarak, piksellerin dahil olacağı sınıflar belirlenir ve bu işlem küme
merkezlerinin konumlarında değişim olmayana kadar devam eder [URL–1].
Uygulamada ISODATA, ardışık kümeleme ve istatistiksel kümeleme gibi çeşitli
kontrolsüz sınıflandırma yöntemleri kullanılmaktadır.
2.5.4.2. Kontrollü Sınıflandırma
Kontrollü sınıflandırma görüntü üzerindeki alanlara ait dış verilere dayalı
olarak gerçekleştirilir. Bu veriler arazi çalışmaları yapılarak, hava fotoğraflarının
analiz edilmesiyle veya konu ile ilgili mevcut haritalardan elde edilebilir [Mather,
1987]. Yöntemde görüntünün hangi sınıflara ayrılacağı, ya da görüntüden hangi
sınıfların elde edilmek istenildiği önceden belirlenir. Bunun için görüntüden
belirlenen sınıflara ait kontrol alanlarının seçilmesi gerekmektedir. Bu seçim için
gerektiğinde arazide yer gerçekliği yapılması zorunludur. Kontrol alanlarının seçimi
sınıflandırmanın doğruluğunu etkileyen bir aşamadır. Uygulamada sıkça karşılaşılan
sorun sınıf çakışmasıdır. Sınıf çakışmasının nedenlerinden biri de kontrol alanlarının
ölçümünde yapılan hatalardır [URL–1].
Kontrollü sınıflandırma da, çalışma alanındaki yeryüzü özelliklerini tanımlayan
yeteri sayıdaki örnekleme alanları kullanılarak, piksel değerlerinin özellik dosyaları
23
oluşturulur. Kontrol alanlarının örneklediği özellik dosyalarının görüntü verilerine
uygulanması ile her bir piksel, hesaplanan olasılık değerine göre en çok benzer
olduğu sınıfa atanmaktadır.
Kontrollü sınıflandırma da, ilk adım örnekleme adımıdır. Örnekleme
aşamasında, analist her bir arazi örtüsü çeşidini temsil edecek örnekleme bölgeleri
seçer ve bu bölgelerin spektral özelliklerini açıklayacak sayısal değerler geliştirir.
İkinci adım, sınıflandırma adımıdır. Sınıflandırma adımında, görüntü verisindeki her
bir piksel en çok benzer olduğu arazi örtüsü kategorisine dahil edilir. Görüntü
elemanı örnekleme bölgeleriyle uyum sağlamıyorsa bilinmeyen olarak etiketlenir.
Bilinmeyen piksel değerinin hangi arazi örtüsü grubuna dahil olacağı daha sonra
belirlenir. Her bir piksele atanan sınıf, yorumlanmış veri dizisinde yerini alır ve
böylece çok boyutlu görüntü matrisi, karşılık gelen yorumlanmış arazi örtü sınıfı
tiplerinin oluşturduğu matrisi geliştirme de kullanılır [Kansu, 2006]. Bütün veriler
kategorize edildikten sonra sonuçlar çıktı adımında sunulur. Sonuçlar tematik
haritalar, istatistiksel tablolar veya coğrafi bilgi sistemlerine dahil edilebilecek
nitelikteki sayısal veri kütükleri şeklinde ortaya koyulurlar [Lillesand and Kiefer,
1994]. Kontrollü sınıflandırma yönteminde kullanılan en önemli algoritmalar, en kısa
uzaklık karar kuralı, paralelkenar karar kuralı, Mahalanobis uzaklığı ve en çok
benzerlik algoritmalarıdır.
2.5.4.2.1. En Kısa Uzaklık Sınıflandırıcısı
En kısa uzaklık sınıflandırıcısında her bir örnek sınıf için hesaplanan ortalama
vektör ile aday piksel arasındaki spektral uzaklık hesaplanır. Hesaplanan spektral
uzaklıklara göre aday piksel en kısa mesafedeki örnek sınıfa atanır [Erdas, 2008].
Şekil 2.6’da aday pikselin üç özelliğe ait ortalama vektöre olan spektral uzaklıkları
bir çizgi ile ifade edilmiştir. Şekle göre aday piksel bu spektral uzaklıklardan en kısa
mesafede olan sınıfa atanmasıyla sınıflandırma işlemi gerçekleştirilir. Örnek sınıf
ortalama vektörü ile bilinmeyen piksel arasındaki uzaklığa spektral uzaklık denir ve
uzaklığın bulunması Eşitlik 2.1’de ifade edilen Öklit uzaklığı esasına dayanmaktadır.
SD xyc =
n
(
∑ μ ci − X xyi
i =1
2
)
(2.1)
24
Bu eşitlikte; n, bant sayısını (boyutu); i, belirli bir bandı; c, belli bir sınıfı;
X xyi , i. banttaki pikselin x, y değerlerini; μ ci , i bandındaki c sınıfına ait örneklere
ait değerlerin ortalamasını; SD xyc , aday piksel x, y ’nin c sınıfına ait ortalama
vektöre olan spektral uzaklığı olarak ifade edilebilir [Erdas, 2008].
B bandı değerleri
Aday piksel
μ2
μ B2
μ B3
μ B1
μ3
μ1
μ A1
μ A 2 μ A3
A bandı değerleri
Şekil 2.6. En kısa uzaklık (spektral uzaklık) sınıflandırıcısı.
En kısa uzaklık yöntemi matematiksel ifadesi anlaşılabilir, basit ve hesaplama
zamanı açısından hızlı olan bir kontrollü sınıflandırma algoritmasıdır. Yöntemin bu
önemli avantajlarının yanında en önemli eksikliği görüntü üzerindeki objelerin
spektral olarak birbirine çok yakın değerlere sahip olması ve yüksek varyans
değerlerine sahip olması durumlarında ürettiği düşük doğruluktur. Bununla beraber
yöntemle yapılan sınıflandırma sonucunda spektral uzaklıklar göz önüne
alındığından her bir aday pikselin örnek sınıflardan birine atanması söz konusudur
[Lillesand and Kiefer, 1994].
2.5.4.2.2. Paralelkenar Sınıflandırıcısı
Paralelkenar sınıflandırıcısında her bir örnek sınıfın her bir banttaki en düşük
ve en yüksek spektral değerleri dikkate alınarak, dikdörtgen bölgeler oluşturulur.
Daha sonra sınıflandırılmak istenen aday piksel içerisinde bulunduğu dikdörtgen
bölgenin ait olduğu örnek sınıfa atanır [Lillesand et al., 2007]. Parametrik olmayan
bir yaklaşım olan paralelkenar karar kuralı hesaplama zamanı açısından hızlı ve
25
matematiksel ifadesi basit olan bir yöntemdir. Bu yöntemin sonucunda
sınıflandırılamayan piksel sayısı fazladır. Sınıflar arasında çakışan alanlar olması
durumunda sınıflandırma işlemi zorlaşmaktadır. Bu durumda aday piksellerin
çakışan sınıflardan birine rastgele atanması ile problem çözülür. Sonuç olarak aday
pikselin olması gerekenden farklı bir sınıfa atanması da söz konusu olabilmektedir.
Şekil 2.7’de iki boyutlu bir veri seti için paralelkenar karar kuralı sınıflandırıcısı
gösterilmiştir. Şekilde iki banttaki üç sınıfa ait veriler ve bu sınıfların oluşturduğu
dikdörtgen bölgeler görülmektedir. Sınıflandırma sonucunda bazı bölgelerde çakışma
ve çok sayıda aday pikselin sınıflandırılamaması söz konusudur.
Sınıf 1’e ait pikseller
Sınıf 2’e ait pikseller
Sınıf 3
B bandı değerleri
Sınıf 1
Sınıf 3’e ait pikseller
Sınıflandırılamayan pikseller
Sınıf 2
A bandı değerleri
Şekil 2.7. Paralelkenar sınıflandırıcısı.
2.5.4.2.3. Mahalanobis Uzaklığı Sınıflandırıcısı
Mahalanobis uzaklığı sınıflandırıcısı, bantlardaki verilerin normal dağılımda
olduğunu kabul eder ve bu kabulle iyi sonuçlar vermektedir. Yöntem en kısa uzaklık
karar kuralına benzemekte ancak bu yöntemde eşitliklerde kovaryans matrisi de
kullanılmaktadır [Erdas, 2008]. Mahalanobis yöntemi varyans ve kovaryans gibi
istatistiki değerler kullanmasından ötürü parametrik bir yaklaşımdır. Varyans ve
kovaryans değişik özellikteki çeşitli sınıflar için denklemde karşılıklı olarak
hesaplanır. Yüksek varyansa sahip kümeler aynı şekilde varyansa sahip sınıflara,
düşük varyansa sahip kümeler düşük varyanslı sınıflara atanacaktır [Göksel, 1996].
Mahalanobis uzaklığı sınıfandırıcısı, minimum uzaklık ya da paralelkenardan faklı
26
olarak sınıf değişimi göz önüne alınır. Mahalanobis uzaklığında işlenen örnekte ya
da bir kümedeki piksellerde büyük bir dağılma varsa o işaretin kovaryans matrisi
büyük değerler içerecektir [Kansu, 2006]. Mahalanobis uzaklığı sınıflandırıcısı için
kullanılan eşitlik;
(
)
D = ( X − M c )T Cov c −1 ( X − M c )
(2.2)
şeklinde ifade edilmektedir. Bu eşitlikte; D, mahalanobis uzaklığını; c, belirli bir
sınıfı; X, aday pikselin ölçüm vektörünü; M c , c sınıfındaki özelliklere ait ortalama
vektörü; Cov c , c sınıfındaki piksellere ait kovaryans matrisini; Covc −1 , Cov c ’nin
ters matrisini ve T ise transpoze fonksiyonunu ifade etmektedir. Yöntemin temel
çalışma prensibi, sınıflandırılacak aday pikselin, Eşitlik 2.2 ile hesaplanan
mahalanobis uzaklığının en düşük olduğu sınıfa atanması şeklindedir. Yöntem
istatistiki değerlerin dikkate alınmasının zorunlu olduğu durumlarda en kısa uzaklık
yöntemine göre daha doğru sonuçlar vermektedir. Diğer taraftan yöntem,
paralelkenar ve en kısa uzaklık yöntemine göre daha uzun bir hesaplama süresi
gerektirmektedir [Erdas, 2008].
2.5.4.2.4. En Çok Benzerlik Sınıflandırma Algoritması
En çok benzerlik yöntemi literatürde en yaygın olarak kullanılan etkili bir
kontrollü sınıflandırma algoritmasıdır. Bu yöntemde ortalama değer, varyans ve
kovaryans gibi istatistiki değerlerin tümü dikkate alınır. Kontrol alanlarını oluşturan
sınıflar için olasılık fonksiyonları hesaplanmakta ve buna göre her bir pikselin hangi
sınıfa daha yakın olduğuna karar verilmektedir. Bir pikselin hangi sınıfa ait olduğu
her bir sınıfa ait olma olasılıklarının hesabından sonra en yüksek olasılıklı grubu
atama şeklinde yapılır [Mather, 1987]. Bu noktada kullanıcı tarafından tespit
edilecek bir eşik değer sınıflandırılacak pikselin belirlenen sınıflardan veya bu
sınıfların dışında bir sınıftan olduğunun tespitinde kullanılır. Bu yöntemde, sınıf
kontrol verilerini oluşturan noktalar kümesindeki dağılımın, normal dağılım olduğu
kabul edilir. Sınıfların ilk olasılıkları hakkında bilgi mevcut değilse, hepsi eşit
olasılıklı olarak kabul edilir. Yöntem, pikselleri sadece parlaklık değerlerine göre
değil, her sınıf için ayrım oluşturacak varyans-kovaryans matris değerine göre
27
oluşturur. Böylece örnek piksellerin özellik uzayındaki dağılımları da dikkate alınmış
olur. Olasılık yoğunluk fonksiyonları, bilinmeyen piksellerin olasılıklarının
hesaplanarak belirli bir sınıfa atanması için kullanılır. Aday piksel olasılık değerine
göre en çok benzediği sınıfa atanır. Sınıflandırma sırasında piksellerin belirlenen
sınıflardan veya bu sınıfların dışında bir sınıftan olduğunun tespiti için eşik değeri
kullanılmaktadır. Eğer aday pikselin olasılığı tüm sınıflar için belirlenen eşik
değerinin altındaysa piksel bilinmeyen olarak etiketlenir [Lillesand and Kiefer,
1994]. En çok benzerlik yönteminde kullanılan formül aşağıdaki şekildedir:
D = ln (a c ) − [0 .5 * ln ( Cov c
)] − [0 .5 * ( X
(
)
− M c )T * Cov c −1 * ( X − M C
]
)
(2.3)
Bu eşitlikte; D, uzaklık ağırlıklı olasılık değerini; C, örnek bir sınıfı; X, aday
pikselin ölçüm vektörünü; M c , C örnek sınıfının ortalama vektörünü; a c , aday
pikselin C sınıfına ait olma yüzdesini, Cov c , C örnek sınıfındaki piksellerin varyanskovaryans matrisini göstermektedir.
2.6. Uzaktan Algılama Uyduları
2.6.1. LANDSAT Uydu Sistemi
İlk LANDSAT uydusunun 1972 yılında uzaya gönderilmesinden sonra dört
adet Landsat uydusu daha yörüngeye oturtulmuştur. İlk kuşak üç uydudan
oluşmaktadır. Bu uydular iki sensör taşımaktadır: Return Beam Vidicon (RBV)
kamera ve Multispectral Scanner (MSS). İkinci kuşak Landsat uyduları, 1982'de
Landsat 4 ile başlayarak, RBV yerine Thematic Mapper (TM) adında yeni bir cihazla
donatılmışlardır. 1999 yılında, Landsat 7 Thematic Mapper+ ve yüksek çözünürlüklü
scanner ile donatılarak uzaya gönderilmiştir. Landsat 7 uydusu uzaya gönderildiği
zaman üzerinde tek bir aygıt olarak ETM+ (Enhanced Thematic Mapper Plus)
taşımaktadır [URL–2].
Landsat uydusu tekrarlı, dairesel, güneşe senkronize, kutuplara-yakın
yörüngeye sahiptir. Bu özellikleri sayesinde 81° N and 81° S arasında görüntüleme
28
yapar. LANDSAT 1 – 3 uyduları için tekrar süresi 18 gündür, LANDSAT 4 ve 5 için
16 gündür.
TM ve MSS verileri için veri dizisi 8-bit'ten oluşmaktadır. Multi-Spectral
Scanner (MSS) alıcısı görünür ve yakın-infrared bölgede 4 adet banda sahiptir ve 79
metre çözünürlüktedir. Thematic Mapper adlı cihazın spektral ve geometrik
çözünürlük üstünlüğü nedeniyle MSS' in talebi hızla azalmıştır.
Landsat 7 geliştirilmiş TM tarayıcısı taşımaktadır. Standart 7 banda ek olarak
15m çözünürlüğe sahip pankromatik band (0.50- 0.90μm) eklenmiştir. Bunlara ek
olarak termal bandın çözünürlüğü de 60 metreye indirilmiştir. Landsat 5–7
uydularının genel özellikleri Tablo 2.1’de gösterilmiştir. Tabloda VNIR, görünür
yakın kızılötesini; SWIR, orta kızılötesini ve TIR, termal kızılötesini göstermektedir.
Tablo 2.1. Landsat uydularının teknik özellikleri.
Çözünürlük
Uydu
Landsat 1/2/3
Sensör
Tipi
MSS
Spektral
Yersel
Radyometrik
(μm)
(m)
(bit)
79
6
VNIR: 0.5–0.6, 0.6–0.7,
0.7–0.8, 0.8–0.11
VNIR: 0.45–0.52, 0.52–0.60,
Landsat 4/5
Landsat 7
TM
30
0.63–0.69, 0.76–0.90
SWIR: 1.55–1.75,2.08–2.35
30
TIR:
120
10.42–12.5
PAN
0.52–0.9
15
ETM
VNIR ve SWIR Landsat 5 ile aynı
30
TIR: 10.42–12.5
60
8
8
29
2.6.2. TERRA Uydu Sistemi
Terra uydusu 1999 yılında uzaya gönderilmiştir. Uydu üzerinde ASTER,
MODIS, CERES, MOPITT ve MISR olarak bilinen beş adet model bulunmaktadır.
Bu modüller arasında ASTER sensörü 14 bantlı ve 15m - 90m yersel çözünürlükteki
görüntüler elde edilmektedir. ASTER verileri; arazi yüzeyi, sıcaklık, reflektans,
parlaklık değişim oranı ve yükseklik haritalarını çıkarmak için kullanmaktadırlar.
Üzerinde yüksek verimlilikte çalışan optik sensörler mevcut olup, 14 bantla termal
kızıl ötesi ile kara yüzeylerini spektral bantlarla incelemektedir [URL–2]. Terra
ASTER uydusuna ait teknik özellikler Tablo 2.2’de gösterilmiştir. Tabloda VNIR,
görünür yakın kızılötesini; SWIR, orta kızılötesini ve TIR, termal kızılötesini
göstermektedir.
Tablo 2.2. Terra ASTER uydusunun teknik özellikleri.
Çözünürlük
Uydu
Sensör
Tipi
VNIR
Spektral
Yersel
Radyometrik
(μm)
(m)
(bit)
15
8
30
8
90
12
0.52–0.60, 0.63–0.69,
0.76–0.86
1.60–1.70, 2.145–2.185,
Terra/ASTER
SWIR
2.185–2.225, 2.235–2.285,
2.295–2.365, 2.360–2.430
TIR
10.95–11.65
2.6.2. SPOT Uydu Sistemi
SPOT uydusu Fransız, İsveç ve Belçika ortak yapımı olup 1986 yılında
uzaydaki yörüngesine yerleştirilmiştir. SPOT uydusu üzerinde iki adet HRV ve
vejetasyon algılayıcı mevcuttur. HRV algılayıcıları, pankromatik ve çok bantlı
görüntüler elde edebilmektedir.
30
Günümüze kadar beş adet SPOT uydusu uzaya gönderilmiştir. Bunlardan
SPOT-1,2,3,4 uyduları yüksek çözünürlüğe sahip (10m pankromatik ve 20m çok
bantlı görüntüleme modunda) ve değişik ihtiyaçları karşılayacak spektral bandlar
içermektedir. Bu uydular iyi bir tekrar görüntüleme süresine sahip olup, 900 km'lik
görüntüleme alanı içerisinde kalan 60km x 60km 'lik herhangi bir bölgeyi her geçişte
görüntüleme olanağı sağlamaktadırlar. SPOT–5 zenginleştirilmiş görüntü ile Spot
serisinin beşincisidir. SPOT–5 deki iki yeni HRG cihazı Spot 4 deki HRVIR
cihazlarından türetilmiştir ve 2,5,-5 m pankromatik ve 10 metre de çok bantlı yersel
çözünürlüklü görüntü imkanı sağlar [URL–2]. SPOT uydularının teknik özellikleri
Tablo 2.3’de gösterilmiştir.
Tablo 2.3. SPOT uydularının teknik özellikleri
Çözünürlük
Uydu
Sensör Tipi
PAN
SPOT–1/2/3
HRV
PAN
HRVIR
SPOT–4
SPOT–5
Spektral
Yersel
Radyometrik
(μm)
(m)
(bit)
0.51–0.73
10
8
20
8
10
8
20
8
VNIR: 0.50–0.59, 0.61–0.68,
0.79–0.89
0.61–0.68
VNIR: 0.50–0.59, 0.61–0.68,
0.79–0.89
SWIR: 1.58–1.75, 0.43–0.47,
0.61–0.68
Vejetasyon
0.78–0.89, 1.58–1.75
1000
4/8
PAN
0.49–0.69
2.5–5
8
HRG
VNIR: 0.49–0.61, 0.61–0.68,
0.78–0.89
10
8
HRG
SWIR: 1.58–1.75
20
8
1000
4/8
Vejetasyon
0.43–0.47, 0.61–0.68,
0.78–0.89, 1.58–1.75
31
3. UZAKTAN ALGILAMADA İLERİ
SINIFLANDIRMA TEKNİKLERİ
3.1. Destek Vektör Makineleri
Destek Vektör Makineleri (DVM), Viladimir N. Vapnik ve çalışma arkadaşları
tarafından ortaya konulan istatistiksel öğrenme teorisine dayalı bir kontrollü
sınıflandırma algoritmasıdır [Vapnik, 1995]. DVM’nin sahip olduğu matematiksel
algoritmalar başlangıçta iki sınıflı doğrusal verilerin sınıflandırılması problemi için
tasarlanmış daha sonra kullanılan algoritmalar doğrusal olmayan verilerin ve çok
sınıflı verilerin sınıflandırılması problemlerinin çözümü için genelleştirilmiştir.
DVM’nin en genel amacı iki sınıfı birbirinden ayırabilen en uygun karar fonksiyonun
tahmin edilmesi başka bir ifadeyle iki sınıfı birbirinden en uygun şekilde ayırabilen
bir hiper düzlemin tanımlanması esasına dayanmaktadır [Vapnik, 2000]. DVM optik
karakterlerin tanımlanması, el yazısı tanımlamaları, parmak izi tespiti, yüz tanıma ve
metin sınıflandırmaları gibi birçok uygulamada kullanılmıştır [Joachims, 1998;
Heisele et al., 2003; Liu et al., 2003; Yang et al., 2008; Hong et al., 2008]. Son
yıllarda DVM’nin uzaktan algılanmış görüntülerin sınıflandırılması konusunda
başarıyla kullanımı literatürde bir çok yayında mevcuttur [Huang et al., 2002; Foody
and Mathur, 2004; Pal and Mather, 2005; Su et al., 2007; Yao et al., 2008].
Destek vektör makinelerini diğer öğrenme algoritmalarından ayıran en önemli
özellik; sahip olduğu matematiksel algoritmanın sınıflandırma sonucunda beklenen
riskin üst sınırının minimum olması şeklinde ifade edilen yapısal risk azalımı (YRA)
prensibine dayanmasıdır [Kechman, 2001]. Vapnik (1995)’e göre bir öğrenme
makinesinin riski (R); eğitim verilerinden elde edilen deneysel gözlemlerin riski
(Remp) ve güvenilirlik aralığının toplamına ((ψ ) = R ≤ Remp + ψ ) bağlıdır. YRA
stratejisi deneysel gözlem riskini (Remp) sabit olarak korumak ve güvenilirlik aralığını
(ψ ) minimum yapmak veya en uygun ayrım yapan hiper düzleme en yakın veri
noktaları arasındaki sınırın maksimum olması olarak tanımlanabilir. En uygun ayrım
yapan hiper düzlemden kasıt çok boyutlu bir uzayda veri örneklerini iki sınıfa ayıran
bir hiper düzlemdir. Bu bağlamda iki sınıfı birbirinden ayıran en uygun hiper
32
düzlem, bu düzlem ile bu düzleme en yakın veri noktalarının oluşturduğu sınırı
maksimum yapan hiper düzlem olarak tanımlanabilir [Huang et al., 2002]. DVM
öznitelik bilgileri verilen bir test veri setine ait sınıf etiketlerini öğrenebilen veya
tahmin edebilen bir model oluşturmayı amaçlamaktadır. Bu doğrultuda sınıflandırma
işleminde, DVM ile eğitim seti içindeki veriler kullanılarak bir hiper düzlem
belirlenir ve bu oluşturulan düzlemin geçerliliği (genelleme yeteneği) test veri seti
olarak adlandırılan bağımsız veri setleri kullanılarak doğrulanır. N boyutlu bir verinin
sınıflandırılmasında DVM ile (N–1) boyutlu bir hiper düzlem geliştirilir. İki sınıfa
sahip doğrusal olarak ayrılabilen bir veri seti düşünülürse, Şekil 3.1’de görüleceği
üzere bu veri setini ayırabilen sonsuz sayıda hiper düzlem vardır.
Şekil 3.1. İki sınıflı bir problemde verileri ayıran hiper düzlemler.
Ancak, bu düzlemler arasında maksimum sınıra sahip sadece bir hiper düzlem
bulunmaktadır [Sherrod, 2003; Oomen et al., 2008]. Bu hiper düzleme en uygun
ayrım yapan hiper düzlem ve sınır genişliğini sınırlandıran noktalara ise destek
vektörleri adı verilir (Şekil 3.2).
Destek Vektörleri
Sınır
Destek Vektörleri
Optimum Hiper Düzlem
Şekil 3.2. İki sınıflı bir problemde en uygun hiper düzlem, sınır ve destek vektörleri.
33
Destek vektör makineleri ile yapılan sınıflandırma problemlerinde verilerin
doğrusal olarak ayrılabilen veya doğrusal olarak ayrılamayan bir yapıda olması en
çok karşılaşılan iki durumdur. Doğrusal olarak ayrımı yapılabilen verilerin
sınıflandırılması ve bu verileri birbirinden ayıran en uygun hiper düzlemin bulunması
oldukça kolaydır. Ancak uzaktan algılanmış görüntülerin sınıflandırılmasında olduğu
gibi güncel hayatta karşımıza çıkan birçok sınıflandırma probleminde verilerin
doğrusal olarak ayrılması mümkün değildir. Bu tip problemlerin teorik olarak
çözülmesi zor ve karmaşıktır.
3.1.1. Doğrusal Olarak Ayrım Yapılabilen Veriler
Doğrusal olarak ayrılabilen sınıflar DVM’nin eğitimi için en basit durumdur.
İki sınıflı k sayıda örnekten oluşan doğrusal yapıdaki bir eğitim verisi seti {xi , y i } ,
i = 1,..., k , şeklinde verilsin. Burada x ∈ R N olup N boyutlu bir uzayı, y ∈ { −1,+1 } ise
sınıf etiketlerini göstermektedir. Osuna et al. (1997), hiper düzleme ait ağırlık
vektörü w ve hiper düzlemin orijinden olan uzaklığını gösteren b sayısal
büyüklüğünün hesaplanması durumunda iki sınıfı birbirinden ayıran hiper düzlemin
belirlenebileceğini ifade etmiştir. İki sınıflı bir problemde ayrım yapan hiper düzleme
ait eşitlikler Eşitlik 3.1 ve 3.2’de verilmiştir.
w ⋅ x i + b ≥ +1
her y = +1 için
(3.1)
w ⋅ xi + b ≤ −1
her y = −1 için
(3.2)
Bu iki eşitlik tek bir eşitlik ile ifade edilecek olursa;
y i ( w ⋅ xi + b) − 1 ≥ 0
(3.3)
şeklinde olur. Bu durumda hipotez uzayı Eşitlik 3.4 ile verilen fonksiyonlar kümesi
halini alır.
f w,b = sign( w ⋅ x + b)
(3.4)
34
Eğer w ve b parametreleri aynı miktarda ölçeklenirse Eşitlik 3.4’deki karar
yüzeyi değişmeyecektir. Bu fazlalığı kaldırmak ve her bir karar yüzeyinin tek bir
sabit (w,b) çiftine karşılık gelmesi için Eşitlik 3.5 ile verilen sınırlandırmadan
yararlanılır.
min w ⋅ xi + b = 1
(3.5)
i =1,..., k
Bu eşitlikte x1 ,..., x k veri kümesindeki noktaları göstermektedir. Eşitliği
sağlayan hiper düzlem seti standart hiper düzlem olarak adlandırılır [Osuna et al.,
1997]. Bütün doğrusal karar yüzeyleri standart hiper düzlem ile gösterilebilir. Vapnik
(1995), (w,b) çiftleri için yararlanılan sınırlandırmalardan başka sınırlandırmalar
olmaması durumunda standart hiper düzlemin Vapnik-Chervonenkis (VC)
boyutunun bağımsız parametrelerinin toplam sayısını gösteren (N+1) olacağını ifade
etmiştir. VC boyutu hipotez uzayının kapasitesini ölçer [Vapnik and Chervonenkis,
1968; 1971]. Kapasite bir karmaşıklığın veya zorluğun ölçülmesi anlamına
gelmektedir. Başka bir ifadeyle bir fonksiyon kümesinin ifade gücünü, esnekliğini
veya zenginliğini ölçer. N noktayı içeren bir veri seti düşünüldüğünde, bu N nokta
pozitif veya negatif olarak etiketlenebilir. Bununla beraber, N sayıda veri noktasıyla
2 N farklı öğrenme problemi tanımlanabilir. Bu problemlerden herhangi biri için
pozitif örnekleri negatif örneklerden ayırabilen bir h ∈ H hipotezi bulunabilirse,
H’nın N veri noktasını parçalara ayırdığı söylenebilir. Bu durum, N örnekle
tanımlanabilir herhangi öğrenme probleminin H tarafından çizilen bir hipotez ile
hatasız
bir
biçimde
öğrenilebilir
olduğunu
göstermektedir.
H
tarafından
parçalanabilen maksimum nokta sayısı Vapnik-Chervonekis (VC) boyutu olarak
adlandırılır. Yapısal risk azalımı prensibini uygulayabilmek için değişken VC
boyutlu hiper düzlemler setinin oluşturulması gerekmektedir. Ayrıca hem eğitim
sınıflandırma hatasını ifade eden deneysel riskin hem de VC boyutunun aynı anda
minimum olması gerekmektedir. Bir x noktasının, (w,b) çiftine bağlı olarak
oluşturulan hiper düzleme olan uzaklığı Eşitlik 3.6 ile belirlenebilir.
d ( x; w, b) =
x⋅w+b
w
(3.6)
35
Eşitlik 3.5’te (w,b) ile tanımlanan standart hiper düzlem ile bu düzleme en
yakın veri noktası arasındaki uzaklık basit bir şekilde 1 / w ’dır [Foody and Mathur,
2004]. Eğer örnek grupları doğrusal olarak ayrılabiliyorsa, veriyi en doğru şekilde
sınıflandıran standart hiper düzlemler arasında en iyisi minimum norma sahip veya
eşit bir biçimde minimum w
2
olanıdır. Bu normun minimum olarak kalması VC
boyutunun minimum olarak kalmasına neden olur. Doğrusal olarak ayrımın
2
yapılabildiği durumda w ’nin minimum olması, eğitim veri sınıfları arasında hiper
düzleme olan dik çizgiler arasında hesaplanan uzaklığın bulunduğu ayırıcı hiper
düzleme eşittir. Şekil 3.3’de gösterilen bu uzaklık sınır olarak adlandırılır [Burges,
1998].
Y
Hiper Düzlemler
w ⋅ x + b = ±1
Sınır
w
Destek Vektörleri
b
Optimum Hiper Düzlem
w⋅ x + b = 0
X
Şekil 3.3. Doğrusal olarak ayrılabilen veri setleri için hiper düzlemin belirlenmesi.
( x1 , y1 ),......, ( x k , y k ) xi ∈ R N , yi ∈ {−1,+1} şeklinde verilen bir veri setinin iki
farklı sınıfa doğru bir şekilde ayrılması için maksimum sınıra sahip hiper düzlemin,
başka bir ifadeyle en uygun ayrım yapan hiper düzlemin belirlenmesine ihtiyaç
duyulmaktadır. Destek vektör makinelerinin üzerinde bulunduğu hiper düzlemler
arasındaki sınırın maksimum hale getirilmesi; w
ifadesinin minimum hale
getirilmesi ile mümkün olacaktır. Bu durumda maksimum sınıra sahip hiper
düzlemin belirlenmesi;
36
min
w ,b
1
w
2
2
(3.7)
koşulu ile
y i ( w ⋅ x i + b) − 1 ≥ 0
i = 1,......., k
(3.8)
eşitliğinin çözümü ile mümkündür.
Yukarıdaki koşul ve eşitlik ile ifade edilen doğrusal olmayan optimizasyon
probleminin
çözümü
için
Lagrange
fonksiyonu
ve
Lagrange
çarpanlarından (λi , i = 1,..., k ) yararlanılır. Bunun en önemli nedeni, Lagrange
fonksiyonu kullanılarak Lagrange çarpanlarının dolayısıyla en uygun hiper düzleme
ait parametrelerin ( w, b ) hesaplanmasının kolay olması ve doğrusal olmayan veriler
için en uygun hiper düzlemin bulunması probleminin çözümü için Lagrange
fonksiyonun genelleştirilebilecek bir yapıda olmasıdır [Burges, 1998]. Bu
optimizasyon probleminin çözümü için oluşturulacak Lagrange fonksiyonu Eşitlik
3.9 ile ifade edilir.
L( w, b, λ ) =
k
1 2 k
w − ∑ λ i y i ( w ⋅ x i + b ) + ∑ λi
2
i =1
i =1
(3.9)
Karush-Kuhn-Tucker (KKT) şartları sınırlandırılmış optimizasyon probleminin
uygulamasında ve teorisinde önemli bir rol oynamaktadır [Fletcher, 2000].
Yukarıdaki eşitliğin kısmı türevleri alınarak sıfıra eşitlenerek Eşitlik 3.10’daki
ifadeler elde edilir.
k
∂L( w, b, λ )
= wT − ∑ yi λi xi = 0
∂w
i =1
∂L( w, b, λ ) k
= ∑ y i λi = 0
∂b
i =1
(3.10)
37
Bu eşitliklerden KKT şartları Eşitlik 3.11 şeklinde;
k
w T = ∑ y i λi xi
i =1
k
∑ y i λi
=0
(3.11)
i =1
elde edilir. KKT teorisine göre sadece Eşitlik 3.1 ve 3.2’yi sağlayan noktalar sıfırdan
farklı λiq katsayılarına sahip olabilirler. Bu noktalar destek vektörleri adı verilen
birbirine paralel iki hiper düzlem üzerinde olurlar (Şekil 3.3). Başka bir ifadeyle
destek vektörleri λiq ≥ 0 olan aynı zamanda Eşitlik 3.1 ve 3.2’yi sağlayan noktalardır
[Osuna et al., 1997]. Kısmi türevler alınarak elde edilen Eşitlik 3.11, Eşitlik 3.9’da
yerine konulduğunda L( w, b, λ ) fonksiyonu; (λi ≥ 0, i = 1,..., k ) olmak üzere;
L( w, b, λ ) = ∑ λi −
i
1 k
∑ λi λ j y i y j ( x i ⋅ x j )
2 i , j =1
(3.12)
şeklinde elde edilir.
Sonuç olarak iki sınıflı doğrusal verilerin söz konusu olduğu bir problem için
iki sınıfın birbirinden ayrılması ile ilgili karar kuralı Eşitlik 3.13 ile ifade edilebilir
[Vapnik, 1995; Osuna et al., 1997].
⎛ k
⎞
f ( x) = sign⎜ ∑ λi y i ( x ⋅ xi ) + b ⎟
⎝ i =1
⎠
(3.13)
3.1.2. Doğrusal Olmayan Veriler
Günlük hayatta karşılaşılan birçok problemde verilerin doğrusal olmadığı
durumlar söz konusudur. Başka bir ifade ile Şekil 3.4’de gösterildiği gibi doğrusal
bir düzlem ile verilerin birbirinden ayrılamaması durumu vardır. Cortes ve Vapnik
(1995), iki sınıfın doğrusal olarak ayrımının yapılamadığı ve hiper düzlemin
38
yerleştirilemediği verilerin olması durumunda en uygun ayrım yapan hiper düzlemin
bulunması metodunu genelleştirmişlerdir.
Şekil 3.4. Doğrusal olarak ayrılamayan veri seti.
Cortes and Vapnik (1995) çalışmalarında doğrusal olmayan verilerin
sınıflandırılması probleminin Şekil 3.5’den de görüleceği üzere pozitif değerler alan
ve sınıflandırma hatalarını ifade eden yapay değişkenlerin ( ξ i ) tanımlanması ve
optimizasyon modeline eklenmesi ile çözümün bulunabileceğini ifade etmişlerdir.
Y
Hiper Düzlemler
w ⋅ x + b = ±1
Sınır
ξ
b
w
Optimum Hiper Düzlem
w⋅ x + b = 0
X
Şekil 3.5. Ayrım yapılamayan veri setleri için hiper düzlemler.
Yapay değişken ξ i ≥ 0 olan değerler alır. Doğrusal olmayan veriler olması
durumunda yapay değişkenler dikkate alınarak Eşitlik 3.3 yeniden düzenlenecek
olursa;
39
y i ( w ⋅ x i + b) − 1 + ξ i ≥ 0
i = 1,..., k
(3.15)
elde edilir. Bu durumda DVM algoritması sınırı maksimum yapacak hiper düzlemi
ararken, aynı zamanda yanlış sınıflandırma hatalarının sayısı hakkındaki orantısal bir
niceliği minimum yapmayı amaçlar. Sınırın maksimum hale getirilmesi ve yanlış
sınıflandırma hatalarının minimum hale getirilmesi arasındaki bu denge pozitif
değerler alan ve C ile gösterilen bir düzenleme parametresi
(0 < C < ∞)
tanımlanmasıyla kontrol edilebilir [Cortes and Vapnik, 1995]. Bu durumda
k
optimizasyon problemi için Eşitlik 3.7 ile ifade edilen koşula C ∑ ξ i (i = 1,..., k ) gibi
i =1
yeni bir terimin eklenmesi söz konusudur. C parametresi Lagrange çarpanlarının
alabilecekleri maksimum değeri göstermektedir. Bu şekilde Lagrange çarpanlarının
0 ≤ λi ≤ C aralığında kalması sağlanmaktadır. Burada C > 0 sabit bir parametredir
ve kullanıcı tarafından belirlenir. Eğer C küçük ise doğru olarak sınıflandırılmayan
birçok veriye izin verilir. C parametresi büyük değerler aldığında çok az sayıda hatalı
veriye sahip olunmak istenir. Eğer C = ∞ kabul edilirse, verilerin tümüyle doğrusal
olarak ayrılabildiği durum elde edilir [Özkan, 2008]. Diğer bir ifadeyle bu sabit
terim, ξ i değişkeninin büyük değerler alması sonucunda ortaya çıkan çözümlere ceza
vererek minimum koşulunun (1 / 2) w
2
katkısını ayarlamaktadır. Bu durumda
doğrusal olmayan veriler için optimizasyon problemi:
k
⎡1
⎤
2
+
w
C
ξi ⎥
∑
⎢
w ,b ,ξ1 ,...,ξ k 2
i =1
⎣
⎦
(3.16)
y i ( w ⋅ x i + b) − 1 + ξ i ≥ 0
(3.17)
ξ i ≥ 0 , i = 1,......., k
(3.18)
min
eşitlikleri halini alır. Bu optimizasyon probleminin çözümü için Lagrange
fonksiyonu ve Lagrange çarpanları kullanılarak yeniden düzenlendiğinde,
40
L( w, b, λ , ξ , μ ) =
1 2
w + C ∑ ξ i − ∑ λi {y i ( w ⋅ xi + b) − 1 + ξ i } − ∑ μ i ξ i
2
i
i
i
(3.19)
şeklinde yazılabilir. Bu eşitlikte λ ve μ lagrange çarpanlarıdır ve eşitliğin çözümü
Lagrange düğüm noktaları ile tanımlanır. Bu düğüm noktaları w, ξ ve b’yi minimum
hale getirirken aynı zamanda λi ≥ 0 ve μ i ≥ 0 ile ilgili değerleri maksimum hale
getiren noktalardır. Yukarıdaki eşitliğin kısmi türevleri alınıp sıfıra eşitlenerek KKT
koşulları;
k
∂L
= 0 , w = ∑ λi y i x i
∂w
i =1
∂L
= 0,
∂b
∑ λi y i
∂L
= 0,
∂ξ
λi + μ i = 0
k
=0
(3.20)
i =1
şeklinde elde edilir. Buradan hareketle Lagrange fonksiyonu;
k
L (λ ) = ∑ λi −
i =1
1 k
∑ λi λ j y i y j ( x i ⋅ x j )
2 i , j =1
(3.21)
buna bağlı kısıtlamalar ise ;
k
∑ λi y i
= 0 , i = 1,..., k
i =1
C ≥ λi ≥ 0, i = 1,..., k
şeklinde elde edilir.
(3.22)
41
3.1.3. Doğrusal Olmayan Destek Vektör Makineleri
Eğitim verileri üzerinden doğrusal eşitlikler ile tanımlanan bir karar yüzeyi
(hiper düzlem) belirlenmesi mümkün olmadığı durumlarda 3.1.1 ve 3.1.2
bölümlerinde açıklanan teknikler doğrusal olmayan karar yüzeylerinin oluşturulması
için genişletilebilir. Verilerin doğrusal olarak ayrılamadığı durumlar için doğrusal
sınıflandırıcı yerine doğrusal olmayan sınıflandırıcılar kullanılabilir. Boser et. al.
(1992),
x ∈ R N ile tanımlanan bir gözlem vektörünün, φ : R N a R F şeklinde
doğrusal olmayan bir vektör fonksiyonu aracılığıyla daha yüksek boyutlu bir uzayda
(özellik uzayı) eşleştirebileceğini ifade etmiştir. Başka bir ifadeyle bu problemin
çözümü için Şekil 3.6’da görüleceği üzere girdi uzayında doğrusal olarak
ayrılamayan veri daha yüksek boyutlu bir uzayda görüntülenir ve bu yüksek boyutlu
uzayda verinin doğrusal olarak ayrımı gerçekleştirilir.
φ
Hiper Düzlem
Özellik Uzayı
Girdi Uzayı
Şekil 3.6. Doğrusal olmayan verin yüksek boyutlu uzaya dönüşümü ve verinin
doğrusal olarak ayrılması.
Özellik uzayındaki en uygun sınır probleminin çözümü veya en uygun hiper
düzlemin belirlenmesi için Eşitlik 3.21’deki xi ⋅ x j noktasal çarpım ifadesi yerine
φ ( xi ) ⋅ φ ( x j ) yazılabilir. Bu durumda dönüşüm yapılan özellik uzayında λi için
optimizasyon probleminin çözümü
λi > 0
ile bağlantılıdır. Bu eşleştirme
kullanılarak DVM’nin çözümü için karar fonksiyonu;
42
⎛
⎞
f ( x) = sign⎜ ∑ λi y iφ ( x) ⋅ φ ( xi ) + b ⎟
⎝ i
⎠
(3.23)
şeklinde olacaktır. Bu eşitlikten de anlaşılacağı üzere doğrusal olarak verilerin ayırt
edilemediği durumlarda verileri daha yüksek boyutlu bir uzaya taşıyarak
çözümlemek için doğrusal olmayan φ fonksiyonları kullanılmaktadır. Yukarıdaki
eşitlikte verilen φ ( x) ⋅ φ ( xi ) skaler çarpımının yerine tek bir fonksiyon kullanılarak
söz konusu dönüşümler yapılabilir [Vapnik, 1995; Özkan, 2008]. Bu skaler
çarpımının hesaplama zorluğu nedeniyle Kernel fonksiyonları kullanılarak işlem
gerçekleştirilir [Mathur and Foody, 2008a]. Kernel Fonksyonu’nun genel ifadesi
K ( x i , x j ) = φ ( x ) ⋅ φ ( xi )
(3.24)
şeklindedir. Bu fonksiyonlarının belirlenmesinde Mercer teoremine başvurulabilir.
Mercer teoremine göre verinin yüksek boyutlu uzaya dönüşümü ve problemin
çözümü için kullanılacak K ( xi , x j ) şeklinde ifade edilen kernel fonksiyonu aşağıdaki
koşulları gerçekleştirmelidir:
a) Sürekli bir fonksiyon olmalıdır.
b) Simetrik olmalıdır : K ( xi , x j ) = K ( x j , xi )
c) Herhangi x1 ,..., x k değerleri için pozitif tanımlı olmalıdır.
Tablo 3.1’den görüleceği gibi DVM içerisinde kullanılan birçok kernel
fonksiyonu vardır. Keerthi and Lin (2003), doğrusal kernelin radyal tabanlı kernelin
özel bir hali gibi düşünüleceğini ve sigmoid kernelin belirli parametreler için radyal
tabanlı kernel gibi bir davranış gösterdiğini belirtmişlerdir. Literatürde uzaktan
algılanmış görüntülerin sınıflandırılması uygulamaları için polinom ve radyal tabanlı
kernelin yaygın olarak kullanıldığını ve radyal tabanlı kernel kullanımı ile daha iyi
sonuçlar elde edildiği ifade edilmektedir [Melgani and Bruzzone 2004; Foody and
Mathur, 2004; Pal and Mather, 2005; Mathur and Foody, 2008b].
43
Tablo 3.1. Kernel fonksiyonları ve kullanımları
Doğrusal Kernel
Fonksiyonu
Polinom Kernel
İki Katmanlı Yapay
Sinir ağı
genel ifadesi
(( x ⋅ y ) + 1) d
Radyal Tabanlı
Fonksiyon
Kernel fonksiyonun
K ( x, y ) = ( x ⋅ y )
e
d, polinom derecesi
γ , kullanıcı tarafından
−γ x − y 2
belirlenen bir parametre
b ve c, kullanıcı
tanh(b( x ⋅ y ) − c )
Pearson VII
Universal Kernel
(PUK)
tarafından belirlenen
bir parametreler
σ ve ω kullanıcı
1
⎡
⎢
⎢1 +
⎢
⎣
⎛2
⎜
⎜
⎜
⎝
x − y
2
σ
2
(1 / ω )
− 1 ⎞⎟
⎟
⎟
⎠
2
⎤
⎥
⎥
⎥
⎦
ω
tarafından belirlenen
parametrelerdir.
3.1.4. Çok Sınıflı Destek Vektör Makineleri
Destek vektör makineleri başlangıçta iki sınıflı verilerin sınıflandırılması
esasına dayanarak geliştirilmiştir. Günümüzde birçok uygulamada örneğin arazi
örtüsünün sınıflandırılması probleminde olduğu gibi sınıf sayısının ikiden fazla
olması durumu söz konusudur. Böyle bir problemin destek vektör makineleri ile
çözümü için uygun bir çoklu sınıflandırma yöntemine ihtiyaç duyulmaktadır.
DVM’nin çok sınıfı ayırması aşamasında kullanılan çeşitli yaklaşımlar vardır.
Bunlardan en çok kullanılan yaklaşımlar:
•
Çok sınıflı amaç fonksiyonu
•
Bire karşı hepsi yaklaşımı
•
Bire karşı bir yaklaşımı
•
Yönlendirilmiş çevrimsiz çizge yaklaşımı
şeklinde ifade edilebilir.
44
Çok sınıflı amaç fonksiyonu yaklaşımında, ikili sınıflandırma problemlerinin
çözümü için geliştirilen DVM algoritmasının çoklu sınıf problemlerini direkt olarak
çözecek şekilde değiştirilmesi esasına dayanmaktadır [Weston and Watkins, 1998;
Lee et al., 2001; Crammer and Singer, 2001; Schölkopf and Smola, 2002; Debnath,
et al., 2004]. Başka bir ifadeyle bu yaklaşımda ikili sınıflandırmalar için kullanılan
Lagrange fonksiyonunun çoklu sınıfla işlem yapacak hale getirilmesidir. Bu
yaklaşımda optimizasyon algoritması tüm destek vektörlerini aynı anda dikkate
almaktadır. Bu nedenle sınıf sayısının çok fazla olduğu veri setlerinin olması
durumunda bellek gereksinimi ve hem hesaplama zamanı çok fazla artmaktadır.
Bununla beraber, tek bir Lagrange fonksiyonu kullanımından dolayı sınıflandırma
hatalarının arttığı görülmüştür [Pal, 2005a; Demirci, 2007]. Bu nedenle yöntemin çok
sınıflı verilerin sınıflandırılmasında kullanımı tercih edilmemektedir.
Çok sınıflı amaç fonksiyonunda olduğu gibi bütün verilerin direkt olarak
optimizasyon problemine eklenerek çözülmesi yerine DVM’nin sınıf sayısına bağlı
olarak ikili sınıflandırmalar yapacak şekilde düzenlenmesi bir başka yaklaşımdır. Bu
amaç için kullanılan yöntemlerden en önemlileri “bire karşı hepsi” ve “bire karşı bir”
yaklaşımlarıdır.
Bire karşı hepsi yaklaşımında, eğitim verisindeki herhangi bir sınıfa ait veriler
bir kümeyi oluştururken, eğitim verisindeki diğer sınıflara ait verilerin tamamı başka
bir kümeyi oluşturduğu düşünülür. Eğitim verisindeki her bir sınıf için bu ikili
sınıflandırma işlemi tekrar edilir ve bu şekilde çok sınıflı bir problem ikili bir
sınıflandırma problemi gibi düşünülerek DVM’nin eğitimi tamamlanır. Burada N
sayıda farklı sınıfın olduğu düşünülürse N sayıda eğitim işlemi yapılacaktır
[Debnath, et al., 2004; Pal, 2005a; Demirci, 2007]. Lee et al. (2001) ve Schölkopf
and Smola (2002) bu yöntemle elde edilen sınıflandırma sonuçlarının çok sınıflı
amaç fonksiyonu ile benzer olduğunu ifade etmişlerdir. Bu yöntemin en önemli
avantajı oluşturulacak ikili sınıflandırıcı sayısının sınıf sayısına eşit olmasıdır.
Bununla birlikte eğitim sırasında bellek ihtiyacının fazla olması ve eğitimde
kullanılan örnek sayısının fazla olması yöntemin dezavantajıdır. Bu durum özellikle
büyük eğitim verileri olması durumunda bilgisayar için bellek problemini ortaya
çıkarmaktadır. Diğer taraftan N tane sınıftan oluşan eğitim verisinin her bir sınıf için
eşit sayıda örnekten oluştuğu düşünüldüğünde, eğitim sırasında bir sınıfa ait örnek
45
sayısının geriye kalan diğer tüm sınıflara ait örnek sayısına oranı 1 : (N–1) olacaktır.
Bu oran eğitim örnekleri boyutunun dengesiz olacağını göstermektedir [Huang et al.,
2002; Milgram et al., 2006]. Mathur and Foody (2008b) bire karşı hepsi yaklaşımı ile
yapılan sınıflandırma sonucunda sınıflandırılmamış pikseller oluşabileceğini ifade
etmişlerdir.
Bire karşı hepsi yaklaşımındaki kısıtlamalar bire karşı bir yaklaşımın ortaya
atılmasına neden olmuştur. Bu metotta tüm olası sınıf çiftleri için DVM
sınıflandırıcıları oluşturulur [Knerr et al., 1990; Hastie and Tibshirani, 1998]. Diğer
bir ifadeyle bire karşı bir yaklaşımında, her bir sınıfa ait örnek kümeleri diğer örnek
kümeleri ile ayrı ayrı eğitilir. N sayıda farklı sınıf olması halinde N(N-1)/2 tane
eğitim işlemi yapılır. Eğitim işlemleri sonucunda elde edilen her bir sınıflandırıcı test
verisine uygulanır. Test verisindeki her bir nokta her bir eğitim sonucunda bir oy alır.
Eğitim sonucunda sınıfı belirli olmayan nokta için en çok oy alan sınıf o noktanın
sınıf etiketini oluşturur. Bu yöntemde oluşturulan sınıflandırıcıların sayısı bire karşı
hepsi yaklaşımından fazladır. Bununla birlikte her bir sınıflandırıcı için gerekli
eğitim veri verisinin sayısı daha azdır. Eğitim vektörlerinin oransal boyutu her bir
sınıf için aynıdır. Dolayısıyla bu yöntem bire karşı hepsi yöntemine göre daha
simetrik bir yaklaşımdır. Tüm bu olumlu yönlerine rağmen sınıf sayısının artmasıyla
kullanılacak sınıflandırıcının sayısı da artmaktadır [Pal, 2005a]. Örneğin 6 sınıfa
sahip bir veri seti düşünüldüğünde oluşturulacak sınıflandırıcı sayısı 15 olacaktır.
Yönlendirilmiş çevrimsiz çizge yaklaşımı Platt et al. (2000) tarafından
geliştirilen bir çoklu sınıflandırma yöntemidir. Bu yaklaşımda N sınıflı bir
sınıflandırma problemi için oluşturulacak sınıflandırıcı sayısı N(N–1)/2 olup her bir
sınıflandırıcı ilgilenilen iki sınıfı dikkate alarak eğitilir. Bu yöntemin işleyişi bire
karşı bir yöntemi ile benzerdir ve eğitim aşaması tamamen aynı şekilde yapılır.
Yöntemin farklılığı ise test aşamasında olmaktadır. Bu yöntemde test yapılırken bütün
eğitim işlemleri kontrol edilerek gerçekleştirilmez. Bunun yerine örneğin ait
olmadığı düşünülen eğitim örnekleri elenerek ilerlenir.
46
3.1.5. DVM ile Sınıflandırmada Veri Ön İşleme ve
Model Seçimi
Kontrollü sınıflandırma yönteminde problemin çözümü için sınıflandırılacak
veriye ait örnekleri içeren eğitim ve test verileri kullanılır. Eğitim setindeki her bir
örnek, öznitelik (özellik) verilerini ve bu verilere ait sınıf etiketlerini içermektedir.
DVM’nin amacı sadece öznitelik değerleri belli olan test setindeki verilerin sınıf
etiketlerini tahmin edecek bir model oluşturmaktır.
DVM uygulanmadan önce verilerin ölçeklenmesi önemlidir [Sarle, 2008].
Ölçeklendirmenin asıl avantajı çok geniş sayısal aralıktaki verinin daha dar bir
sayısal aralıkta ifade edilmesidir. Bir başka avantajı ise hesaplamalar sırasında işlem
kolaylığı sağlamasıdır. Kernel değerleri genellikle özellik vektörlerinin skaler
çarpımına dayandığından geniş aralıktaki öznitelik değerleri hesaplama sırasında
sayısal problemlere neden olabilmektedir. Yapay sinir ağları ile yapılan
sınıflandırmada olduğu gibi her bir öznitelik verisi (uzaktan algılamada her bir bant)
[ 0,1]
veya
[ −1, + 1 ]
aralığında ölçeklenmektedir. Verinin ölçeklenmesinin
ardından, DVM’nin eğitimi için kullanılacak modelin seçilmesi ve seçilen kernel
fonksiyona ait parametrelerin belirlenmesi esastır.
Model seçiminde öncelikli olarak RTF ve polinom kernelin düşünülmesi
oldukça mantıklıdır. Bunun ilk nedeni, RTF ve polinom kernelin doğrusal olarak
ayrılamayan verileri daha yüksek boyutlu bir uzayda eşleştirmesidir. Bu nedenle
lineer kernelin aksine sınıf etiketleri ve öznitelik verilerinin doğrusal olmadığı
durumlarda da kullanılabilmektedir. Keerthi and Lin (2003), lineer kernel RBF
kernelin özel bir hali olduğunu ve C düzenleme parametresine sahip lineer kernelin
bazı parametrelere sahip (C, γ ) RTF kernel ile aynı performansa sahip olduğunu
belirtmişlerdir. Buna ek olarak sigmoid kernel belirli parametreler için RTF kernel
gibi davranış göstermektedir [Lin and Lin, 2003]. RTF kernelin tercih edilmesindeki
ikinci neden ise model seçimini karmaşık hale getiren parametrelerdir. Polinom
kernelin kullanımında söz konusu olan polinom derecesindeki değişimler
matematiksel
olarak
algoritmayı
karmaşık
hale
getirmekte
ve
çözümü
zorlaştırmaktadır. Buna karşın RTF kernelin sahip olduğu gamma parametresindeki
47
değişimlerin sınıflandırıcının performansına olan etkisinin daha az olduğu ifade
edilmektedir [Hsu et al., 2008].
RTF ve polinom kernel kullanımında iki parametre (C, γ ve C, d) söz
konusudur. Herhangi bir problem için hangi parametre çiftinin en iyi sonuç vereceği
bilinmemektedir. Bu nedenle en uygun parametrelerin belirlenmesi gerekmektedir.
Bu amaçla geliştirilmiş birkaç yöntem mevcuttur. Bu yöntemlerde amaç en iyi
sınıflandırma sonucunu verecek parametre çiftini belirlemektir. Böylece sınıflandırıcı
veriye ait bilinmeyen sınıf etiketlerini daha doğru bir şekilde tahmin edebilecektir.
Yaygın olarak kullanılan yöntemlerden birisi eğitim verisini iki kısma ayırmaktır.
Birinci kısım sınıflandırıcının eğitimi sırasında eğitim verisi olarak kullanılırken
ikinci kısım bilinmeyen yani test verisi olarak işleme koyulur. Bu sayede bu veri seti
için tahmin doğruluğu başka bir ifadeyle bilinmeyen verinin sınıflandırılma
performansı daha hassas bir şekilde ifade edilecektir. Bu işlemin literatürde çapraz
geçerlik olarak adlandırılmaktadır. v − katlı çapraz geçerlilikte, ilk önce eğitim seti
eşit boyutta v sayıda alt kümeye ayrılır. Daha sonra bir alt küme eğitilen
sınıflandırıcı ile geriye kalan v − 1 alt küme ile test edilir. Bu şekilde tüm eğitim
setindeki her bir örnek tahmin edilir ve doğru olarak sınıflandırılan verinin yüzdesi
çapraz geçerliliğin doğruluğunu gösterir.
C, γ ve C, d parametrelerinin çapraz geçerlilik kullanılarak belirlenmesinde
grid tarama yöntemi kullanılan yöntemlerden birisidir. Bu yöntemin çalışma prensibi
genel olarak parametre çiftlerinin çapraz geçerlilik yoluyla denenmesi ve en iyi
çapraz geçerlilik doğruluğuna sahip olan çiftin tespit edilmesidir. Girid tarama
yönteminde kullanılacak parametre çiftleri için katlanarak büyüyen dizilerinin
( C = 2 −5 ,2 −3 ,...,215 , γ = 2 −15 ,2 −13 ,...,2 3 ) denenmesi en pratik yoldur [Hsu et al.,
2008].
Hassas bir grid tarama yapılması zaman alacağından öncelikle kaba bir aralıkta
grid taraması yapılması zaman tasarrufu sağlar. Kaba grid taraması ile en iyi çapraz
geçerlilik doğruluğunu sağlayan çiftler tespit edilir. Daha sonra yakın aralıklardaki
parametre çiftleri için çapraz-geçerlilik yöntemi ile bu problemdeki veri seti için en
yüksek sınıflandırma doğruluğunu veren parametreler belirlenir. En iyi sınıflandırma
48
doğruluğuna ulaşan parametre çifti bu şekilde belirlenerek sınıflandırıcının eğitimi
tamamlanır. Daha sonra eğitilen sınıflandırıcı ile tüm veri seti için sınıf etiketleri
tahmin edilir.
3.2. Karar Ağaçları
Karar ağaçları yaygın kullanımı olan sınıflandırma ve örüntü tanımlama
algoritmalarından birisidir. Bu yöntemin yaygın olarak kullanımının nedeni ağaç
yapılarının oluşturulmasında kullanılan kuralların anlaşılabilir ve sade olmasıdır.
Eğer kullanılan veriye dayalı olarak oluşturulan ağaç yapısı çok büyük değil ise
ağacın oluşturulması ve sınıflandırma işleminin gerçekleştirilmesinde kullanılan
kuralların anlaşılması oldukça kolay olacaktır.
Genellikle karar ağaçlarının tasarımında iki yaklaşım mevcuttur [Swain and
Hauska, 1977]. Bu yaklaşımlar prensipte benzerdir ancak uygulamada ağaçların
tasarlanması açısından önemli farklılıklar vardır.
1. Manuel tasarım yöntemi
2. Sezgisel atama yöntemi
Manuel yöntemler tüm sınıflar için hesaplanan ortalama vektör ve kovaryans
matrisi gibi istatistikleri kullanır. Her bir özellik için tüm sınıfların ortalamaları ve
varyanslarından elde edilen bir grafik çizilir. Bu grafik rastlantısal spektral çizim
olarak adlandırılır. Genelde birkaç karar adımında tüm sınıfların ayrıldığı bu
grafikten en uygun karar sınırlarının tahmin edilmesi mümkündür. Bu, her bir
aşamada bir özelliğin kullanılması koşulu ile kabaca sınıflar arasındaki basit sınır
aralığının tahmin edilmesi anlamına gelmektedir. Bu yöntemin uygun bir
sınıflandırma yöntemi olmamasının başlıca iki nedeni vardır. Bunlardan ilki ağacın
belirli bir basamağında iki veya daha fazla özellik olması durumunda grafiğin
özellikler arasındaki ilişkilerin nasıl kullanılacağını göstermemesidir. İkincisi ise,
verinin normal dağılımda olmadığı durumlarda kovaryans matrisinin tahmin
edilmesinin oldukça zor olmasıdır.
49
Rastlantısal spektral çizim tek bir özelliğe dayalı sınıflar arasındaki
ayrılabilirliğin tahmin edilmesine olanak verir. Sınıfların ayrımının yapılması birkaç
özelliğin kombinasyonunu gerektirdiğinde spektral çizime dayanan manuel tasarım
yaklaşımı oldukça kısıtlıdır. Genel olarak sınıf sayısının çok olduğu veya yeterli
sınıflandırma doğruluğu için birçok özelliğin kullanımının gerektiği karmaşık
problemler daha fazla analitik tasarım işlemlerini gerektirmektedir.
Sezgisel yöntem kullanılarak bir sınıflandırma ağacı oluşturmak için özellik
vektörleri ve bu vektörlere ait sınıf etiketlerinin eğitim verisinde olduğu kabul edilir.
Bundan sonra karar ağacı eğitim verisini tekrarlı bir şekilde ayırarak daha sade, daha
homojen hale getirir ve bir veya daha fazla öznitelik değerine sahip test verisi ağacın
her bir dalında veya düğüm noktasında uygulanır. Bu işlemler ayırma düğümleri,
hangi düğümlerin uç düğümler olacağının belirlenmesi ve uç düğüm noktalarına sınıf
etiketlerinin atanması olmak üzere üç adımda gerçekleşmektedir. Sınıf etiketlerinin
uç düğümlere atanması açık bir şekilde ifade edilecek olursa; belirli sınıfların
diğerlerinden daha yüksek olasılığa sahip olduğu düşünüldüğünde çoğunluk oyuna
veya ağırlıklı oylar esas alınarak sınıf etiketlerinin atanmasıdır.
Bir ağaç yapısı düğüm, dal ve yaprak olarak adlandırılan üç temel kısımdan
oluşur. Bu ağaç yapısında her bir öznitelik bir düğüm tarafından temsil edilir. Dallar
ve yapraklar ağaç yapısının diğer elemanlarıdır. Ağaçta en son kısım yaprak en üst
kısım ise kök olarak adlandırılır. Kök ve yapraklar arasında kalan kısımlar ise dal
olarak ifade edilir [Quinlan, 1993]. Başka bir ifadeyle bir ağaç yapısı verileri içeren
bir kök düğümü, iç düğümler (dallar) ve uç düğümlerden (yapraklar) oluşur. Karar
ağacındaki her bir düğüm sadece bir ana düğüme ve iki veya daha fazla alt düğüme
sahiptir (Şekil 3.7). Veri seti ağaç tarafından belirlenen karar iskeletine göre aşağı
doğru hareket ettirilerek ve sıralı olarak bir yaprağa ulaşılana kadar alt bölümlere
ayrılarak sınıflandırılır. Eğitim verileri ve bu verilere ait öznitelik bilgilerinden
yararlanılarak bir karar ağacı yapısı oluşturulmasında temel prensip verilere ilişkin
bir dizi sorular sorulması ve elde edilen cevaplar doğrultusunda hareket edilerek en
kısa sürede sonuca gidilmesi olarak ifade edilebilir. Bu şekilde karar ağacı sorulara
aldığı cevapları toplayarak karar kuralları oluşturur. Ağacın ilk düğümü olan kök
düğümünde verilerin sınıflandırılması ve ağaç yapısının oluşturulması için sorular
sorulmaya başlanır ve dalları olmayan düğümler ya da yapraklara gelene kadar bu
50
işlem devam eder. Bu noktada belirtilmesi gereken husus yaprak sayısı kadar kural
oluşacağıdır. Oluşturulan ağacın işlevselliğinin başka bir ifadeyle yeni bir veri seti
için genelleme kabiliyetinin belirlenmesi için test veri seti kullanılır. Eğitim veri seti
ile oluşturulan ağaç yapısına yeni gelen bir test verisi, ağacın kökünden girer. Kökte
test edilen bu yeni veri test sonucuna göre bir alt düğüme gönderilir. Ağacın belirli
bir yaprağına gelene kadar bu işleme devam edilir. Kökten her bir yaprağa giden tek
bir yol veya tek bir karar kuralı vardır.
Quinlan (1993) bir karar ağacı oluşturma yöntemini aşağıdaki gibi ifade
etmiştir. Bir karar ağacı oluşturmak için m sınıfa sahip T eğitim veri seti şeklinde
ifade edilsin. Bu durumda üç olasılık vardır:
•
T, tümü Ci gibi tek bir sınıf olan bir veya daha fazla nesneye sahip olduğunda
karar ağacı Ci sınıfını tanımlayan bir yapraktan oluşur.
•
T hiçbir veriyi içermiyorsa, karar ağacı yine T’den başka bilgilerle tanımlanan
bir yapraktan oluşur.
•
T karışık sınıflardan oluşan veriler içeriyorsa, seçilecek test verisi tek bir
özniteliğe ya da özniteliklerin kombinasyonuna dayanır. Bu durumda test
verisi {O1 ,O2 ,…,Ok} şeklinde bir veya ayrışık sonuçlara sahip olacaktır. T,
bu durumda şeklinde alt kümelere ayrılır. Burada seçilen test verileri için Oi
çıktı değerlerini içeren tüm T eğitim verilerini ifade etmektedir. T eğitim
verisi için karar ağacı test verisini tanımlayan bir karar düğümü ve her bir
olası çıktı değeri için bir daldan oluşur. Aynı ağaç yapısı işlemi tekrarlı bir
şekilde eğitim verisin her bir alt kümesi için uygulanır.
Sınıflandırma işlemi için oluşturulan tipik bir karar ağacı Şekil 3.7’ de
gösterilmiştir. Elips biçimindeki düğümler karar düğümleridir. Bu düğümler xi
değerlerine dayanan η i eşik değerleri tarafından belirlenir. Karar ağacının farklı
kısımlarında aynı öznitelik değeri farklı eşik değerlerine sahip olabilir. Şekildeki
dikdörtgen düğümler terminal düğümleridir ve sınıf etiketlerini içeririler. Test
verisindeki değerler eğitim sırasında belirlenen eşik değerlerine dayalı olarak karar
ağacında “evet” veya “hayır” şeklinde dallanmalar ile belirlenir. Bilinmeyen test
51
verisinin sınıflandırılması düşünüldüğünde, verilere ait sınıf etiketleri ulaşılan en son
terminal düğümdeki değeri alır.
x1 ≤ η1
Hayır
Evet
x4 ≤ η 4
x3 ≤ η 31
Hayır
Evet
Y=1
Hayır
Y=3
x3 ≤ η 32
Evet
Evet
Y=2
x2 ≤ η 2
Hayır
Hayır
Evet
Y=2
Y=1
x5 ≤ η 5
Evet
Y=1
Hayır
Y=3
Şekil 3.7. Beş boyutlu bir özellik uzayı ve üç sınıf için bir sınıflandırma ağacı.
Şekilde xi özellik değerlerini, η i eşik değerlerini ve Y ise sınıf etiketlerini
göstermektedir.
Karar ağaçları ile sınıflandırma problemlerinde veri setine ait sınıf sayısı iki
olduğunda ikili sınıflandırıcılar, sınıf sayısı ikiden fazla olması durumunda ise çoklu
sınıflandırıcılar söz konusudur. İkili sınıflandırıcılara örnek olarak ID3 [Quinlan
1993] ve bu algoritmanın geliştirilmiş biçimi olan C4.5 algoritmaları gösterilebilir.
Çoklu sınıflandırıcılar arasında CART [Breiman et al., 1984] algoritması örnek
olarak verilebilir.
3.2.1. Karar Ağacı Oluşturulmasında Kullanılan Yöntemler
Literatürde günümüze kadar birçok ağaç yapısı oluşturma yaklaşımları
geliştirilmiştir. Ancak karar ağacı tasarımı üzerine yapılan birçok araştırma bölünme
kurallarının bulunması konusuna yoğunlaşmıştır [Landeweerd et al., 1983;
52
Kononenko and Hong, 1997; Pal, 2002]. Karar ağacının her bir iç düğümünde eğitim
verisinin bölümlenmesi için bir takım algoritmalar geliştirilmiştir. Bu algoritmalar ya
eğitim verisindeki gürültüyü azaltır ya da bölümlenmenin en iyi olmasını sağlar. Bir
karar ağacı oluşturulmasında yaklaşımlar:
•
Aşağıdan yukarıya yaklaşımı
•
Yukarıdan aşağıya yaklaşımı
•
Melez yaklaşım
•
Büyüme – budama yaklaşımı
3.2.1.1. Aşağıdan-Yukarıya Yaklaşımı
Aşağıdan-yukarıya yaklaşımında, kullanılarak eğitim seti ve bazı uzunluk
ölçüleri (örn. Mahalanobis uzaklığı) ikili bir ağaç oluşturulur. Önceden belirlenen
sınıflar arasında ikili uzaklıklar hesaplanır ve her bir adımda bir birine en yakın
uzaklığa sahip iki sınıf yeni bir grup olarak birleştirilir. Her bir grup için, bu grubu
oluşturan sınıfların eğitim verilerinden ortalama vektör ve kovaryans matrisi
hesaplanır. Bu işleme ağaç kökünde tek bir grup kalıncaya kadar tekrar edilir. Bu
şekilde bir ağaç oluşturulmasında ilk önce daha belirgin olan ayrımlar kök düğümün
hemen yanında yapılır, daha karmaşık olanlar ağacın daha sonraki kısımlarında
yapılır [Landeweerd et al., 1983].
3.2.1.2. Yukarıdan-Aşağıya Yaklaşımı
Yukarıdan-aşağıya
yaklaşımında,
bir
karar
ağacı
sınıflandırıcısının
oluşturulması aşağıdaki üç aşamadan oluşur. Bunlar:
1. Bir bölünme kural düğümünün seçimi,
2. Hangi düğümlerin bağlantı düğümleri olacağına karar verilmesi,
3. Her bir bağlantı düğümüne, bir sınıf etiketinin atanmasıdır.
53
Sınıf atama problemi yukarıda bahsedilen işlerden en basit olanıdır. Çoğunluk
kuralı kullanılarak en yüksek olasılığa sahip sınıflar terminal düğümlerine atanır. Bu
işleme örnek olarak terminal düğümünde en fazla örneğe sahip olan sınıfa ait etiket
terminal düğümüne atanması gösterilebilir. İç düğümdeki herhangi bir bölünme
kriteri seçiminde temel düşünce verinin alt düğümlerde azalmasını sağlamaktır.
Bu işlemin uygulamasındaki genel yaklaşım eğitim verisini en iyi şekilde
sınıflara ayıran öznitelik değerinin seçilmesi ve daha sonra verinin bu öznitelik
değerlerine göre bölünmesidir. Sonlandırma prosedürü ile her bir bölümlenmiş alt
küme için bu işlem mevcut alt kümedeki tüm örnekler aynı sınıfa ait olana kadar
tekrarlanır. Sonuç her bir düğümün bir özniteliği gösterdiği ve bir düğümden çıkan
her bir dalın bu öznitelik değerine ait olası bir değeri belirttiği bir ağaç ile temsil
edilir.
Karar ağacının gelişiminde her bir düğüm noktasında bir dizi gözlem kümesi ve
bu gözlem kümesinin sınıflandırılması için bir dizi öznitelik değeri var olacağından
bu işlemin temel amacı kriter olarak kullanılacak öznitelik değerinin seçilmesidir.
Tüm öznitelik değerlerinin kalitesi belirlenmeden ve her bir öznitelik bilgisinin
veriyi çeşitli sınıflara ne kadar iyi ayırdığını görülmeden herhangi bir öznitelik değeri
kriter olarak seçilemez. Bir öznitelik değerinin kalitesi bu öznitelik verisiyle
sağlanacak yararlı bilgileri göstermelidir. Bir özniteliğin kalitesinin tahmini için iki
temel yaklaşım vardır.
İlk yaklaşım, bir özniteliğin kalitesinin diğer öznitelikleri ihmal edilmesiyle
tahmin edilebileceğidir. Bu durumda tahmin amacıyla öznitelik değerlerinin
birbirinden bağımsız olduğu kabul edilir. İkinci yaklaşım ise, bir özniteliğin
kalitesinin diğer özniteliklerin içeriğinden tahmin edilebileceğidir. Hesaplama hızı
avantajına sahip olan ilk yaklaşım “miyop yaklaşım” olarak da adlandırılır
[Kononenko and Hong, 1997]. Diğer yaklaşım hesaplama açısından daha zahmetlidir
buna karşın öznitelikler arasındaki yüksek seviyedeki bağımlılıkları ortaya çıkarma
potansiyeline sahiptir.
54
3.2.1.2.1. Karar Ağaçlarında Dallanma Kriterleri ve Öznitelik
Seçimi
Karar ağaçlarının oluşturulmasındaki en önemli adım ağaçtaki dallanmanın
hangi kritere veya kıstasa göre yapılacağı ya da hangi öznitelik değerlerine göre ağaç
yapısının oluşturulacağıdır. Karar ağaçlarında dallanma kriterleri veya özniteliklerin
seçimi için makine öğrenmesi ile ilgilenen araştırmacılar tarafından detaylı bir
şekilde incelenen birçok yaklaşım vardır [Murthy et al., 1994; Kononenko and Hong,
1997; Mingers, 1989; Quinlan, 1993]. Diğer yaklaşımlar eğitim verisindeki
gürültüyü minimum hale getirmeye çalışırken bazı yaklaşımlar “bölünmenin
iyiliğini” ölçerler [Brieman et al., 1984].
Sınıflandırmada özniteliğin kalitesi sınıflara ait eğitim gözlemlerinin saflığı ile
tanımlanır ve birçok yaklaşım kalite ölçümünü direkt olarak özniteliklerden belirler.
Eğer tüm gözlemler aynı sınıfa ait ise gözlemler kümesi saftır (katkısızdır). Gürültü
fonksiyonu bir gözlem kümesindeki gürültüyü ölçer ve saf bir küme için bu
gürültüyü minimum hale getirmeyi amaçlar. Gürültü fonksiyonu esas olarak mevcut
düğüm noktasından daha ileriki bölünmeler için en iyi özniteliğin seçiminde
kullanılır. Karar ağaçlarında genellikle kullanılan gürültü ölçümleri:
1. Bilgi Kazancı ve Bilgi Kazanç Oranı kriteri [Quinlan, 1987, 1990,
1993].
2. Gini İndeksi [Brieman et al., 1984]
3. Twoing Kuralı [Brieman et al., 1984]
4. Ki-Kare istatistikleri [Mingers, 1989].
3.2.1.2.2. Bilgi Kazancı ve Bilgi Kazanç Oranı Kriterleri
Bilgi kazancı ve bilgi kazanç oranının kullanımı Quinlan (1993) tarafından
ortaya atılmıştır. Bu yönteme göre karar ağacında hangi özelliğe göre dallanmanın
yapılacağını belirlemek üzere entropi kurallarını içeren bilgi teorisi kullanılmıştır.
Entropi bir sistemdeki düzensizliğin ya da belirsizliğin ölçüsüdür. Entropi bir kodun
55
teorik bilgi içeriğini ölçen bilgi teorisinden elde edilen klasik bir formüle dayanır. Bu
formül;
Entropi = −∑ pi log( pi )
(3.25)
şeklinde gösterilir. Bu formülde pi, i. pikselin olasılığıdır. Bu ölçünün değeri çeşitli
olası piksellerin olabilirliğine dayanır. Tüm pikseller eşit olasılıkta ise (örneğin pi
değerleri eşit ise) büyük miktarda belirsizlik vardır ve bilgi kazancı büyük olacaktır.
Fonksiyonun değeri olası piksel sayısına da dayanmaktadır. Quinlan (1993), bilgi
kazancı ve bilgi kazanç oranı ölçülerini aşağıdaki şekilde ifade etmiştir: Ci şeklinde
birkaç sınıftan oluşan T ile gösterilen bir eğitim seti için olasılık ifadesi
f ( Ci ,T ) T
şeklindedir. Burada f ( Ci ,T )
(3.26)
ifadesi Ci sınıfına ait T eğitim setindeki örnekleri
ifade etmektedir ve T ifadesi ise T eğitim setindeki sınıf sayısını göstermektedir. Bu
durumda bilgi,
− log 2 ( f (C i , T ) T )
(3.27)
şeklindedir.
T eğitim setindeki bir gözlemi için sınıfın belirlenmesini gerektiren bilgi
kazancının miktarı;
m
bi lg i( T ) = −∑ f ( C i ,T ) T × log 2 ( f ( C i ,T ) T )
(3.28)
i =1
şeklinde belirlenebilir. Bu miktar T eğitim setinin entropisi olarak ifade edilebilir.
Eğer T eğitim kümesini k sayıda çıktıya bölebilen bir Z test veri seti
tanımlanabilirse, Z uygulandıktan sonra tüm bilgi miktarını belirten benzer bir ölçü
tanımlanabilir.
56
k
bi lg i z ( T ) = ∑
Tj
j =1 T
× bi lg i( T j )
(3.29)
Bu yaklaşımın kullanılmasıyla, T eğitim setinin Z gibi bir test seti kullanarak
elde edilen bilgi kazancı;
Kazanç( Z ) = bi lg i( T ) − bi lg i z ( T )
(3.30)
şeklinde belirlenebilir.
Bu kriter Quinlan (1993) tarafından kazanç kriteri olarak ifade edilmiştir.
Kazanç kriteri bilgi kazancını maksimum hale getirmek için bir test verisi seçer. Bu
Z test verisi ile sınıf arasındaki karşılıklı bilgi olarak bilinir.
Birçok çıktı değerini içeren test verisinin lehine güçlü bir önyargıya sahip
olması kazanç kriterinin en önemli dezavantajıdır. Kazanç kriterinin özündeki bu
önyargı birçok çıktı değeri ile birlikte kazancın ayarlandığı bir çeşit normalleştirilme
ile düzeltilebilir. Bu normalleştirme işlemi Eşitlik 3.31’de gösterilen ayırma bilgisi
ile gerçekleştirilebilir.
⎛ Tj
⎜
× log 2 ⎜
T
⎜ T
j =1
⎝
k
Ayırma Bilgisi (Z) = − ∑
Tj
⎞
⎟
⎟⎟
⎠
(3.31)
Kazanç birkaç bölünme sonucu ortaya çıkan sınıflandırma için yararlı bilgiyi
ölçerken, ayırma bilgisi Z test verisinin k sayıda alt kümeye bölünmesi ile oluşturulan
potansiyel bilgi hakkında bir fikir verecektir. Bu durumda kazanç oranı;
Kazanç Oranı( Z ) = Kazanç( Z ) Ayırma Bi lg isi( Z )
(3.32)
şeklinde olacaktır. Bu eşitlik, sınıflandırmada işleminde kullanılacak ayırma ile elde
edilen bilgi oranını vermektedir. Bu kriter kullanılarak, ağacın her bir düğümünde
kazanç oranı maksimum olacak şekilde T eğitim kümesi tekrarlı bir şekilde ayrılır.
57
Bu işlem her bir yaprak düğümü sadece bir sınıfa ait gözlem değerleri içerene kadar
devam eder.
3.2.1.2.3 Gini İndeksi
Brieman et al. (1984) çeşitleme için Gini indeksi olarak adlandırılan bir ölçüm
kullanmışlardır. Gini fonksiyonu sınıflara ilişkin özniteliklerin safsızlığını ölçer. Ci
gibi bazı sınıflara sahip T şeklinde verilen bir eğitim setinin;
(3.33)
f ( C i ,T ) T
şeklinde bir olasılığa sahip olduğu söylenebilir. Genel Gini fonksiyonu veya
safsızlığın ölçümü;
∑ ∑ ( f (C ,T ) T )( f (C ,T ) T )
j ≠i
i
j
(3.34)
şeklinde ifade edilebilir. Bu fonksiyon;
2
⎛
⎞
⎜ ∑ f (C j ,T ) T ⎟ − ∑ f 2 (C j ,T ) T
⎟
⎜
j
⎠
⎝ j
(3.35)
şeklinde veya;
1 − ∑ f 2 (C j ,T ) T
(3.36)
j
şeklinde de yazılabilir.
Gini indeksi basittir ve hızlı bir şekilde hesaplanabilir. Bu indeks rastgele
seçilen bir objenin bir düğümden f (Ci ,T ) T olasılığı ile i sınıfına atanması olarak
özetlenebilir.
58
3.2.1.2.4. Towing Kuralı
Towing kuralı Brieman et al. (1984) tarafından tanımlanmıştır. Bu kural karar
ağacı yapısının oluşturulmasında öznitelik seçimi için farklı bir yaklaşım
kullanmaktadır.
Bir dizi sınıf C = { 1,..., j ) ile gösterildiği düşünülsün. Her bir düğümde bu
sınıflar C1 = { j1 ,..., j n ) ve C 2 = C − C1 şeklinde iki üst sınıfa ayrılsın. Düğümün
ayrılması sonucunda safsızlığının azaldığı her bir düğümün ayrılması;
(T
L
⎛
⎞
T )* ⎜⎜ ∑ Li TL − Ri TR ⎟⎟
⎠
⎝
T )* ( TR
şeklinde hesaplanabilir. Burada TR
ve
2
(3.37)
TL düğümün ayrılması ile sağ ve solda
kalan örneklerin sayısını göstermektedir. Li ve Ti ise ayırma sonucu sağ ve solda i.
kategoriye ait örneklerin sayısını ifade etmektedir. Safsızlıktaki zamla towing kuralı
olarak ifade edilir.
3.2.1.2.5. Ki-Kare Olasılık Tablo İstatistiği ( χ 2 )
Mingers (1989) bu ölçütün karar ağacı oluşturulmasında özniteliklerin seçimi
için kullanımını ifade etmiştir. Bu yöntem olasılık tablosundaki iki değişken
arasındaki ilişkinin ölçüldüğü geleneksel istatistiğe dayanmaktadır. Değişkenler
arasında ilişki olamadığı durumlarda ise beklenen frekansların gözlemlerin
frekansları ile karşılaştırılmasından elde edildiği istatistiğe dayanmaktadır. Sonuçta
elde edilen istatistiğin yaklaşık olarak yüksek değerlerin büyük ilişkiyi ifade ettiği kikare dağılımında olduğu söylenebilir. Bu fonksiyona ait temel eşitlik;
χ = ∑∑
2
(x
− Eij )
2
ij
Eij
(3.38)
59
şeklindedir. Bu eşitlikte Eij = xi x j N ifadesi olasılık tablosundaki her bir hücreye
karşılık gelen ümit değeridir.
Yukarıdan-aşağıya karar ağacı sınıflandırıcısı tasarımının son aşaması
ayırmanın nerede bitirilmesi gerektiğinin belirlenmesidir. Bunun için ilk yaklaşım
terminal düğümlerinin seçilmesidir. Eşik değeri β > 0 için eğer t düğümü;
mak Δ i( S ( t ),t ) < β
(3.39)
S∈T
koşulunu sağlıyorsa terminal düğümü olarak seçilir. Bunu başarmak için her bir t iç
düğüm noktasında i(t) şeklinde bir safsızlık fonksiyonunun tanımlanması bir
yöntemdir [Breiman et al.,1984]. Eğer bir S aday ayırma, t iç düğümünü sağ düğüm
tR ve sol düğüm tL şeklinde düğümlere ayırıyorsa ve t’nin tL düğümüne pL oranında,
tR düğümüne pR oranında ayrılmasını sağlıyorsa; S ayırmasının iyiliği azalan
safsızlıkla ölçülebilir;
Δ i( S ,t ) = i( t ) − i( t L ) p L − i( t R ) p R
(3.40)
Bu nedenle tüm S ayırmaları içerisinden Δ i( S ,t )
ifadesini minimum hale
getirecek bir ayırma seçilir. Bu kuralın kullanılması sonucunda ayırma işlemi bazı
düğümlerde çok erken tamamlanmakta bazı düğümlerde çok geç tamamlanması
problemi ortaya çıkmaktadır. Breiman et al. (1984) ayrılmanın durdurulma kuralının
ayırma kuralına göre karar ağacı sınıflandırıcısının etkinliğinde daha fazla etkisi
olduğunu ifade etmiştir.
3.2.1.3. Melez Yaklaşım
Melez yöntemler karar ağacı sınıflandırıcısının tasarımının sırayla hem
yukarıdan-aşağıya
hem
de
aşağıdan-yukarıya
yaklaşımlarının
kullanımını
öngörmektedir [Kim and Landgrebe, 1991]. Bu sınıflandırıcının temel çalışma
prensibi şu şekildedir. İlk olarak, tüm sınıflardan oluşan veri aşağıdan-yukarıya
yaklaşımı kullanılarak iki alt gruba ayrılır. Daha sonra her bir alt grubun ortalama ve
kovaryansları hesaplanır ve yukarıdan-aşağıya yaklaşımı kullanılarak iki yeni alt
60
grup oluşturulur. Her bir alt grubun sadece bir sınıf içerip içermediği kontrol edilir.
Eğer tek bir sınıf içeriyorsa bu grup terminal olarak adlandırılır. Eğer birden fazla
sınıfı içeriyorsa işleme tek alt grup tek bir sınıf içerene kadar devam edilir. Bu işlem
tüm alt gruplar terminal olarak belirlenene kadar devam eder.
3.2.1.4. Gelişme-Budama Yöntemi
Bir karar ağacının oluşturulmasında kullanılan bu yöntem Gelfand et al. (1991)
tarafından öne sürülmüştür. Bu yöntemin çalışma prensibi şu şekilde özetlenebilir.
Öncelikle tüm veri seti yaklaşık olarak eşit olacak şekilde iki alt kümeye ayrılır.
Geniş ağaç ilk veri alt kümesi kullanılarak saf terminal düğümleri ile birlikte
büyütülür. Budanan alt-ağaç ikinci veri setine dayalı olarak hata oranını minimum
hale getirilmesi ile belirlenir. Bu işlem iteratif olarak tekrar edilir.
3.2.2. Veri Ayırma Yöntemine Dayalı Sınıflandırma
Algoritmaları
Karar ağaçları iç düğümlerdeki ayrılmaların tahmini için kullanılan
algoritmaların tek tip veya çoklu olup olmadığına göre tanımlanabilir. Bu tür
algoritmalar homojen veya heterojen hipotez uzayına sahip algoritmalar olarak
tanımlanır. Karar ağaçlarının tasarımı için kullanılan geleneksel yaklaşım her bir
ayrımın tahmininde tek bir algoritmayı kullanan homojen sınıflandırma modellerine
dayanan yaklaşımdır. Genel anlamda homojen hipotez uzayına dayanan iki tip karar
ağacı vardır. Bunlar tek değişkenli ve çok değişkenli karar ağaçlarıdır [Friedl and
Brodley, 1997]. Düğümlerin yapısı bakımından karar ağaçlarının üç tipi vardır:
• Tek değişkenli karar ağaçları
• Çok değişkenli karar ağaçları
• Melez karar ağaçları
61
3.2.2.1. Tek değişkenli Karar Ağaçları
Tek değişkenli karar ağaçları her bir düğüm noktasındaki karar sınırlarının girdi
verisindeki tek bir özelliğe göre belirlendiği bir karar ağacı tipidir [Swain and
Hauska, 1977]. Tek değişkenli karar ağacında her bir iç düğümde girdi verisindeki
tek bir özelliğin test edilmesi ile verinin iki veya daha fazla alt kümeye ayrılması söz
konusudur. Bununla birlikte bu karar ağacı yapıları her bir testin ayrı ve sınırlı sayıda
çıktı değerine sahip olmasını gerektirmektedir. Bu şekilde karar ağacı sınıflandırması
tekrarlı bir şekilde girdi verisinin bir yaprak düğümüne ulaşıncaya kadar ve
yapraktaki sınıf etiketi gözlemlere atanıncaya kadar bölünme devam eder.
Tek
değişkenli bir karar ağacında karar sınırlarının spesifik değerleri eğitim verisinden
deneysel olarak tahmin edilir. Sürekli verilerin olması durumunda, eğitim verisinden
her bir iç düğüm noktasında X i ’nin veri uzayındaki bir özelliği gösterdiği ve b’nin
X i ’nin gözlenen aralığında bir eşik değeri olduğu X i > b şeklindeki mantıksal
sınama gerçekleştirilir. Farklılıkların maksimum hale getirilmesi veya iniş
düğümlerindeki benzerliğin minimum hale getirilmesi gibi bazı koşullar kullanılarak
eşik değeri b belirlenebilir. Tek değişkenli karar ağacında her bir test tek bir girdi
değişkenine sahip olduğundan, değişkenlere ait eksenlerin birbirine dik olduğu
özellik uzayının ayrılması şeklinde gösterilir (Şekil 3.8).
Şekil 3.8. Tek değişkenli karar ağacının paralel eksenli karar sınırları.
Tek değişkenli karar algoritmalarının temeli Earl B. Hunt tarafından
gerçekleştirilen algoritmaya dayanmaktadır. Bu algoritma en temel karar ağacı
62
yaratma algoritmasıdır. Bu algoritmanın en önemli eksikliği dallanmaya esas olan
özelliklerin
rastgele
seçilmesidir.
Bu
eksikliğin
giderilmesi
ve
yöntemin
geliştirilmesi amacıyla çeşitli algoritmalar geliştirilmiştir. Bunlardan en önemlisi
1987’te Quinlan tarafından geliştirilen ID3 algoritmasıdır. Bu algoritma sayısal
olmayan verilerin sınıflandırılması için geliştirilmiş entropiye dayalı bir algoritmadır.
Hunt algoritmasında dallanma için seçilecek özelliğin rastgele seçilmesinden ziyade
bu yöntemde bilgi kazancı en yüksek olan özellik dikkate alınarak karar ağacı
oluşturulur. Quinlan (1987) bu amaçla entropi kurallarını içeren bilgi teorisi
yaklaşımından yararlanmıştır.
Quinlan (1993) tarafından sayısal özellikli verilerinde karar ağaçları
kullanılarak sınıflandırılması amacıyla yine entropiye dayalı C4.5 algoritması
geliştirilmiştir. C4.5 algoritması ID3 algoritmasını esas alarak, ID3 algoritmasındaki
bazı eksiklikleri ve sorunları gidermek amacıyla geliştirilmiştir. ID3 Ayrıca bu
yöntem bilinmeyen nitelik değerlerine sahip veri setleri için karar ağacının nasıl
oluşturulacağına dair bir yol göstermektedir. Quinlan (1993) C4.5 algoritmasında
bölünme bilgisi kavramından yararlanarak ID3 algoritmasını güncellemiştir. Bu
durumda bilgi kazancı kavramı yerine kazanç oranı kriteri kullanılarak dallanmaya
hangi özellikten başlanacağı belirlenmektedir.
3.2.2.2. Çok Değişkenli Karar Ağaçları
Sınıf yapısı sadece değişkenlerin kombinasyonları ile meydana geldiğinden, tek
değişkenli karar ağaçları veri yapısının ortaya çıkarılmasında zayıf kalmaktadır
[Brodley and Utgoff, 1995]. Doğrusal bir yapının söz konusu olduğu bir problemde
kabul edilebilir ayrılmalar girdi verisindeki özelliklerin doğrusal kombinasyonlarını
içerek şekilde devam ettirilir (Şekil 3.9).
63
Şekil 3.9. Çok değişkenli karar ağacı sınıflandırıcısı için karar sınırları.
Çok değişkenli karar ağaçları her bir düğümdeki ayırma testinin girdi
verisindeki birden fazla özelliğe dayalı olarak yapılması dışında tek değişkenli karar
ağaçlarına benzemektedir. Çok değişkenli karar ağacının her bir iç düğümünde
doğrusal ayırma fonksiyonları seti tahmin edilir ve eğitim verisinden yararlanılarak
her bir düğüm noktasında doğrusal ayırma fonksiyonuna ait katsayılar belirlenir. Her
bir düğümdeki test;
∑ ai X i ≤ c
(3.41)
i
şeklinde gerçekleştirilir. Burada X i veri uzayındaki özellikleri, a doğrusal ayırma
fonksiyonun katsayılar vektörünü ve c eşik değerini göstermektedir. Çok değişkenli
karar ağaçları daha karmaşık bununla beraber daha hassas olduğu belirtilmiştir
[Brodley and Utgoff, 1995]. Çok değişkenliliğin tek değişkenli karar ağacı
algoritmalarına göre sahip olduğu yüksek karmaşıklık çok değişkenlilerin
performansını etkileyen bir dizi faktör ile açıklanır. Bunlardan ilki, iç düğümlerde
ayrılma kuralının belirlenmesinde farklı algoritmaların kullanılabilmesi ve bu
algoritmaların her birinin sınıflandırma probleminde veriye bağlı olarak farklı
derecelerde performansa sahip olabilmesidir. İkinci olarak, çok değişkenli karar
ağacının her bir iç düğümündeki ayrımın birden fazla özellik kullanılarak
yapılmasıdır. Bu durumda çok değişkenli karar ağaçlarının her bir iç düğümünde
özellik seçimini gerçekleştirmek için farklı algoritmalar kullanılması söz konusudur.
Bu algoritmalar ardışık olarak ileriye ve ardışık olarak geriye elemeleri içerir. Bu
64
algoritmaların global bir özellik seçiminden ziyade lokal bir özellik seçimi
gerçekleştirmesi çok değişkenli karar ağacı algoritmalarındaki bir başka problemdir.
Çok değişkenli karar ağaçları oluşturulmasında kullanılan en önemli yöntem
Breiman et al. (1984) tarafından geliştirilen sınıflandırma ve regresyon ağaçlarıdır
(CART). Bu yöntem ile karar ağacı oluşturulmasında, her bir karar düğümünden
itibaren ağacın iki alt dala ayrılması yani ikili dallanmalar söz konusudur. Başka bir
ifadeyle bir düğümde seçme işlemi yapıldığında, düğümlerden sadece iki dal
ayrılabilir [Özkan, 2008]. CART algoritmasında bölünme işleminde kullanılan en
önemli iki algoritma Gini ve Twoing algoritmasıdır.
3.2.2.3. Melez Karar Ağacı Sınıflandırıcısı
Melez karar ağacı, geniş ağacın farklı alt ağaçlarında farklı sınıflandırma
algoritmalarının kullanıldığı bir karar ağacıdır. Bu algoritmalar doğrusal ayırma
fonksiyonu, k en yakın komşuluk veya diğer sınıflandırma algoritmaları olabilir.
Melez
karar
sınıflandırma
yaklaşımının
uygulanmasındaki
temel
neden
sınıflandırmadaki performanslarına ilişkin üstünlükleridir [Friedl and Brodley, 1997].
Tekil melez ağacı yapısında farklı sınıflandırma algoritmaları kullanılırsa, verinin
farklı alt kümeleri için farklı sınıflandırıcıların kullanılması şeklinde veri seti
ayrılabilir. Şekil 3.10’da doğrusal ayırma fonksiyonu (DAF), k en yakın komşuluk
(K-EK) ve tek değişkenli karar ağacı (TDK) gibi üç farklı sınıflandırma
algoritmasının kullanıldığı melez sınıflandırma algoritmasına ilişkin bir örnek
görülmektedir.
DAF
K-EK
Sınıf A
Sınıf B
TDK
Sınıf A
Sınıf C
Şekil 3.10. Melez karar ağacı sınıflandırıcısına ait örnek bir yapı.
65
3.2.3. Karar Ağaçlarının Budanması
Karar ağacı sınıflandırıcısı eğitim verisini sadece tek bir sınıf içeren alt
kümelere böler. Bu işlem sonucunda çok geniş ve karmaşık bir ağaç ortaya çıkar.
Birçok durumda bir karar ağacının tüm yapraklarının tek bir sınıf verisini içerecek
şekilde ayarlanması eğitim verisindeki kirlilik nedeniyle overfit problemini ortaya
çıkarabilir. Bu problemin çözümünde sınıflandırılacak veri eğitim seti dışarısında
kaldığında oluşan sınıflandırma hatalarını azaltmak için orijinal ağaç budanabilir.
Bir karar ağacı tüm ağaç yapısındaki yaprakların silinmesi ile basitleştirilmez.
Bunun yerine karar ağacının sınıflandırma doğruluğunu etkilemeyen veya katkısı
olmayan kısımlarının çıkarılması işlemi gerçekleştirilir. Böylece daha az karmaşık ve
daha anlaşılabilir bir ağaç elde edilir. Daha basit bir ağaç oluşturulması için karar
ağacı sınıflandırıcısının düzenlenmesinde kullanılan iki yöntem vardır [Breiman et
al., 1984]. Bu yöntemler;
1. Eğitim veri setinin daha ileriye bölünüp bölünmemesine karar vermek;
2. Ağacın bazı kısımlarının geriye dönük bir şekilde kaldırılması için
tekrarlı bir şekilde bölünme ile yapının oluşturulması.
İlk yaklaşım durdurma ya da ön budama olarak adlandırılır. Bu yöntemin en
önemli
avantajı
sadeleştirilmiş
ağaç
yapısında
kullanılmayan
bir
yapının
birleştirilmesinde zaman harcamamasıdır. Bu yöntem, veri setinin ayrılması için en
iyi yolu araştırır ve bilgi kazancı ya da hata azalımı gibi faktörler ile bir noktadan
daha ileriye ayrım yapılıp yapılmayacağı değerlendirilir. Bu değerlendirme belirli bir
eşik değerinin altına düştüğünde bölünme kabul edilmez ve veri için en uygun
yaprak olduğuna karar verilir. Bu yaklaşımın dezavantajı ise doğru durdurma
kuralının belirlenmesidir [Pal, 2002]. Eşik değerinin çok yüksek seçilmesi
durumunda ağacın daha ileriye bölünmesine izin verilmediğinden daha iyi sonuçlar
verecek alt bölünmeler yapılmadan işlem sonlanacaktır.
İkinci yaklaşımda, ağacın tüm yapraklar tek bir sınıfa ait veriyi içerdiğinde
ulaşılan en sona kadar büyümesine izin verilir. Ağaç bundan sonra budanır. Bu
66
yöntem ağacın sonradan çıkarılan kısımlarının oluşturulmasında çok fazla hesaplama
yapılmasını gerektirir. Bir karar ağacının budanması eğitim verisinde birçok
sınıflandırılmamış veri oluşmasına neden olacaktır. Bu nedenle budanan karar ağacı
yapraklarının tek bir sınıfa ait eğitim verisini içermesine gerek yoktur. Bir sınıfın bir
yaprakla ilişkilendirmesi yerine her bir sınıf için, o sınıfa ait olan yapraktaki eğitim
verisine ait olan olasılığı belirten sınıf dağılımı olacaktır
Karar ağaçları bir veya daha fazla alt ağacın kaldırılması ile sadeleştirilir ve bu
alt ağaçların yerine yapraklar ile ifade edilir. Bu işlem ağacın en altından başlar ve
yapraksız her bir alt ağaç incelenir. Bu işleme aşağıdan yukarıya yaklaşımı denir.
Alternatif olarak işlem kökten başlar dallar incelenerek ağacın yapraklarına doğru
hareket edilir. Bu yaklaşıma ise yukarıdan aşağıya yaklaşımı olarak adlandırılır. Eğer
tek bir yaprağı olan alt ağacın veya bu ağacın en çok kullanılan dalının değiştirilmesi
beklenen hata oranının daha düşük oluşmasına neden olacaksa ağaç budanır. Alt
ağaçlardaki hata oranı azaldığından tüm ağaç için hata oranı azalacaktır. Bu işlem
sonucunda kabul edilebilir bir budama ile beklenen hata oranının minimum hale
getirildiği bir ağaç elde edilir. Burada dikkat edilmesi gereken husus, budamanın her
zaman eğitim verisi üzerindeki hatanın artmasına neden olacağıdır. Bu nedenle hata
oranlarının tahmin edilmesinde uygun bir tekniğe ihtiyaç duyulmaktadır. Bir karar
ağacının budanmasında kullanılan teknikler aşağıda sıralanmıştır:
1. Karmaşık değerli budama
2. Hata azaltmalı budama
3. Karamsar budama
4. Hata tabanlı budama
5. Kritik değerli budama
Karmaşık değerli budama yönteminde, bir ağacın tahmin edilen hata oranı
ağacın eğitim verisi üzerindeki hatası ve ağacın karmaşıklığının ağırlıklı toplamı
olarak modellenir. Burada en uygun ağırlıkların belirlenmesi için ayrı veri setleri
kullanılır.
67
Hata azaltılan budama yönteminde ise, ağacın test veri setini ayırdığı
kısımlarının ve ağacın tamamının hata oranını belirler. Bu metotta orijinal ağaç tüm
test veri setini sınıflandırır. T’nin S ile adlandırılan her bir yapraksız alt ağacı için,
test veri seti üzerinde hatalı sınıflandırma sonucu oluşan değişiklikler tespit edilen en
iyi olasılığa sahip yaprakla yenilenir. Eğer yeni oluşan ağaç eşit veya daha az hataya
sahipse ve S aynı özelliğe sahip alt ağaçlar içermiyorsa, S alt ağacı bir yaprakla
yinelenir. Bu işlem test seti üzerindeki hatalar artmaya başlayıncaya kadar tekrar
edilir.
Diğer bir karar ağacı budama yöntemi olan karamsar budama yönteminde,
eğitim alt kümelerinin birleşimini ve boyutunu göstermek için alt ağaçların beklenen
hata oranlarını arttırır. Daha sonra tahmin edilen hata oranı bir yaprağınkinden
önemli derecede küçük olmayan her bir alt ağaç yerine koyulur. Bu yöntem Quinlan
(1987) tarafından ortaya konulmuştur. Bu yöntem ayrı bir test veri setine olan
zorunluluktan kaçınmayı amaçlamaktadır. Hatalı sınıflandırma oranının daha
gerçekçi bir şekilde elde edilmesi için binom dağılımı için süreklilik düzeltmesi
kullanılır.
Hata tabanlı budama yöntemi karamsar budama yönteminin geliştirilmiş bir
halidir. Hata tabanlı budama algoritması beklenen hata oranının daha karamsar
tahmini esasına dayanır. Karamsar budamada tanımlanan yöntemin aksine bu metot
ağacın büyüyen düğümlerini yukarıdan aşağıya denetler.
Kritik
değerli
budama
yöntemi,
ağaç
oluşumu
aşamasında
yapılan
sınıflandırmalardan bir düğümün etkinliğinin veya öneminin tahmin edilmesi esasına
dayanmaktadır. Orijinal ağaç oluşumunda bölünme ölçülerinin iyiliği bir düğümdeki
özniteliği belirler. Bu ölçü değerleri, bir düğümde seçilen özniteliğin sınıflar
arasındaki verileri bölmede ne kadar iyi olduğunu yansıtmaktadır. Bu budama
yöntemi bir kritik değer belirler ve kritik değerlere ulaşamayan düğümleri budar. Bu
işleme dallar arasında bu kritik değere ulaşan bir dal bulunana kadar devam edilir.
Burada dikkat edilmesi gereken husus yüksek seçilen kritik değerin budama
derecesinin yüksek olacağı ve sonuçta daha küçük boyutlu bir ağaç yapısı elde
edileceğidir [Mingers, 1989].
68
3.2.4. Karar Ağaçlarının İyileştirilmesinde Kullanılan
Birleştirme Yöntemleri
Son yıllarda uzaktan algılama literatüründe birçok çalışmada birden çok
sınıflandırıcının birleştirilmesi ile tek bir sınıflandırıcının elde edilmesi düşüncesi
ifade edilmiştir. Sınıflandırıcıların birleştirilmesi, yeniden örneklenen eğitim setleri
ile sınıflandırıcıların ayrı ayrı eğitilmesi ve sonuçta ortaya çıkan tahminler ile
sınıflandırma işleminin gerçekleştirilmesi işlemlerini içerir. Birleştirme sonucu elde
edilen sınıflandırıcı ile yapılan sınıflandırma doğruluğunun genel olarak her bir
sınıflandırıcının tekil olarak kullanılmasından daha iyi olduğu ifade edilmektedir
[Opitz and Maclin, 1999; Pal and Mather, 2003]. Teorik ve deneysel gözlemlerle
yapılan araştırmalar birleştirme yöntemi ile birleştirmede kullanılan sınıflandırma
yönteminin doğruluğunda artış olmasının yanında sınıflandırıcının hatalarında da
azalma olduğunu göstermektedir [Hansen and Salamon, 1990; Krogh and Vedelsby,
1995; Hashem, 1997; Opitz and Shavlik, 1996]. Bununla birlikte bazı makalelerde
birleştirilmiş
yapay
sinir
ağlarının
kullanımı
ve
farklı
sınıflandırıcıların
birleştirilmesi ile elde edilen sonuçlardan bu yöntemin sınıflandırma doğruluğunu
arttırdığı ifade edilmiştir [Giacinto and Roli,1997, Roli et al.,1997]. Sınıflandırma
doğruluğu tüm öğrenme uygulamaları için öncelikli olarak önemli olduğundan bu
araştırmaların
birçoğu
sınıflandırma
doğruluğunun
arttırılması
üzerine
yoğunlaşmıştır. Hızlandırma ve torbalama yöntemleri birleştirme işleminde
kullanılan en popüler yöntemlerdir [Freund and Schapire, 1996; Schapire, 1999;
Breiman, 1996]. Her iki yöntemde birleştirme işleminde kullanılacak her bir
sınıflandırıcı için farklı eğitim setlerinin oluşturulmasında yeniden örnekleme
tekniklerini kullanmaktadır. Bu iki yöntemin kullanımı arasındaki en temel fark
hızlandırma yönteminin sürekli olarak tekrarlı bir şekilde birden çok sınıflandırıcı
oluşturmasıdır. Birleştirme işleminde kullanılan diğer bir yöntem çoklu sınıflandırma
yöntemidir. Çoklu hızlandırma yöntemi Adaboost yöntemi ile torbalama yönteminin
birleşimi gibi düşünülebilir [Webb, 2000].
69
3.2.4.1. Hızlandırma Yöntemi
Hızlandırma yönteminin esası bir dizi sınıflandırıcı serisi oluşturulmasına
dayanmaktadır [Freund and Schapire, 1996; Schapire, 1990]. Serinin üyesi olan her
bir sınıflandırıcı için kullanılan eğitim seti, serideki bir önceki sınıflandırıcı veya
sınıflandırıcıların performansına göre belirlenir. Bu yöntemde serideki bir önceki
sınıflandırıcı tarafından hatalı tahmin edilen örnekler bir sonraki sınıflandırıcı için
oluşturulacak eğitim setinde doğru tahmin edilen örneklere göre daha fazla tekrar
edilirler. Bu şekilde hızlandırma yöntemi mevcut birleştirme sonucu elde edilen zayıf
performansa göre örnekleri daha iyi tahmin edebilen yeni bir sınıflandırıcı
oluşturmaya çalışır. Hızlandırma herhangi bir öğrenme algoritmasının performansını
arttıran bir yöntemdir. Bu yöntem herhangi bir zayıf öğrenme algoritmasının
hatasının
azaltılması
için
kullanılabilir.
Şekil
3.11’de
birleştirilmiş
bir
sınıflandırıcının çalışma prensibi gösterilmiştir.
Hızlandırma yöntemi genel olarak her bir gözleme bir ağırlık değeri atanması
esasına dayanmaktadır. Bu ağırlık değeri arttıkça daha fazla gözlem sınıflandırıcıdan
etkilenir. Her bir denemede ağırlık vektörleri hatalı sınıflandırılmış gözlemlerin
ağırlıklarının artması sonucu ile sınıflandırıcı ile ilgili olan performansı yansıtacak
şekilde ayarlanır. Sonuç sınıflandırıcı bir oylama ile her bir iterasyon sonucu
oluşturulan sınıflandırıcıların birleşimidir.
Girdi
Sınıflandırıcı–1
Sınıflandırıcı–2
Sınıflandırıcı–3
Birleşmiş Sınıflandırıcı Çıktıları
Birleştirilmiş Sonuç
Şekil 3.11. Karar ağacı sınıflandırıcısının birleşimi olan sınıflandırıcı.
70
Literatürde hızlandırma algoritması ile ilgili çeşitli yöntemler kullanılmaktadır.
Bu algoritmalardan en çok kullanılanı Adaboost algoritmasıdır [Freund and Schapire,
1996]. Bu algoritma birleşmeye esas olan sınıflandırıcıların ağırlıklı örnekleri
kullanabileceğini kabul etmektedir. Adaboost algoritması örneklerin seçilmesinde iki
yaklaşım kullanır. Bunlardan birincisi örneklerin olasılıklarına dayalı olarak eğitim
setinin oluşturulmasıdır. İkincisi ise, basit bir biçimde tüm örnekleri ve ağırlıklarının
kullanılmasıdır. Bu yöntemin ana düşüncesi her bir örneğin hatasının o örneğin
olasılığı ile belirleneceğidir. Örnek olarak yüksek olasılığa sahip örneklerin hataya
daha fazla etki etmesi gösterilebilir. İkinci yaklaşım eğitim setindeki her bir örneğin
birleştirilmesi gibi bir avantaja sahiptir.
Adaboost yönteminde başlangıçta her bir örneğin olasılıkları 1 N olarak
ayarlanır. Daha sonra eğitilen her bir sınıflandırıcının ardından yöntem bu olasılıkları
tekrar hesaplar. Adaboost yönteminde ε k ’nın son eğitilen sınıflandırıcının ( C K )
kullanımı sonucunda hatalı sınıflandırılan örneklere ait olasılıkların toplamı olduğu
düşünülsün. Bir sonraki deneme için kullanılacak bu olasılıklar, C K ’nın hatalı
sınıflandırılmış örneklerinin olasılığı ile β K = (1 − ε K ) ε K şeklinde hesaplanan bir
katsayı ile çarpımından elde edilir. Bu şekilde tüm olasılıklar yeniden normalleştirilir
ve toplamları 1 olur. Adaboost yöntemi, C K ’nın log( β K ) şeklinde ağırlığa sahip
olduğu ağırlıklı oylama yöntemi kullanarak
C1 ,..., C K
şeklinde gösterilen
sınıflandırıcıları birleştirir. Bu ağırlıklar Adaboost yönteminin sınıflandırıcıların
tahminlerini hesaplamasına imkan sağlar. Tablo 3.2’de hızlandırma algoritmasında
kullanılacak eğitim veri setlerini gösteren bir örnek verilmiştir. Tabloda sekiz
örnekten oluşan orijinal eğitim seti ve ağırlıklara göre yeniden örneklenen eğitim veri
setleri gösterilmiştir. Yeniden örneklemede orijinal veri setindeki 1 ile ifade edilen
örneğin bir önceki sınıflandırıcı tarafından hatalı tahmin edildiği göz önüne alınsın.
Bu durumda, Adaboost yöntemi bir sonraki sınıflandırıcı için oluşturulacak eğitim
setinde bu örneğin birden fazla tekrarlayarak bu örneğin bir sonraki sınıflandırıcı
tarafından doğru tahmin edilmesini amaçlamaktadır [Opitz and Maclin, 1999].
71
Tablo 3.2. Adaboost yönteminde kullanılan eğitim verilerinin oluşturulması.
Eğitim Seti (Orijinal)
1, 2, 3, 4, 5, 6, 7, 8
Eğitim seti–1 (yeniden örneklenmiş) 2, 7, 8, 3, 7, 6, 3, 1
Eğitim seti–2 (yeniden örneklenmiş) 1, 4, 5, 4, 1, 5, 6, 4
Eğitim seti–3 (yeniden örneklenmiş) 7, 1, 5, 8, 1, 8, 1, 4
Eğitim seti–4 (yeniden örneklenmiş) 1, 1, 6, 1, 1, 3, 1, 5
Eğitimden sonra, her bir sınıflandırıcının ağırlıklı oyu kullanılarak birleşime ait
tahminler yapılır. Her bir sınıflandırıcıya ait ağırlıklar, sınıflandırıcıların eğitiminde
kullanılan ağırlıklı örneklerden elde edilen doğruluğa göre hesaplanır. Adaboost
yöntemi literatürde birçok araştırmacı tarafından kullanılmış ve etkinliği test edilmiş
etkili bir birleştirme yöntemidir [Bauer and Kohavi, 1999; Dietterrich, 2000;
Quinlan, 1996; Maclin and Opitz, 1997].
Yöntemin popüler bir hızlandırma yöntemi olmasına karşın bir takım olumsuz
yönleri vardır. Hızlandırma yöntemi özellikle yetersiz veri olması durumunda iyi bir
performans sağlayamamaktadır [Schapire, 1999]. Bununla birlikte hızlandırma
algoritması sınıflandırılacak veride gürültü miktarının fazla olması (örneğin eğitim
verisinde yanlış sınıf etiketlerinin olması) durumunda da iyi bir performans
sergilememektedir [Dietterich, 2000; Melville et al., 2004].
3.2.4.2. Torbalama Yöntemi
Torbalama yöntemi, birleştirme için eğitim setinin rastgele bir şekilde yeniden
oluşturulması ile ayrı ayrı her bir sınıflandırıcının eğitimini gerçekleştiren ön
yüklemeli bir birleştirme metodudur [Breiman, 1996; Efron and Tibshirani, 1993].
Torbalama yönteminde, hızlandırma yönteminde olduğu gibi eğitim setinin yeniden
örneklenmesinde bir önceki sınıflandırıcının performansı dikkate alınmamaktadır. Bu
yöntemde her bir sınıflandırıcının kullandığı eğitim seti rastgele örnekleme ile
oluşturulur. Orijinal eğitim setinin boyutunun N olduğu düşünülürse yeni
72
oluşturulacak eğitim setinde N boyutlu olacaktır. Buna karşın yeni eğitim seti
içerisinde orijinal veri setindeki birçok örnek tekrar edilirken, orijinal veri setindeki
bazı örnekler ise hiç bulunmayacaktır. Başka bir ifadeyle, torbalama yönteminde
eğitim seti tekrarlı bir şekilde yeniden örneklenirken oluşturulacak eğitim setinde
bazı örnekler tekrarlanırken bazıları ise hiç yer alamayacaktır. Rastgele örnekleme
yöntemiyle oluşturulan farklı eğitim verileri ile birleştirme işlemindeki bir
sınıflandırıcının eğitimi tamamlanır. Farklı değerlendirmeler sonucu birleştirme
işlemine katılan tüm sınıflandırıcılar birleştirerek sonuç sınıflandırıcıyı oluşturur
[Breiman,1996]. Herhangi bir örneğin sınıflandırılmasında her bir sınıflandırıcı bu
örneğin hangi sınıfa ait olduğu ile ilgili bir oy kaydeder. Sonuç olarak örneğe ait
öznitelik bilgisi ya da sınıf etiketi en çok oy alan sınıf olarak belirlenir [Pal, 2002].
Tablo
3.3’de
torbalama
yönteminde
kullanılan
eğitim
setlerinin
nasıl
oluşturulmasında ilişkin basit bir örnek gösterilmektedir.
Tablo 3.3. Torbalama yönteminde kullanılan eğitim verilerinin oluşturulması.
Eğitim Seti (Orijinal)
1, 2, 3, 4, 5, 6, 7, 8
Eğitim seti–1 (yeniden örneklenmiş) 2, 7, 8, 3, 7, 6, 3, 1
Eğitim seti–2 (yeniden örneklenmiş) 7, 8, 5, 6, 4, 2, 7, 1
Eğitim seti–3 (yeniden örneklenmiş) 3, 6, 2, 7, 5, 6, 2, 2
Eğitim seti–4 (yeniden örneklenmiş) 4, 5, 1, 4, 6, 4, 3, 8
Tabloda torbala yönteminde kullanılmak üzere oluşturulan 1. eğitim setinde 3
ve 7 örneklerinin iki kez tekrar edildiği, bunun yanında 4 ve 5 örneklerinin ise bu
eğitim setinde olmadığı görülmektedir. Sonuçta eğitim seti–1 ile eğitimi tamamlanan
bir sınıflandırıcının bir test seti ile genelleştirme kabiliyeti test edildiğinde ortaya
çıkan hata miktarı sınıflandırıcının orijinal veri seti ile sınıflandırılması sonucu
ortaya çıkan hatadan daha yüksek olacaktır. Bu durum örnekteki diğer üç eğitim seti
kullanılarak eğitilecek üç sınıflandırıcı içinde geçerli olacaktır. Buna karşın bu dört
sınıflandırıcının birleşimi ile test seti üzerindeki hata miktarı tek bir sınıflandırıcının
kullanılması sonucu ortaya çıkan hata miktarından daha az olacaktır. Breiman (1996)
eğitim setindeki küçük değişimlerin sonuç tahminlerinde büyük değişiklere yol açtığı
değişken öğrenme algoritmaları için bu yönteminin etkili olduğunu ifade etmiştir.
73
Birleşme
işlemindeki
her
bir
sınıflandırıcı
aynı
örnek
kümesiyle
işlem
yapmadığından, her biri birbirinden farklı sonuç üretecektir. Birleşmeyi oluşturan her
bir sınıflandırıcının tahminlerinin oylanması ile torbalama algoritması temel
sınıflandırıcının varyansı nedeniyle oluşan hatayı azaltmaya çalışır.
3.2.4.3. Çoklu Hızlandırma Yöntemi
Çoklu hızlandırma yöntemi sınıflandırıcıların birleştirilmesinde başarılı
sonuçlar veren Adaboost tekniğinin genişletilmiş bir halidir. Adaboost ve torbalama
yöntemleri farklı etkilere sahip farklı mekanizmalar ile çalışıyormuş gibi görünseler
de bu iki yöntemin birleştirilmesinin ile daha yararlı olduğu düşünülebilir. Çalışma
mekanizmaları farklı olduğu için, her iki yöntemin ayrı ayrı kullanılmasından ziyade
iki yöntemin birleştirilmesi daha iyi sonuçlar üretebilecektir [Webb, 2000]. Adaboost
yöntemi eğilim ve varyansı azaltırken, torbalama yöntemi temel olarak varyansı
azaltmaktadır. Bunun yanında Bauer and Kohavi (1999), varyansın azaltılmasında
torbalama yönteminin Adaboost yöntemine göre daha etkili olduğunu ifade
etmişlerdir. Web (2000), bu iki yöntemin birleşmesi ile Adaboost yönteminin eğilim
azaltmasına torbalama yönteminin varyans azaltmasının eklenmesi ile devam
edebileceğini ifade etmiştir. Özetlenecek olursa çoklu hızlandırma yöntemi,
Adaboost yönteminin torbalama yönteminin yüksek varyans azaltmasındaki
etkinliğini kullanılması ile yeniden düzenlenmesi olarak ifade edilebilir [Web, 2000].
C4.5
algoritmasının
temel
sınıflandırma
algoritması
olarak
kullanıldığı
sınıflandırıcıların birleştirilmesi işleminde çoklu hızlandırma yöntemi, Adaboost
veya torbalama yöntemlerinin ayrı ayrı kullanılması sonucunda ortaya çıkan hata
oranına göre daha düşük bir hataya sahiptir.
3.2.4.4. Rastgele Orman Yöntemi
Rastgele orman yöntemi girdi verilerinin oluşturduğu bir vektörden bağımsız
olarak örneklenen rastgele bir vektör kullanarak her bir sınıflandırıcının
oluşturulduğu karar ağacı sınıflandırıcılarının birleşimini içeren bir yöntemdir. Bu
birleşimde her bir ağaç modeli girdi vektörünü sınıflandırmak için en popüler sınıfa
bir oy verirler [Breiman, 2001]. Rastgele orman sınıflandırıcısı rastgele seçilen
74
örnekleri veya ağacın büyümesi için her bir düğümdeki özelliklerin birleşimini içerir.
Torbalama yönteminde eğitim veri seti N sayıdaki örneğin rastgele tekrarlanması ile
oluşturulmaktadır [Breiman, 1996]. Öznitelik bilgisi olmayan herhangi bir örnek
(piksel), tüm ağaç tahminlerinde en fazla oy alan sınıfa atanması suretiyle
sınıflandırılır.
Bir
karar
ağacının
oluşturulmasında
dallanma
kriterlerinin
belirlenmesi ve uygun bir ağaç budama yönteminin seçilmesi söz konusudur. Karar
ağacı oluşturulması için dallanma kriterlerinin belirlenmesinde kullanılan birçok
yöntem vardır. Bunlar arasında en çok kullanılan yöntemler bilgi kazanç oranı kriteri
ve Gini indeksidir [Quinlan, 1993; Breiman et al., 1984]. Rastgele orman
sınıflandırıcısı karar ağacı oluşumunda dallanma kriterlerinin belirlenmesinde başka
bir ifadeyle dallanma için özniteliklerin seçiminde Gini indeksi yöntemini kullanır.
Bu
yöntemde
sınıflara
ait
öz
niteliklerin
zayıflılığını
ölçülmesi
esasına
dayanmaktadır [Pal, 2005b].
Rastgele orman yöntemi karar ağaçları için torbalama yöntemi ile rastgele
özellik seçiminin birleştirilmesi ile elde edilen bir sınıflandırma algoritması olarak da
ifade edilebilir [Breiman, 2001]. Bu yöntemde grubun her bir üyesi torbalama
yönteminde olduğu gibi ön yinelemeli kopyalama ile eğitilir. Daha sonra karar
ağaçları rastgele seçilen özelliklerden (F) her bir düğümdeki dallanma için seçilen
özellik ile ağaç yapısı büyür. Rastgele seçilen özellikler kümesi F,
[log 2 (k + 1)]
şeklinde ifade edilebilir [Breiman, 2001]. Bu ifadede k tüm özelliklerin sayısının
göstermektedir. Bu şekilde oluşturulacak rastgele ağaçta herhangi bir budama
algoritması kullanılmaz [Melville and Mooney, 2004]. Birçok sınıflandırma
yönteminde kullanıcı tarafından belirlenen bazı parametreler söz konusudur. Rastgele
orman sınıflandırıcısı için kullanıcılar tarafından belirlenen bu parametreler ağaç
yapısının oluşturulması için her bir düğümde kullanılacak örneklerin sayısı ve
oluşturulacak ağaç sayısıdır. Her bir düğümde en iyi dallanma için sadece seçilen
özellikler araştırılır. Bu nedenle rastgele orman sınıflandırıcısı kullanıcı tarafından
belirlenen ve oluşturulacak ağaç sayısını ifade N ağaçtan oluşacaktır. Yeni bir veri
setinin sınıflandırılmasında, veri seti bu N sayıda ağacın her birinden geçirilir.
Rastgele orman sınıflandırıcısı bu N sayıda ağaçtan elde edilen N sayıda oy arasından
en fazla oya sahip olan sınıfı seçer ve bu şekilde yeni veri setine ait öznitelik
değerlerini belirler [Pal, 2005b; Dietterich, 2002].
75
3.2.4.5. DECORATE Algoritması
Decorate algoritmasında, sınıflandırıcıların birleştirilmesi işlemi iteratif olarak
gerçekleştirilir. İlk önce sınıflandırıcının öğrenme işlemi tamamlanır ve sonra bu
sınıflandırıcı birleştirmeye dahil edilir. Her bir ardışık iterasyonda sınıflandırıcılar bir
takım yapay verilerle birleştirilmiş orijinal eğitim verisi ile eğitilirler. Her bir
iterasyonda yapay eğitim örnekleri veri dağılımından elde edilir. Yapay olarak elde
edilen eğitim örneklerine ait öznitelik bilgileri ya da etiketler birleştirilme
tahminlerinden farklı maksimumları bulmak için oluşturulur [Melville and Mooney,
2004].
3.3. Yapay Sinir Ağları
Yapay
Sinir
Ağları
(YSA)
geleneksel
istatistiksel
sınıflandırıcılarla
karşılaştırıldığında karmaşık yapıya sahip ve gürültü miktarı fazla olan verilerin
tanımlanmasında ve veriler arasındaki doğrusal olmayan ilişkilerin belirlenmesinde
teorik olarak daha gelişmiş ve daha güçlü bir sınıflandırma yöntemidir [Kavzoglu,
2001; Tseng et al., 2008]. YSA, eğitim verileri aracılıyla problemi öğrenme ve daha
sonra yeni bir verinin tanımlanmasını yapabilme özelliğine sahip olduğundan
sezgisel algoritma grubunda yer alır. YSA’nın esas amacı insan beyninin üstün
karakteristiklerini simule ederek bilgisayarın tanıma işlemindeki performansını
arttırmaktır. İnsan beyninin biyolojik teorisine dayalı olan YSA insan beyninin
fonksiyonelliğini ve karar verme işlemini simule eden modellerdir. YSA coğrafya,
finans, imalat ve ses tanımlama gibi farklı bir çok alanda kullanılan bir yöntemdir
[Hewitson and Crane, 1994; Dicson et al., 1997; Giles et al., 1997; Altun and Curtis,
1998]. Yapay sinir ağlarının önemli avantajları aşağıda maddeler halinde verilmiştir
[Kavzoglu, 2001]:
•
Parametrik olmayan bir yapıdadırlar,
•
Keyfi karar sınır yeteneklerine sahiptirler,
•
Farklı veri türlerini ve girdi yapılarını birleştirilmesi kolaydır,
•
Daha iyi genelleştirme yapabilmektedirler,
•
Gürültü için toleranslıdırlar.
76
Bu avantajlar arasında beklide en önemli olanı YSA’nın parametrik olmayan
yani verinin dağılımı ile ilgili herhangi bir ön bilgiye ihtiyaç duymamalarıdır. YSA
eğitim verisinin karakteristik özelliklerini iteratif bir şekilde öğrendiklerinden
veriden bağımsız teknikler olarak da ifade edilebilirler. YSA ağlarının geleneksel
istatistiksel sınıflandırıcılarla karşılaştırıldığında az sayıda eğitim seti kullanarak
daha iyi sonuçlar verebilmektedirler [Blamire, 1994; Foody, 1995; Kavzoglu, 2009].
Yapay sinir ağları geleneksel istatistiksel sınıflandırıcılara göre daha güçlü bir
sınıflandırma yöntemi olmasına rağmen bir takım olumsuzluklar vardır. Bunlar;
kısmen daha fazla eğitim zamanı gerektirmesi, en etkili ağ yapısının belirlenmesi ve
sınıflandırma doğruluğunun parametre değişimlerine karşı duyarlı olması olarak
ifade edilebilir [Kavzoglu, 2001]. Bunlar arasında ağ yapısı eğitim zamanını ve
sınıflandırma doğruluğunu direkt olarak etkilemektedir [Dixon and Candade, 2008].
Günümüze kadar birçok yapay sinir ağı modeli ve öğrenme algoritması
geliştirilmiş ve çeşitli derecelerde başarılar elde edilmiştir. Yapay ağ modellerini iki
kritere göre kategorize etmek mümkündür. Bunlardan ilki modelin kontrollü veya
kontrolsüz öğrenme stratejilerinden hangisini uyguladığıdır. Kontrolsüz yapay sinir
ağı modellerine örnek olarak self-organising map (SOM), Hopfield ağları ve
Grossberg ağları gösterilebilir. Perseptron, çok katmanlı perseptron (ÇKP), radyal
tabanlı ağlar (RBF) gibi modeller ise kontrollü öğrenme prensibine göre geliştirilmiş
YSA modellerindendir [Kavzoglu, 2001]. İkinci kriter ise ağ modeli ile ilgili
öğrenme yönteminin yönlülüğü ile ilgilidir. Eğer bilgi akışı girdi katmanından çıktı
katmanına doğru ilerliyorsa bu öğrenme yöntemi ileri beslemeli ağ modeli olarak
adlandırılır. Bu durumun tersi olan durumda yani bilgi akışının, çıktı katmanından
girdi katmanına doğru ilerlediği öğrenme yöntemi geri beslemeli ağ modeli olarak
ifade edilir. Literatürde çok katmanlı perseptron (ÇKP) modeli uygulamada en
yaygın olarak kullanılan yapay sinir ağı modellerindendir. Çok katmanlı perseptron
ağ modelleri eğitim sırasında bilgi akışının girdi katmanından çıkış katmanına doğru
ilerlediği ileri beslemeli ağ yapılarındandır.
77
3.3.1. Biyolojik ve Yapay Sinir Ağlarının Çalışma Prensibi
Yapay sinir ağları insan beyninin yapısı ve çalışma prensibinden yola çıkılarak
geliştirilmiş sistemlerdir. İnsan beyni ve çalışma şekli karmaşık yapıya sahip
olduğundan tam olarak açıklanması zor bir konudur. Ancak genel yapısı ve temel
çalışma prensibinin açıklanması YSA’nın anlaşılması açısından önemlidir. İnsan
beyni, sinir sisteminin merkezini oluşturan en temel elemandır. İnsan beyni sürekli
olarak vücudun çeşitli organlarından gelen sinyalleri alır, bu sinyalleri işler ve işlem
sonucunda alınan kararları vücudun ilgili noktalarına gönderir. Beyin, sinir
sisteminin merkezidir ve beynin temel yapı taşları sinir hücreleri yani biyolojik
nöronlardır. Beyin, işlevini birbirleri arasında yoğun bağlantılar bulunan nöronlar
yerine getirir. Bir biyolojik nöron, temel olarak, diğer kaynaklardan girdiler alır,
belirli bir şekilde bunları birleştirir, sonuç üzerinde bir işlem (genelde doğrusal
olmayan) uygular ve nihai sonucu üretir. Şekil 3.12’de biyolojik nöronun genel
yapısı ve bu yapıyı oluşturan dört temel bileşen gösterilmiştir. Bu bileşenler dendrit,
çekirdek, akson ve sinaps olarak adlandırılmaktadırlar. Dendritler, çekirdeğin saça
benzeyen uzantılarıdır ve girdi kanalları olarak işlev görürler. Sinapslar, nöronlar
arası etkileşimi sağlarlar. Bu girdi kanalları diğer nöronların sinapsları aracılığıyla
girdilerini alırlar. Daha sonra çekirdek, gelen bu sinyalleri zaman içinde işler.
Çekirdek, bu işlenmiş değeri bir çıktıya dönüştürdükten sonra bu çıktıyı akson ve
sinapslar aracılığıyla diğer nöronlara gönderir.
Dendrit
Akson
Çekirdek
Sinapslar
Şekil 3.12. Biyolojik nöronun genel yapısı ve bileşenleri.
78
Yapay sinir ağları, insan beyninin yapısı göz önüne alınarak geliştirilen
basitleştirilmiş sistemler olduğundan, bu sistemlerin temel elemanları da nöronlardır.
Bu yapay nöronlar, aralarındaki bağlantılar oluşturularak ve tabakalar halinde
gruplandırılarak yapay sinir ağlarını oluşturulmaktadır. Yapay sinir ağlarının temel
işlem elemanı olan yapay nöronlar, biyolojik nöronların dört temel bileşenine benzer
yapıda dört fonksiyona sahiptir. Şekil 3.13’te yapay nöronun genel yapısı ve bu
yapıda işlevselliği olan dört temel fonksiyon görülmektedir. Bunlardan ilki şekilde
xi , i = 0,1,…,n şeklinde ifade edilen gelen sinyaller ya da girdi değerleridir. Bu girdi
değerlerin her biri wi ile gösterilen bir bağlantı ağırlığıyla çarpılmaktadır. En basit
yapay sinir ağı yapısında, bu çarpımlar toplanır ve belirlenen bir aktivasyon
(uygulama) fonksiyonuna gönderilerek sonuç üretilir. Elde edilen sonuç çıktı
katmanına gönderilir. Bu yapay nöron yapısında değişik toplama ve aktivasyon
fonksiyonları kullanılarak farklı ağ yapıları oluşturulabilir.
x0
w0
x1
w1
x2
w2
Toplam fonksiyonu
Σ
ϕ
Çıktılar
Aktivasyon fonksiyonu
xn
Girdiler
wn
Ağırlıklar
Şekil 3.13. Yapay nöronun genel yapısı ve bileşenleri.
Aktivasyon fonksiyonu, yapay sinir ağlarına doğrusal olamayan bir yapı
kazandırma amacıyla kullanılan matematiksel bir fonksiyondur. Bu fonksiyonun
kullanımıyla YSA doğrusal olmayan verilerin bulunduğu problemlerin çözümünde
kullanılan güçlü bir yapıya kavuşmaktadır. Kullanılacak aktivasyon fonksiyonu
doğrusal olduğunda, YSA’nın işlemsel yapısı da doğrusal bir özellik gösterecektir
[Kavzoglu, 2001]. Yapay sinir ağı yapılarından çok katmanlı perseptron yapılarında
genellikle logaritmik sigmoidal veya tanjant hiperbolik aktivasyon fonksiyonları ve
radyal tabanlı fonksiyon yapıları ise aktivasyon fonksiyonu olarak Gauss
79
fonksiyonlarını kullanılmaktadır. Bu nedenle kullanılacak aktivasyon fonksiyonu
seçilecek YSA yapısına dolayısıyla çözülecek probleme göre belirlenmelidir.
3.3.2. Yapay Sinir Ağlarının Sınıflandırılması
Yapay sinir ağları, yapay nöronlar ve bu elemanlar arasındaki bağlantılardan
meydana gelen bir yapıdır. YSA’nın genel çalışma prensibi birbirine benzer olmasına
rağmen yapay nöronlar ve bu nöronlar arasındaki bağlantılar YSA’nın özelliğini
belirler. Başka bir ifadeyle, yapay sinir ağı yapısının oluşturulmasında nöronların
dizilimi ve nöronlar arasındaki bağlantılara ait ağırlıkların belirlenmesi ağın
karakteristiği açısından önemlidir. Bu durum göz önüne alındığında, yapay sinir
ağlarını yapılarına ve öğrenme algoritmalarına göre iki ana başlık altında
sınıflandırılmak mümkündür.
3.3.2.1. Yapılarına Göre Yapay Sinir Ağları
Yapay sinir ağları, içerdiği yapay nöronların birbirine bağlanış şekillerine göre
diğer bir ifadeyle yapılarına göre, ileri beslemeli ve geri beslemeli ağlar olmak üzere
iki sınıfa ayrılmaktadır.
3.3.2.1.1. İleri Beslemeli Yapay Sinir Ağları
İleri beslemeli bir ağda yapay nöronlar genellikle katmanlara ayrılmıştır.
Veriler, giriş katmanından çıkış katmanına doğru tek yönlü bağlantılarla iletilir.
Genellikle parametrelere bağlı olarak tanımlanan giriş verileri, çıkış katmanına doğru
tek yönlü bir şekilde iletilir ve dağıtılır. Aynı katmanda bulunan yapay nöronlar
arasında bağlantı tanımlanmazken bir katmanın tüm yapay nöronları bir üst katmanın
yapay nöronları ile bağlantılıdır. Diğer bir ifadeyle, nöronlar bir katmandan diğer bir
katmana bağlanırken, aynı katman içerisinde bağlantıları bulunmamaktadır. Bu tip
ağlarda herhangi bir andaki çıkış o andaki giriş vektörünün bir fonksiyonu olarak
ifade edilir. İleri beslemeli ağlara örnek olarak çok katmanlı perseptron ve LVQ
(Learning Vector Quantization) ağları verilebilir.
80
3.3.2.1.2. Geri Beslemeli Yapay Sinir Ağları
Geri beslemeli yapay sinir ağlarında ileri beslemeli olanların aksine bir nöronun
çıktısı kendinden önceki katmana veya kendi katmanında bulunan herhangi bir
nörona girdi olarak bağlanabilir. Geri beslemeli yapay sinir ağları çıkış katmanı dahil
herhangi bir katmanın veya tüm katmanların girişleri bir önceki katmana geri iletilir.
Böylece, girişler hem ileri yönde, hem de geri yönde aktarılmış olur. Bu tip sinir
ağlarında herhangi bir andaki çıkış, o andaki girişlerin bir fonksiyonu olduğu kadar
önceki giriş ve çıkış değerlerini de yansıtmaktadır. Bu yapısı ile geri beslemeli yapay
sinir ağları doğrusal olmayan bir yapıdadır. Veri akışının çift yönlü olmasından
dolayı bu tip ağlarda ağırlıklar dinamik bir hafıza yapısı tanımlarlar. Geri besleme
özelliğini kazandıran bağlantıların bağlanış şekline göre geri aynı yapay sinir ağıyla
farklı davranışta ve yapıda geri beslemeli yapay sinir ağları elde edilebilir. Bu
yapılardaki yapay sinir ağlarında herhangi bir andaki çıkış o ana kadar işlenmiş tüm
verilerin bir sonucudur. Hopfield, Elman ve Jordan yapıları bu tür yapay sinir ağları
yapılarına örnektir.
3.3.2.2. Öğrenme Algoritmalarına Göre Yapay Sinir Ağları
Yapay sinir ağlarının verilen girdilere göre çıktı üretebilmesinin yolu ağın
öğrenebilmesidir. Öğrenme algoritmalarına göre yapay sinir ağları kontrollü,
kontrolsüz ve takviyeli öğrenme olarak üçe ayrılmaktadır.
3.3.2.2.1. Kontrollü Öğrenme
Kontrollü öğrenmede ağa öznitelik bilgileri ve bu öznitelik bilgilerine ait sınıf
etiketlerini içeren eğitim verisi giriş verisi olarak tanımlanır. Ağ, verilen girdiler için
istenen çıkışları oluşturabilmek için kendi ağırlıklarını günceller. Diğer bir ifadeyle,
kontrollü öğrenme algoritması yapay nöronlar arasındaki bağlantı ağırlıklarını,
eğitim verisindeki gerçek sınıf etiketleri ile ağın çıkış katmanında elde edilen sınıf
etiketleri arasındaki farka göre güncellemektedir. Ağın çıktıları ile beklenen çıktılar
arasındaki hata hesaplanarak ağın yeni ağırlıkları bu hata payına göre düzenlenir.
Hata payı hesaplanırken ağın bütün çıktıları ile beklenen çıktıları arasındaki fark
81
hesaplanır ve bu farka göre her nörona düşen hata payı bulunur. Daha sonra her
nöron kendine gelen ağırlıkları günceller. Bu algoritmaya örnek olarak Delta kuralı
ve LVQ algoritması gösterilebilir.
3.3.2.2.2. Kontrolsüz Öğrenme
Kontrolsüz öğrenme algoritmasında, ağın eğitimi sırasında girdi verisi olarak
sınıf etiketleri belli olmayan öznitelik verileri kullanılmaktadır. Ağın giriş
katmanında tanımlanan bu verilere göre ağ her bir örneği kendi arasında
sınıflandıracak şekilde kendi kurallarını oluşturur. Ağ bağlantı ağırlıklarını aynı
özellikte olan dokuları ayırabilecek şekilde düzenleyerek öğrenme işlemini
tamamlar. Girişe verilen örnekten elde edilen çıkış bilgisine göre ağ, sınıflandırma
kurallarını kendi kendine geliştirmektedir. Kontrolsüz öğrenme algoritmasını
kullanan yapay sinir ağlarına örnek olarak ART ve SOM gösterilebilir.
3.3.2.2.3. Takviyeli Öğrenme
Kontrolsüz öğrenme algoritmasında olduğu gibi bu algoritmada da giriş
verilerine ait sınıf etiketleri kullanılmamaktadır. Takviyeli öğrenme algoritmasında
ağın her iterasyonu sonucunda elde ettiği sonucun iyi veya kötü olup olmadığına dair
bir bilgi verilir. Ağ bu bilgilere göre kendini yeniden düzenler. Bu sayede ağ
herhangi bir girdi dizisiyle hem öğrenerek hem de sonuç çıkararak işlemeye devam
eder. Bu algoritmada yapay sinir ağlarına çıkış verileri verilmezken, elde edilen
çıkışın verilen girişe karşılık uygunluğunu değerlendiren bir ölçüt kullanılmaktadır.
Takviyeli öğrenme algoritmalarına örnek olarak genetik algoritma gösterilebilir.
3.3.3. Çok Katmanlı Perceptron
Günümüzde en çok bilinen ve yaygın biçimde kullanılan ileri beslemeli ağ
yapısı algoritmalarından çok katmanlı perseptron (ÇKP) modelidir. Çok katmanlı
perseptron modelleri esnek ve çoklu tabakalar halinde organize edilmiş işlemci
elemanlardan (nöron) oluşan doğrusal olamayan bir yapıya sahiptirler. ÇKP
82
modelinin yaygın olarak kullanılmasının en önemli nedeni sinir ağının üstünlüğü,
işlemci elemanlarda kullanılan doğrusal olmama özelliğidir.
Çok katmanlı perceptron ağ yapısının esas aldığı ileri beslemeli ağ algoritması
üç farklı katmandan meydana gelir. Çok katmanlı perceptronun genel yapısını
gösteren Şekil 3.14’den de görüleceği üzere bu katmanlar, girdi katmanı, bir veya
birden fazla saklı katman ve çıktı katmanıdır. Girdi verilerini temsil eden girdi
tabakası her bir sınıfa ait değerlerin ağdaki dağılımını tanımlar. Saklı katmanlar
hesaplamalar için kullanılırlar ve her bir düğüme ilişkin değerler girdi düğümü ile bu
düğüme gelen bağlantılara ait ağırlıklarının çarpımının toplamından elde edilir. Çıktı
katmanı tanımlanacak sınıfları göstermek için bir grup koda sahip son işlem
katmanıdır. Tüm ara düğüm bağlantıları ağırlıklarla birleştirilir. Bir değer ara
bağlantılarından geçerken ara düğüm bağlantılarıyla birleştirilen ağırlıklarla çarpılır
[Kavzoglu and Reis, 2008].
Saklı Katmanlar
Girdi Katmanı
Çıktı Katmanı
Arazi Örtüsü
Şekil 3.14. Dört tabakalı ileri beslemeli basit bir çok katmanlı perseptron ağı.
3.3.3.1. Öğrenme Algoritmaları
Öğrenme
algoritması
yapay
sinir
ağları
uygulamalarının
temelini
oluşturmaktadır. Nöron ağlarının oluşturulması ve ağırlıkların belirlenebilmesi
açısından öğrenme algoritmalarına ihtiyaç duyulmaktadır. Farklı yapay sinir ağı
modelleri için birçok öğrenme stratejisi geliştirilmiştir [Kavzoglu, 2001]. Bunlar
arasında ileri beslemeli yapay sinir ağlarının eğitiminde geri yayılım öğrenme
algoritması en popüler yöntemlerdendir [Werbos, 1995].
83
Genelleştirilmiş delta kuralı olarak da bilinen geri yayılım öğrenme algoritması,
iteratif gradyan azaltım öğrenme yöntemidir. Geri yayılım öğrenme algoritması
hataları çıkıştan girişe geriye doğru azaltmaya hedeflemektedir. Bu işlem iki adımda
gerçekleşir. İlk adımda, tüm ağa ait başlangıç ağırlıkları gelişi güzel belirlenir, girdi
verisi ağa sunulur ve çıktı değerlerinin belirlenmesi için ileri doğru yayılır. İkinci
adımda, bilinen ve tahmin edilen çıktı değerleri arasındaki fark (hata) ağdan geriye
doğru beslenir ve ağırlıklar bu farkı (hatayı) azaltacak şekilde değiştirilir. Her
iterasyonda tüm bu işlemler yeniden hesaplanan ağırlıklar ile hata en aza olana veya
önceden belirlenen bir eşik değerine ulaşılıncaya kadar tekrar edilir.
İşlem düğümü ya da yapay nöron, bağlantılara ait ağılıklar ile çarpılan girdi
değerlerini toplar ve aktivasyon fonksiyonunu kullanarak çıkış düğümünü tahmin
eder. Girdi verilerinin toplamı ve çıktı düğümüne ilişkin eşitlikler:
net Pj = ∑ w ji i Pi
(3.42)
o Pj = f ( net Pj )
(3.43)
i
şeklindedir. Bu eşitliklerde; net Pj , girdi değerlerinin toplamını; w ji , ağırlık
vektörünü; iPi , girdi değerlerinden i . elemanın değerini; o Pj , p örneği için j çıktı
düğümünü ve f ( o ) doğrusal olmayan aktivasyon fonksiyonunu göstermektedir.
Doğrusal olmayan aktivasyon fonksiyonlardan en çok kullanılanı sigmoid
fonksiyondur [Kavzoglu, 2001].
Geriye yayılma algoritması gerçek ve hesaplanan çıktı değerleri arasındaki
farkın toplamı olara ifade edilen hatayı minimum hale getirmeyi amaçlar. Bu hata
p örneği için:
Ep =
(
)
1
2
∑ t Pj − o Pj
2 j
(3.44)
84
eşitliği ile hesaplanır. Bu eşitlikte; t Pj , p örneğinin j . bileşenine ait hesaplanan
çıktı değerini; oPj , p girdi örneğinin j . bileşenine ait gerçek çıktı değerini
göstermektedir. Bu durumda ağın toplam hatası:
E = ∑ EP
(3.45)
eşitliği ile hesaplanır. Yeni ağırlıklar, bir önceki ağırlıkların Δw ji şeklinde
güncellenmesi ile:
w1 ji = w ji + Δw ji
Δw ji = −η
∂E
∂w ji
(3.46)
(3.47)
şeklinde hesaplanır. Eşitlik 3.47’de η öğrenme oranı olarak ifade edilir ve kullanıcı
tarafından belirlenen bir parametredir. Bu parametre her bir iterasyonda hesaplanan
hatalarla ilgili ağırlıklardaki değişimin derecesinin kontrolü için kullanılır [Kavzoglu,
2001].
Bir veri setinin karakteristiklerinin belirlenmesi için öğrenme algoritmaları
kullanılır. Bu öğrenme algoritmaları ağırlıkların eğitim döngüleri veya evreleri
arasında nasıl ayarlanacağını belirler. YSA uygulamalarında, ağ yapısının
tasarlanması ve seçilen algoritmaya ait parametrelerin kullanıcı tarafından
belirlenmesi en önemli iki adımı oluşturmaktadır. Saklı katmanın boyutu ve düğüm
sayısı ile ilgili özellikler eğitim veri setinin özeliklerinin öğrenilmesi ve ağ için yeni
olan piksellerin tanımlanmasında ağın kapasitesi açısından önemlidir. Buna ağın
genelleştirme kabiliyeti denir. Saklı tabakadaki düğümlerin sayısı yapay ağın gücünü
ve karmaşıklığını direkt olarak belirler [Kavzoglu and Mather, 2003]. Ağın eğitim
parametrelerinin ayarlanması (öğrenme oranı, momentum, ağırlıklar için başlangıç
değerleri, vb.) öğrenme algoritmasının çalışmasını ve eğitilen ağın performansını
etkileyen ana unsurdur. Dış ve iç parametreler olarak ele alınabilecek bu
parametrelerden; dış parametreler, giriş verisinin karakteristikleri ve çalışma
85
ölçeğini, iç parametreler ise, uygun ağ yapısının seçimi, ağ parametrelerinin
başlangıç değerlerinin belirlenmesi, iterasyon sayısı, aktivasyon fonksiyon tipi ve
öğrenme oranının belirlenmesi gibi sınırlamaları içermektedir [Özkan, 2001]. İleri
beslemeli bir yapay ağın geri yayılma algoritmasıyla eğitimi ağ yapısı, öğrenme
oranı, momentum katsayısı ve aktivasyon fonksiyonu gibi birkaç parametrenin
başlangıçta belirlenmesini gerektirmektedir. Öğrenme oranı yapay sinir ağlarının
başarısı açısından önemli bir etkiye sahiptir. Bu parametre bağlantıların ağırlık
değerlerindeki değişimin miktarını ifade eder. Eğer öğrenme oranı çok yüksek
seçilirse global minimuma ulaşılamaz ve hatada bir artış gözlenir. Bununla beraber
öğrenme oranı çok küçük seçilirse minimum hatanın aranması için gereken süre
artacağından ağın eğitim süreci artacaktır. Momentum katsayısı, bir önceki
iterasyonda hesaplanan ağırlık değişimlerinin oranı olarak yeni oluşturulan
ağırlıklara eklenir. Bu katsayı öğrenme işleminin hızını arttırmak için kullanılır.
3.3.4. Yapay Sinir Ağları ile Görüntü Sınıflandırma
Yapay sinir ağları, herhangi bir istatistiksel kabul gerektirmediğinden
parametrik olmayan kontrollü bir sınıflandırma algoritmasıdır. Kontrollü öğrenme
işleminde, öğrenmeyi temsil eden bağlantı ağırlık değerleri, iteratif bir şekilde ağın
ürettiği çıkışların hedef çıkışlarla karşılaştırılmalarıyla elde edilen belirli bir hata
değerinin minimize edilmesiyle güncellenirken, kontrolsüz öğrenme işleminde,
ağırlık değerlerinin güncelleştirilmesi (öğrenme, eğitim) giriş örneğine en büyük
benzerlik değerini üreten işlemci elemanın aktifleşmesiyle gerçekleştirilmektedir
[Özkan, 2001]. Yapay sinir ağları ile eğitim öncesinde gerçekleştirilmesi gereken bir
takım işlem adımları mevcuttur. Bunlar; ön işlemler, ağ giriş ve çıkışının
kodlanması, sınıfların çıkarılması, ağ topolojisinin oluşturulması ve ağın eğitilmesi
ve genelleştirme kabiliyetinin test edilmesi olarak ifade edilebilir.
Ön işlemlerde amaç, YSA sınıflandırma performansını arttırmak için özellik
çıkartımıdır. Bu amaçla ana-bileşen dönüşümüyle boyutluluk azaltılabilir veya piksel
verileriyle birlikte veya sadece doku, moment gibi uzaysal bilgiler kullanılabilir.
Bununla beraber, öncül işlemeyle elde edilen bilgilerle ağın hız ve performans
kapasitesi artabilmesine rağmen işlenmemiş orijinal verinin kullanılması ağı daha
uygulanabilir yapmaktadır. Örneğin bir grup piksel üzerinden hesaplanan tek bir
86
doku bilgisi kullanılabileceği gibi, bunun yerine bu bilginin çıkarıldığı orijinal piksel
grubunun işlenmesi daha esneklik kazandıracaktır.
Birçok istatistiksel sınıflandırma algoritmasında olduğu gibi en temel ve basit
veri giriş kodlaması şekli, piksel örneklerinin tek tek kullanılmasıdır. İlgili örnek için
özellik (spektral kanal) sayısı kadar giriş katmanı işlemci elemanın kullanılması en
yaygın kullanılan veri giriş tekniğidir. Yapay sinir ağlarının eğitimi için kullanılacak
verilerin ölçeklenmesi önemli bir husustur [Sarle, 2008]. Çok katmalı persptron
yapılarında matematiksel bir zorunluluk olmamasına rağmen özellikle sigmoid veya
tanjant hiperbolik (TANH) aktivasyon fonksiyonu kullanılarak verinin [0 1] veya [-1
1] aralığına çekilmesi işlemsel etkinliği arttırabilmektedir. Yapay sinir ağları ile
yapılan sınıflandırmada, her bir öznitelik verisi (uzaktan algılamada her bir bant)
[ 0 ,1 ] veya [ −1,+1 ] aralığında ölçeklenmektedir. Ölçekleme ile çok geniş sayısal
aralıktaki veri daha dar bir sayısal aralıkta ifade edilebilmektedir. Bu şekilde eğitim
sırasındaki işlemler kolay ve hızlı gerçekleştirilebilecektir. Sigmoid ve TANH
fonksiyonlarının sıkıştırma etkisi olduğu için giriş verisinin bu şekilde ölçeklenmesi,
ağ performansını ve yakınsama hızını olumlu yönde etkileyebilmektedir [Kavzoglu,
2001].
Ağ çıkışının kodlanmasında en doğal kodlanma şekli her bir sınıf için bir
işlemci eleman kullanımıdır. Her bir sınıf için ayrı bir işlemci eleman kullanılmasıyla
pikseller en yüksek çıkış değerini aldığı işlemci elemanın temsil ettiği sınıfa atanır.
Yüksek değer, ilgili pikselin o sınıfa yüksek bir doğrulukla ait olduğunu ifade eder.
Genellikle istenen çıkış değerlerine, örneğin ait olduğu sınıfı temsil eden işlemci
eleman için yüksek, diğerleri için düşük değerler atanır [Kansu, 2006]. YSA
yapılarında giriş ve çıkış katmanlarındaki işlemci eleman sayıları, veri boyutu ve
istenen sınıf sayısı gibi dış etkenlere göre belirlenirken, saklı katmanlardaki
elemanlar deneme yanılma yoluyla belirlenmektedir. Yapay sinir ağlarının teorik
kapasitesi teorik olarak ara katman işlemci eleman sayısına bağlıdır [Kavzoglu and
Mather, 2003].
MLP ağlarının eğitilmesi için kullanılan geri yayılım algoritmasında eğitim, ya
örneklerin ağa bireysel girişlerinden elde edilen hataya göre ya da örneklerin ağa
bütünüyle girildiklerinde elde edilen toplam hataya dayanarak gerçekleştirilmektedir.
87
Genel olarak YSA eğitimi, aşağıdaki aşamaları içermektedir:
1. Eğitim ve buna karşılık gelen çıkış verilerinin belirlenmesi.
2. Ağ topolojisinin belirlenmesi (giriş, ara ve çıkış katman sayıları).
3. Ağırlık başlangıç değerlerinin atanması. Bu değerler rastgele atanır. Aksi
takdirde, ağın dağıtılmış bilgisini içeren farklı ağırlık değerlerine ulaşmak mümkün
olamamaktadır.
4. Öğrenme ve momentum oranı gibi gereken ağ parametrelerinin belirlenmesi.
Bu parametrelerin optimum değerlerinin deneme-yanılma yoluyla belirlenmesinin
yanında adaptif yöntemlerde kullanılabilir.
5. Çıktı kodlamasının belirlenmesi.
3.4. Örnek Tabanlı Öğrenme ve K-Star Sınıflandırıcısı
Örnek tabanlı öğrenme (ÖTÖ) algoritmaları literatürde en yaygın kullanımı
olan öğrenme algoritmalarından birisidir [Okamoto and Yugami, 2003]. Örnek
tabanlı öğreniciler test veri setindeki öznitelik bilgisi bilinmeyen bir örneğin
sınıflandırılması işlemini veri tabanında saklanan ve önceden sınıflandırılmış eğitim
veri setindeki örnekler ile karşılaştırarak gerçekleştirirler [Aha et al., 1991; Aha,
1992; Wilson and Martinez, 2000]. Bu karşılaştırma işleminde temel kabul benzer
örneklerin benzer sınıflandırmalara sahip olacağıdır [Piramuthu and Sikora, 2009].
Burada esas olan benzer örnekler ve benzer sınıflandırmanın nasıl belirleneceğidir.
Örnek tabanlı öğrenicinin karşılıklı bileşenleri, iki örneğin ne kadar benzer olduğunu
belirleyen uzaklık fonksiyonu ve örnekler arasındaki benzerliklerden yeni bir örnek
için
sonuç
sınıflandırıcının
nasıl
oluşturulacağını
belirleyen
sınıflandırma
fonksiyonudur. Bu iki bileşene ek olarak ÖTÖ algoritmaları yeni örneklerin örnek
veri tabanına eklenip eklenmeyeceğini ve veri tabanındaki hangi örneklerin
sınıflandırmada kullanılacağını belirler. Basit bir ÖTÖ algoritmasında bir örnek
sınıflandırıldıktan sonra her zaman örnek veri tabanında doğru sınıflandırılan
örnekler arasına taşınır. Daha karmaşık algoritmalarda örnek veri tabanına eklenen
örnekler, bellek gereksinimini azaltmak ve kirli (gürültülü) veri için toleransı
arttırmak amacıyla filtrelenebilir. Örnek tabanlı öğreniciler iki örnek arasındaki
benzerliğin belirlenmesinde bazı uzaklık veya benzerlik fonksiyonlarından
88
yararlanırlar. Bu uzaklık fonksiyonu hangi örneğin girdi vektörüne en yakın
olduğuna karar verilmesinde kullanılmaktadır [Wilson and Martinez, 2000]. Örnek
tabanlı öğrenmede yeni bir örnek ile çevresindeki örnekler arasındaki uzaklık ölçülür
[Aha et al., 1991]. Literatürde bir çok uzaklık fonksiyonu geliştirilmiştir. Bu
fonksiyonlara örnek olar Öklit, Mahalonobis, Quadratic ve Ki-Kare gibi uzaklık
fonksiyonları gösterilebilir [Nadler and Smith, 1993; Michhalski et al., 1981; Diday,
1974]. Örnek tabanlı öğreniciler küçük bir ön işlemle eğitim verisini kaydettikten
sonra test veri seti sisteme giriş yapıncaya dek beklerler. Bu nedenle bu algoritmalar
eğitim işlemi için daha az zamana gereksinim duyarken test veri seti kullanarak
öznitelik değerlerinin tahmin edilmesi işlemi için daha fazla zamana gereksinim
duymaktadırlar [Aha, 1997; Hullermeier, 2003; Piramuthu and Sikora, 2009].
Literatürde en yakın komşuluk, IB1, IB2, IB3, IB4 ve IB5 algoritmaları gibi
birçok ÖTÖ algoritmaları geliştirilmiş ve çeşitli uygulamalarda kullanılmıştır [Cover
and Hart, 1967; Dasarathy, 1991; Aha et al., 1991; Aha, 1992]. En yakın komşuluk
algoritmaları en basit örnek tabanlı öğrenme algoritmalarıdır [Cover and Hart, 1967].
Bu algoritmalar eğitim verisinden en çok bezeyen tek bir örneği bulmak için bir
takım alan özellikli uzaklık fonksiyonları kullanırlar. Bulunan örnek yeni bir örneğin
sınıflandırılması için kullanılır. En yakın komşuluk algoritması veri tabanında
saklanacak ve sınıflandırmada kullanılacak örnekleri seçimsel yapacak şekilde
düzenlenmiştir [Hart, 1968; Gates, 1972]. K en yakın komşuluk algoritmaları bu
anlamda biraz daha karmaşık bir yapıya sahiptir. Bu algoritmalarda, yeni bir örneğin
k- en yakın komşulukları ve bu örneğin sınıflandırılması için verilen sınıflar arasında
hangi sınıfın daha baskın olduğu belirlenir. K en yakın komşuluk algoritması k=1
olduğunda standart en yakın komşuluk algoritmasında ile aynıdır. Aha et al. (1991)
çok yönlülüğü artıran üç örnek tabanlı algoritma tanımlamışlardır. IB1 algoritması
özel bir uzaklık fonksiyonuna sahip en yakın komşuluk algoritmasının bir
uygulamasıdır. Bu algoritmada, gerçek değerli öznitelikler ortak bir ölçekte
normalleştirilir ve böylece tüm öznitelikler eşit ağırlığa sahip olurlar. Bununla
beraber kayıp değerlerin gerçek değerden maksimum olarak farklı olduğu kabulü söz
konusudur. IB2 algoritması sadece yanlış sınıflandırılmış örneklerin kaydedildiği ve
bellek gereksinimini azaltmak için IB1 algoritmasına çeşitli eklemelerin yapılmasıyla
geliştirilen bir algoritmadır. IB3 ise gürültülü veriler için toleransı arttıran eklentiler
içerir. Bu yöntemde yeterince kötü sınıflandırma geçmişi olan örnekler göz ardı
89
edilirken, iyi bir sınıflandırma geçmişine sahip olan örnekler sınıflandırmada
kullanılırlar.
Cleary and Trig (1995) iki örnek arasındaki uzaklığın belirlenmesinde
kullanılacak uzaklık fonksiyonu olarak bilgi teorisine dayanan entropik uzaklık
ölçüsünü kullanmışlardır. Bilgi teorisinde, entropi rastgele değişkenler ile ilgili
belirsizliğin ölçüsü olarak tanımlanmıştır [Sahnnon, 1948]. İki özellik arasındaki
uzaklığın hesaplanmasında kullanılan bu yöntem bilgi teorisinden yola çıkılarak
ortaya atılmıştır. Örnekler arasındaki uzaklığa ilişkin bu öngörü bir örneğin başka bir
örneğe
dönüşümündeki
karmaşıklık
olarak
tanımlanır.
Bu
karmaşıklığın
hesaplanması iki adımda gerçekleştirilir. İlk olarak, özellikten özelliğe dönüşüm
olarak tanımlanan sonlu sayıda dönüşümler kümesi belirlenir. Bir özelliğin (a) diğer
bir özelliğe (b) dönüşümü, (a) dan başlayıp (b) de sonlanan sınırlı dönüşümler dizisi
olarak tanımlanabilir [Cleary and Trig, 1995].
I’nın sınırlı sayıda örnekler kümesi ve T’nin I üzerinde sınırlı sayıdaki
dönüşümler kümesi olduğu göz önüne alınsın. Her bir t ∈ T , t : I → I şeklinde
örnekten örneğe dönüşüm yaptığı ve T σ gibi ayırt edilebilir bir üye içerdiği
düşünülsün. Bu σ ile gösterilen eleman σ (a) = a şeklinde ifade edilir ve örneklerin
kendilerine dönüşümündeki bütünlüğü göstermektedir. P’nin
σ
tarafından
sonlandırılan T* nin tüm örnek kodlarını içeren altküme olduğu düşünüldüğünde, T*
−
nin elemanları I ile ilgili dönüşümü belirler. Bu t = t1 ,..., t n olmak üzere;
−
t (a) = t n (t n −1 (...t1 (a)...))
(3.48)
şeklinde ifade edilir. p olasılık fonksiyonu T* dan belirlenir. Bu olasılık fonksiyonu
aşağıdaki özellikleri sağlamaktadır:
−
0≤
p (t u )
−
p (t )
≤1
(3.49)
90
−
−
∑ p (t u ) = p ( t )
(3.50)
p(Λ) = 1
(3.51)
u
Sonuç olarak p olasılık fonksiyonu Eşitlik 3.52’yi sağlamaktadır.
−
∑ p(t )
(3.52)
_
t ∈P
Olasılık fonksiyonu P* , a örneğinden b örneğine kadar tüm yolların olasılıkları
olarak belirlenir (Eşitlik 3.53).
−
P * (b a ) =
−
∑ p (t )
(3.53)
−
t ∈P:t ( a ) =b
Bunlarla beraber P* fonksiyonun aşağıdaki özellikleri sağlamaktadır.
∑ P (b a ) = 1
(3.54)
0 ≤ P * (b a ) ≤ 1
(3.55)
*
b
Bu durumda K* fonksiyonu;
K * (b a ) = − log 2 P * (b a )
(3.56)
şeklinde belirlenir. K* fonksiyonu tam anlamıyla bir uzaklık fonksiyonu değildir.
Örneğin, K * (a a ) genelde sıfırdan farklıdır ve fonksiyon simetrik değildir [Cleary
and Trig, 1995].
91
K* algoritması sayısal veya sembolik öznitelik değerine sahip veri setlerinin
sınıflandırılmasında kullanılabilmektedir. Sayısal değere sahip öznitelik değerlerinin
sınıflandırılmasında yoğunluk fonksiyonu,
P (x ) =
*
1
2 x0
−x
e
x0
(3.57)
dx
şeklinde hesaplanır. Bu eşitlikte kullanıcı tarafından belirlenen x0 parametresi; x ’in
tüm P* dağılımları için beklenen ortalama değerini ifade eden bir ölçek uzunluğudur.
Sembolik özniteliklerin olması durumunda 1 ≤ i ≤ n olmak üzere pi olasılığında
n örneğe sahip bir veri seti olduğu düşünülür. Bir sembolün olasılığı; s olasılığı ve j
sembolüne ait t dönüşümlerinin olasılığı ( 1 − s ) p j olduğunda aynı kalır. Özetle tüm
olası dönüşlümler,
⎧ (1 − s ) p j ⎫
P* ( j i ) = ⎨
⎬
⎩s + (1 − s ) pi ⎭
if i ≠ j
if i = j
(3.58)
şeklinde ifade edilir. Bu eşitliklerde s olasılığı göstermektedir ve kullanılacak veri
setine göre kullanıcı tarafından belirlenmesi gerekir [Cleary and Trig, 1995].
Uzaklık ölçüsü olarak Entropi’yi kullanan örnek tabanlı bir sınıflandırıcının
uygulanabilmesi için gerekli olan x0 ve s parametre değerlerinin seçiminde uygun bir
yöntem kullanılmalıdır. Her bir boyut için x0 (sayısal değerli örneklerde) ve s
(sembolik özniteliklerde) parametre değerlerinin belirlenmesi gerekir. Sembolik
öznitelikler için olasılık fonksiyonu olan s parametresindeki değişimler göz önüne
alınsın. s değeri 1’e yakın bir değerde olduğunda aynı sembol özniteliğine sahip
örnekler yüksek dönüşüm olasılığına sahip olurken, söz konusu özniteliklerle farklı
92
bir sembol özniteliğine sahip olan örnek düşük dönüşüm olasılığına sahip olacaktır. s
değeri 0 olduğunda, dönüşüm olasılığı direkt olarak sembollerin olasılık dağılımını
gösterecektir. Gerçek değerli öznitelikler için uzaklık ölçümü aynı özellikleri
sergiler. x0 değeri küçük olduğunda örneklerin olasılığı çok çabuk düşer. Diğer
taraftan x0 değeri çok büyük olduğunda tüm örnekler aynı dönüşüme ve dolayısıyla
eşit ağırlığa sahip olacaklardır.
Her iki durumda da olasılık dağılımına dahil olan örnek sayısı, en yakın
komşuluk dağılımı olan 1 değeri ile tüm örneklerin eşit ağırlığa sahip olduğu N
değeri aralığında değişir. Herhangi bir P* fonksiyonu için etkili örnek sayısı,
2
⎛
⎞
⎜ ∑ P * (b a ) ⎟
b
⎠ ≤N
n0 ≤ ⎝
*
2
∑ P (b a)
(3.59)
b
şeklinde ifade edilebilir. Burada N eğitim örneklerinin tümünün sayısını, n0 ise
eğitim örneklerinden a örneğine en kısa mesafedeki örneklerin sayısını gösterir. K*
algoritması x0 ve s parametreleri için a değerini n0 ve N arasındaki bir değer
seçilmesiyle belirler. Böylece seçilen n0 en yakın komşuluk algoritmasını ve seçilen
N eşit ağırlıklı örneklerin sayısını verir. Belirlenen bu sayıların uygunluğu
harmanlama parametresi (b) kullanılarak belirlenir. Harmanlama parametresi b = %0
(n0 için) ve b = %100 (N için) arasında değişmektedir. Ancak her bir öznitelik için
eşit ağılık sağlayan harmanlama parametresi kullanılmasıyla x0 veya s parametreleri
her bir boyut için bağımsız olarak belirlenir.
93
4. UYGULAMA
4.1. Çalışma Alanı
Gebze, Marmara bölgesinde Kocaeli ilinin kuzeybatısında, İstanbul il sınırında
yer alan Kocaeli iline bağlı bir ilçedir. Türkiye sanayisinin %15'ini, Kocaeli'nin
endüstrisinin büyük bölümün barındıran Gebze, Marmara bölgesinin en büyük ikinci
ilçesidir. Yaklaşık olarak yüz ölçümü 610 km² olan ilçe, coğrafi konumu itibariyle
40o 45’ 08’’ ile 41o 02’ 38’’ kuzey enlemleriyle 29o 19’ 56’’ ile 29o 45’ 14’’ doğu
boylamları arasında yer almaktadır (Şekil 4.1). Doğusunda İzmit, batısında İstanbul,
kuzeyinde Şile, güneyinde (İzmit Körfezi) ile sınırlanan Gebze, yayla görünümünde
bir düzlüğün üzerinde kurulmuştur [URL–3]. Gebze ilçesinin 2008 yılında yapılan
adrese dayalı nüfus kayıt sitemine göre toplam nüfusu 546.933’tür [URL–4].
Şekil 4.1. Çalışma Alanı Haritası.
Gebze ilçesinin ekonomik yapısını bünyesinde barındırdığı büyük ve küçük
ölçekteki birçok sanayi kuruluşu oluşturmaktadır. İlçenin İstanbul ilinin sınırında
bulunması, çevre yolu ve diğer bağlantı yolları üzerinde olması nedeniyle ulaşım
94
kolaylığı ilçeyi bir sanayi kenti haline getirmiştir. Gebze’de boya, plastik, elektrik,
metal, makine ve kimya sanayisinin önde gelen kuruluşları faaliyet göstermektedir.
Bunun yanında TÜBİTAK Marmara Araştırma Merkezi (MAM), Gebze Yüksek
teknoloji Enstitüsü (GYTE) ve Türk Standartları Enstitüsü (TSE) gibi önemli kurum
ve kuruluşlar ilçede yer almaktadırlar.
4.2. Uygulama Konusu ve Amacı
Arazi kullanım şekillerinin belirlenmesi, çevresel değişiklerin izlenmesi ve
doğal kaynaklara ait envanterlerin çıkarılması gibi geniş ölçekli birçok çalışmada
yeryüzüne ait bilgilere ihtiyaç duyulmaktadır. Uzaktan algılama teknolojileri farklı
konumsal ve zamansal çözünürlüklerde yeryüzünü görüntüleyebilme kabiliyetine
sahip olduğundan bu önemli bilgilerin elde edilmesinde önemli bir kaynak
durumundadır. Bu nedenle uydu görüntüleri yardımıyla arazi örtüsünün ve arazi
kullanımının sınıflandırılması uzaktan algılama uygulamalarının önemli bir parçası
olmuştur. Günümüze kadar uzaktan algılanmış görüntülerin sınıflandırılmasında
birçok yöntem geliştirilmiş ve kullanılmıştır.
Bu çalışmada, Gebze ilçesindeki arazi örtüsünün sınıflandırılması için çalışma
alanını kapsayan 1997 yılında kaydedilmiş Landsat ETM+ ile 2002 yılında
kaydedilmiş Terra ASTER uydu görüntüleri kullanılmıştır. Söz konusu uydu
görüntülerinin sınıflandırılmasında ileri sınıflandırma algoritmalarından destek
vektör makineleri, karar ağaçları, çeşitli birleştirme algoritmaları, yapay sinir ağları
ve K-star sınıflandırıcıları kullanılmıştır. Çalışmada, söz konusu algoritmaların
sınıflandırma performansları birbirileriyle ve popüler sınıflandırma yöntemlerinden
En Çok Benzerlik sınıflandırıcısıyla karşılaştırılarak elde edilen sınıflandırılma
sonuçlarının detaylı bir şekilde analiz edilmesi amaçlanmıştır. Uygulanan metotların
paremetrelerinin performanslarına olan etkisi de bu çalışmada araştırılmıştır.
4.3. Kullanılan Veri ve Yazılımlar
Uygulamada, Gebze ilçesine ait arazi örtüsünün belirlenmesi amacıyla
18.07.1997 tarihinde görüntülenen Landsat ETM+’in termal bant haricindeki 6 bandı
95
ve 28.10.2002 tarihinde görüntülenen Terra ASTER uydu görüntüsünün ilk 9 bandı
kullanılmıştır. Uydu görüntülerinin geometrik düzeltmesinde bölgeye ait 1/25.000
ölçekli haritalardan yararlanılmıştır. Ayrıca, uydu görüntülerinin sınıflandırılması
amacıyla eğitim alanlarının belirlenmesinde farklı tarihlerde çekilmiş hava
fotoğrafları (1996, 1999 ve 2003) ve Gebze orman bölge şefliğine ait meşcere
haritalarından yararlanılmıştır. Bunların yanı sıra arazide görsel olarak da alanlara ait
konumlar el GPS aletleriyle tespit edilmiştir.
Uydu görüntülerinin geometrik olarak düzeltilmesi ve sınıflandırmaya esas
olacak kontrol alanlarının belirlenmesinde ERDAS IMAGINE 8.7 yazılımı
kullanılmıştır. Söz konusu görüntülerin sınıflandırılmasında YALE Üniversitesi
tarafından geliştirilen Rapid-Miner 4.1, MATLAB 6.5, Stuttgart Üniversitesi
tarafından geliştirilen Stuttgart Neural Network Simulator (SNNS) programı ve
Gebze Yüksek Teknoloji Üniversite’sinde Doç. Dr. Taşkın Kavzoğlu’ nun C++
dilinde yazdığı programlar kullanılmıştır.
4.4. Uygulama Aşamaları
4.4.1. Uydu Görüntülerinin Geometrik Düzeltilmesi ve Yeniden
Örneklenmesi
Landsat ETM+ ve Terra ASTER uydu görüntülerinin geometrik düzeltmesinde
bölgeye ait 1/25.000 ölçekli haritalar sayısallaştırılarak bilgisayar ortamına aktarılmış
ve ERDAS/Imagine yazılımı ile UTM koordinat sisteminde tanımlanarak haritalar
mozaik haline getirilmiştir.
Uydu görüntülerinin farklı veri gruplarıyla beraber değerlendirilebilmesi için
aynı koordinat sisteminde olmaları gerekmektedir [Mather, 1987]. Bu nedenle uydu
görüntülerinin geometrik dönüşümü için, UTM projeksiyon sisteminde sayısal
ortama aktarılmış topoğrafik haritalardan faydalanılmıştır. Koordinat dönüşümünde
yer kontrol noktalarının tüm çalışma alanına homojen olarak dağılmasına dikkat
edilmiştir. Uydu görüntülerine birinci derece Afin dönüşümü kullanılarak UTM
projeksiyon sisteminde yaklaşık 0.5 piksel karesel ortalama hata ile geometrik
96
düzeltme getirilmiştir. Uydu görüntülerinin yeniden örneklenmesinde orijinal
değerleri koruduğundan en yakın komşuluk yöntemi tercih edilmiştir.
4.4.2. Arazi Örtüsü Sınıfları ve Eğitim Alanlarının Belirlenmesi
Görüntü sınıflandırma, görüntüyü oluşturan her bir pikselin tüm bantlardaki
değerlerinin diğer pikseller ile karşılaştırılarak benzer piksellerin kullanıcının
belirlediği bilgi kategorileri dahilinde sınıflara ayrılması işlemidir (Campbell, 1996).
Objelerin, sınıf olarak adlandırılan kategorilerden birine atanmasına örüntü
sınıflandırması denir. Özel bir örüntü sınıflandırma probleminde bir sınıflandırıcı
sınıflandırılmak istenilen nesneleri belirli bir doğrulukla sınıflandıracak şekilde
oluşturulur. Girdi ve çıktı çiftleri kullanılarak yapılan eğitim yardımıyla
sınıflandırıcılar girdi verilerini verilen sınıflardan birine atamak için karar
fonksiyonlarını oluşturur. Kontrollü sınıflandırma da, çalışma alanındaki yeryüzü
özelliklerini tanımlayan yeteri sayıdaki kontrol alanı kullanılarak, piksel değerlerinin
özellik dosyaları (eğitim verileri) oluşturulur. Seçilen sınıflara ait kontrol alanlarını
ifade eden bu eğitim verilerinin görüntü verilerine uygulanması ile her bir görüntü
elemanı (piksel), hesaplanan olasılık değerine göre en çok benzer olduğu sınıfa
atanmaktadır. Eğitim alanlarına ait veriler, mümkün oldukça uydu görüntüsünün
kaydedildiği tarihe yakın bir zaman diliminde araziden toplanmalıdır. Doğru bir
sınıflandırmanın yapılabilmesi, eğitim alanlarının arazide homojen bir şekilde
belirlenmesi ve yeterli büyüklükte tanımlanması ile mümkündür [Lillesand et al.,
2007]. Kontrollü sınıflandırmada, ilk adım arazi örtüsünü temsil edecek sınıfların ve
bu sınıflara ait kontrol alanlarının belirlenmesidir. Belirlenen sınıflara ait kontrol
alanlarından her bir arazi örtüsü çeşidini temsil edecek örnekleme bölgeleri seçilir ve
bu bölgelerin spektral özelliklerini açıklayacak sayısal değerler geliştirir.
Her iki uydu görüntüsü üzerinden yapılan ön çalışmalar neticesinde çalışma
alanında altı temel sınıfın mevcut olduğu belirlenmiştir. Belirlenen bu sınıflar su,
yerleşim, toprak-taş, bozkır, iğne yapraklı orman ve geniş yapraklı orman sınıflarıdır.
Çalışma alanını kapsayan görüntülerin sınıflandırılması işlemi için öncelikle her iki
tarihte arazideki durumu en iyi yansıtacak şekilde belirlenen bu altı sınıfı kapsayan
eğitim alanları tespit edilmiştir. Belirlenen eğitim alanlarını kapsayan görüntü
katmanı yazılan bir MATLAB programı yardımıyla rastgele örnekleme prensibinden
97
hareketle örneklendirilerek eğitim ve test veri setleri oluşturuldu. Eğitim ve test veri
setleri belirlenirken tüm sınıflar için eşit sayıda örnek seçilerek özellikle test verisi
için hesaplanan doğruluk değerlerinde oluşabilecek “önyargı” giderildi. Sonuçta
sınıflandırmada kullanılmak üzere, eğitim için Landsat ETM+ görüntüsü için toplam
3900 piksel (her sınıf için 650 piksel), test verisi olarak 2100 piksel ve Terra Aster
görüntüsü için eğitim verisi olarak toplam 2400 piksel, test verisi olarak toplam 1350
piksel belirlenmiştir.
4.4.3. Uydu Görüntülerinin Sınıflandırılması
Küresel ve çevresel değişimlerin belirlenmesi amacıyla yapılan çalışmalarda
yeryüzüne ait bilgilerin elde edilmesi önemli bir aşamadır. Yersel çalışmaların aksine
uydu görüntüleri ile çalışmak zaman ve maliyet açısından büyük avantajlar
sağlamaktadır [Kavzoğlu ve Çetin, 2005]. Uzaktan algılama sistemlerinin farklı
genişlikteki alanları farklı zamanlarda görüntüleyebilme özelliği, bu sistemleri
yeryüzüne ait bilgilerin elde edilmesinde önemli bir kaynak haline getirmiştir. Bu
nedenle arazi örtüsü veya kullanım şekillerinin belirlenmesi amacıyla yapılan
çalışmalarda uydu görüntülerinin sınıflandırılması önemli bir aşamadır.
Uzaktan algılanmış görüntüler ile arazi örtüsünün haritalanması, her bir
pikselin yansıtma ve parlaklık değerlerini kullanarak bu pikselleri belirli arazi örtüsü
sınıflarından birine atanması işlemini içermektedir [Huang et al., 2002]. Başka bir
ifadeyle, görüntüdeki pikselleri arazide karşılık geldikleri sınıflar veya temalar içine
atamak
veya
yerleştirmektir.
Çeşitli
arazi
örtülerinin
spektral
yansıma
karakteristikleri uydu sensörlerinin çeşitli dalga boylarında veri elde etmesi
durumunda arazi örtüsü tipinin belirlenmesinin mümkün olabileceğini göstermiştir
[Richards, 1993]. Görüntü sınıflandırma kullanıcının ilgi duyduğu objeler veya
çeşitli sınıflar ile objelere ait spektral imzalar arasındaki ilişkiyi kurarak görüntüler
üzerinden tematik bilgilerin çıkarıldığı bir görüntü işleme bileşenidir. 1970 yılların
başında ilk Landsat uydu görüntüsünün elde edilmesinden itibaren birçok
sınıflandırma algoritması geliştirilmiş ve sınıflandırmada kullanılmıştır [Townshend,
1992; Hall et al., 1995; Lu and Weng, 2007].
98
Bu çalışmada, kontrollü sınıflandırma algoritmalarından destek vektör
makineleri,
karar
ağaçları,
karar
ağaçlarının
sınıflandırma
performansının
arttırılmasına yönelik olarak kullanılan çeşitli birleştirme algoritmaları, yapay sinir
ağları ve nesne tabanlı sınıflandırma algoritmalarından K-star sınıflandırıcıları
kullanılmıştır.
4.4.3.1. En Çok Benzerlik Yöntemi İle Sınıflandırma
En çok benzerlik yöntemi istatistiksel bir sınıflandırıcı olup literatürde
kullanımı yaygın olan bir sınıflandırma yöntemidir. En çok benzerlik (EÇB)
yöntemiyle sınıflandırma işlemi MATLAB 6.5 yazılımında hazırlanan bir program
ile gerçekleştirilmiştir. Sınıflandırma işleminde Landsat ETM+ ve Terra ASTER
görüntüleri için oluşturulan eğitim setleri ile model oluşturulmuş ve test veri setleri
kullanılarak doğruluk analizi gerçekleştirilmiştir. Sınıflandırma sırasında piksellerin
belirlenen sınıflardan veya bu sınıfların dışında bir sınıftan olduğunun tespiti için
eşik değeri %50 olarak belirlenmiştir. EÇB yöntemiyle yapılan sınıflandırma
sonuçlarının genel doğruluğu Tablo 4.1’den de görüleceği üzere Landsat ETM+
görüntüsü için yaklaşık %87, Terra ASTER uydu görüntüsü için %88 olarak
hesaplanmıştır.
Tablo 4.1. En Çok Benzerlik (EÇB) Yöntemi ile elde edilen sınıflandırma
doğrulukları.
Landsat ETM+
Terra ASTER
Genel Doğruluk (%)
Kappa Değeri
Genel Doğruluk (%)
Kappa Değeri
86.95
0.84
88.00
0.86
Her iki uydu görüntüsünün en çok benzerlik yöntemi ile sınıflandırılması
sonucunda oluşturulan tematik haritalar Şekil 4.2’de gösterilmiştir.
99
(a)
(b)
Şekil 4.2. En çok benzerlik yöntemiyle elde edilen tematik haritalar. (a) Landsat
ETM+ görüntüsü , (b) Terra ASTER görüntüsü.
4.4.3.2. Destek Vektör Makineleri İle Sınıflandırma
Destek vektör makineleri istatistiksel öğrenme prensibine dayalı parametrik
olmayan bir sınıflandırma algoritmasıdır. Uzaktan algılama verilerinde olduğu gibi
doğrusal olarak ayrılamayan verilerin sınıflandırılması probleminin çözümünde
destek vektör makineleri kernel fonksiyonları olarak adlandırılan doğrusal olmayan
fonksiyonlar kullanır. Sınıf sayısının ikiden fazla olması durumunda çoklu
sınıflandırma yöntemlerinden yararlanılır. Çoklu sınıflandırma yöntemlerinden en
önemlileri “bire karşı hepsi” ve “bire karşı bir” yöntemleridir [Mathur and Foody,
2008]. Debnath et al., (2004), kullanılan çoklu sınıflandırma yöntemleri arasında bire
karşı bir yönteminin pratik uygulamalarda en uygun yöntem olduğunu ifade
etmişlerdir. DVM’nin eğitimi için kullanılacak kernel fonksiyonun ve kernel
fonksiyonuna ait parametrelerin belirlenmesi son derece önemlidir. DVM ile yapılan
sınıflandırmada karşılaşılan en büyük problem, kullanılacak kernel fonksiyonları için
100
hangi parametre değerlerinin en iyi sonucu vereceğinin bilinmemesidir (Oommen et
al., 2008). Seçilen kernel fonksiyonu ve kernel parametreleri ise sınıflandırılacak veri
setine göre değişiklik göstermektedir (Huang, et al., 2002; Dixon and Candade,
2008).
Bu çalışmada, doğrusal olmayan ve ikiden fazla sınıfı içeren uydu
görüntülerinin sınıflandırılmasında “bire karşı bir” çoklu sınıflandırma yöntemi
kullanılmıştır. DVM ile yapılan sınıflandırılmada polinom, radyal tabanlı ve Pearson
VII kernel fonksiyonları kullanılmıştır. Bu fonksiyonlar için gerekli parametreler
çapraz geçerlilik yöntemi ile eğitim sırasında belirlenmiş ve parametre değerlerindeki
değişimlerin sınıflandırma doğruluğuna etkileri incelenmiştir. Belirlenen optimum
parametrelerle uydu görüntüleri sınıflandırılmış ve elde edilen sınıflandırma
sonuçları analiz edilerek tematik haritalar oluşturulmuştur.
4.4.3.2.1. Polinom Kernel Fonksiyonu ile Sınıflandırma
Polinom kernel kullanımı için önceden belirlenmesi gereken parametreler
polinomun derecesi (d) ve düzenleme parametresidir (C). Çapraz geçerlilik yöntemi
ile bu parametreler Landsat ETM+ ve Terra ASTER görüntüleri için oluşturulan
eğitim ve test verileri kullanılarak ayrı ayrı belirlenmiştir. Seçilecek düzenleme
parametresine (C) göre sınıflandırma doğruluğunda meydana gelen değişimler
Landsat ETM+ için Şekil 4.3’de ve Terra ASTER için Şekil 4.4’te gösterilmiştir.
Şekil 4.3’den de görüleceği üzere düzenleme parametresinin (C), 850–1000
aralığında alacağı değerler için elde edilen sınıflandırma doğruluğunun yaklaşık
olarak %90 seviyesinde olduğu görülmektedir. Landsat ETM+ görüntüsünün
polinom kernel fonksiyonu kullanılarak sınıflandırılmasında düzenleme parametresi
(C), test verisi için bu aralıkta en yüksek sınıflandırma doğruluğunun elde edildiği
değer olan 890 olarak belirlenmiştir. Terra ASTER uydu görüntüsünün
sınıflandırılmasında Şekil 4.4’den de görüleceği üzere test veri seti için en yüksek
sınıflandırma doğruluğunun elde edildiği 1000 değeri düzenleme parametresi (C)
olarak belirlenmiştir.
101
Sınıflandırma Doğruluğu (%)
91
90
90,05
89
88
87
86
85
10
50
100
250
500
750
850
890
1000
5000
Düzenleme Parametresi (C)
Şekil 4.3. Landsat ETM+ uydu görüntüsü için düzenleme parametresi C’deki
değişimlerin sınıflandırma doğruluğuna etkisi.
Sınıflandırma Doğruluğu (%)
92
91,04
91
90
89
88
10
50
100
250
500
750
1000
5000
Düzenleme Parametresi (C)
Şekil 4.4. Terra ASTER uydu görüntüsü için düzenleme parametresindeki (C)
değişimlerin sınıflandırma doğruluğuna etkisi.
Polinom kernel fonksiyonu ile yapılacak sınıflandırma öncesinde kullanıcı
tarafından belirlenen diğer parametre ise polinomun derecesidir. Literatürde yapılan
çalışmalarda polinom kernelin derecesi arttıkça hesaplama zorluğunun ve hesaplama
zamanının arttığı ifade edilmektedir (Cortes and Vapnik, 1995; Huang et al., 2002).
Her iki uydu görüntüsü için polinom derecesindeki değişimler ve buna karşılık test
verisi için hesaplanan genel sınıflandırma doğrulukları Şekil 4.5 ve 4.6’da ayrı ayrı
102
gösterilmiştir. Şekil 4.5’den polinom derecesinin 1–5 aralığında alacağı değerler ile
test verisi için yaklaşık %90 sınıflandırma doğruluğuna ulaşıldığı görülmektedir. Bu
aralıkta 3. dereceden bir fonksiyon ile en yüksek sınıflandırma doğruluğuna
ulaşılmış, dolayısıyla Landsat ETM+ görüntüsünün sınıflandırılmasında optimum
Sınıflandırma Doğruluğu (%)
polinom derecesi 3 olarak belirlenmiştir.
91
90,05
88
85
82
79
76
1
2
3
4
5
7
9
Polinom Derecesi (d)
Şekil 4.5. Landsat ETM+ uydu görüntüsü için polinom derecesindeki (d)
değişimlerin sınıflandırma doğruluğuna etkisi.
Terra ASTER görüntüsü için bu parametredeki değişimlerin gösterildiği Şekil
4.6 incelendiğinde, 2. ve 3. dereceden bir polinom ile test verisi için yaklaşık %91
sınıflandırma doğruluğuna ulaşılmıştır. Özellikle 2. dereceden bir polinom ile en
yüksek sınıflandırma doğruluğuna ulaşıldığından Terra ASTER uydu görüntüsünün
sınıflandırılması için bu değer tercih edilmiştir.
Sınıflandırma Doğruluğu (%)
92
91,04
91
90
89
88
87
1
2
3
4
5
7
9
Polinom Derecesi
Şekil 4.6. Terra ASTER uydu görüntüsü için polinom derecesindeki (d) değişimlerin
sınıflandırma doğruluğuna etkisi.
103
Her iki uydu görüntüsünün polinom kernel ile sınıflandırılması için gerekli
parametrelerin belirlenmesinin ardından model oluşturulmuş ve sınıflandırma işlemi
gerçekleştirilerek Şekil 4.7’de gösterilen tematik haritalar elde edilmiştir. Genel
sınıflandırma sonuçları Tablo 4.2’den de görüleceği üzere Landsat ETM+ görüntüsü
için %90.05 ve Terra ASTER uydu görüntüsü için %91.04 olarak hesaplanmıştır.
Tablo 4.2. Polinom kernel fonksiyonu için belirlenen en uygun parametre değerleri
ve elde edilen genel sınıflandırma doğrulukları
Landsat ETM+
Terra ASTER
C= 890; d= 3
C= 1000; d= 2
Genel Doğruluk (%)
Kappa Değeri
Genel Doğruluk (%)
Kappa Değeri
90.05
0.88
91.04
0.89
(a)
(b)
Şekil 4.7. Polinom kernel fonksiyonu kullanılarak elde edilen tematik haritalar. (a)
Landsat ETM+ görüntüsü, (b) Terra ASTER görüntüsü.
104
4.4.3.2.2. Radyal Tabanlı Kernel Fonksiyonu ile Sınıflandırma
Radyal tabanlı fonksiyon kerneli kullanımında kullanıcı tarafından belirlenmesi
gereken iki parametre söz konusudur. Bunlardan ilki düzenleme parametresi olarak
ifade edilen C, diğeri ise gama γ parametresidir. Herhangi bir sınıflandırma
probleminde hangi C ve γ değerinin en iyi sonuç vereceği bilinmemektedir. Bu
nedenle
en
uygun
parametrelerin
belirlenmesi
gerekmektedir.
En
uygun
parametrelerin belirlenmesiyle amaç en iyi sınıflandırma sonucunu verecek
parametre çiftini (C, γ ) belirlemektir. Radyal tabanlı fonksiyon için gerekli olan bu
parametreler eğitim ve test verileri kullanılarak çapraz geçerlilik yöntemi ile
belirlenmiştir.
Landsat ETM+ uydu görüntüsünün RTF kernel ile sınıflandırılması için
belirlenmesi gereken düzenleme parametresi C’deki değişimlerin sınıflandırma
doğruluğuna etkisi Şekil 4.8’de gösterilmiştir. Şekilde C değerindeki artışlara karşılık
sınıflandırmaya esas olacak test veri seti için elde edilen genel sınıflandırma
doğruluğunun belirli bir parametreden sonra düşmeye başladığı görülmektedir. Bu
parametre değerlerinden test veri seti için en yüksek genel sınıflandırma doğruluğuna
ulaşılan 75 değeri düzenleme parametresi olarak belirlenmiştir.
Sınıflandırma Doğruluğu (%)
92
91
90,81
90
89
88
1
50
75
100
200
450
1000
5000
Düzenleme Parametresi (C)
Şekil 4.8. Landsat ETM+ uydu görüntüsü için düzenleme parametresi C’deki
değişimlerin sınıflandırma doğruluğuna etkisi.
105
Terra ASTER uydu görüntüsü için düzenleme parametresindeki değişimler ve
bu parametrelere karşılık gelen genel sınıflandırma doğrulukları Şekil 4.9’da
gösterilmiştir. Şekilde düzenleme parametrelerinden 245 değerinde test verisi için en
yüksek genel sınıflandırma doğruluğuna ulaşıldığı görülmektedir.
Sınıflandırma Doğruluğu (%)
94
92,81
93
92
91
90
10
50
100
150
200
245
250
270
350
500 1000 5000
Düzenleme Parametresi (C)
Şekil 4.9. Terra ASTER uydu görüntüsü için düzenleme parametresi C’deki
değişimlerin sınıflandırma doğruluğuna etkisi.
RTF kernel kullanımında düzenleme parametresinin yanında kernel genişliği
olarak ifade edilen gama ( γ ) parametresinin de belirlenmesi gereklidir. Her iki uydu
görüntüsü için oluşturulan eğitim ve test veri setleri kullanılarak çapraz geçerlilik
yöntemi ile bu parametreler ve parametre değişimlerinin genel sınıflandırma
doğruluğuna etkileri incelenmiştir.
Landsat ETM+ görüntüsünün RTF kernel ile sınıflandırılmasında seçilecek
gama ( γ ) parametreleri ve bu parametrelerin seçilmesi durumunda test veri seti için
elde edilecek genel sınıflandırma doğrulukları Şekil 4.10’da gösterilmiştir. Şekilde
gama parametresindeki artışın test seti için elde edilen sınıflandırma doğruluğunu
%90 seviyelerinde değiştirdiği görülmektedir. Gama parametresi 3 değerini aldığında
en yüksek genel sınıflandırma doğruluğuna ulaşıldığından, RTF kernel ile Landsat
ETM+ görüntüsünün sınıflandırılmasında değer kullanılmıştır.
106
Sınıflandırma Doğruluğu (%)
91,5
91,0
90,81
90,5
90,0
89,5
1
2
3
4
5
7
9
Gamma Parametresi
Şekil 4.10. Landsat ETM+ uydu görüntüsü için gama parametresindeki ( γ )
değişimlerin sınıflandırma doğruluğuna etkisi.
RTF kernel ile sınıflandırılacak diğer uydu görüntüsü içinde bu parametrenin
belirlenmesi gerekmektedir. Bu amaçla Terra ASTER görüntüsü için hazırlanan
eğitim ve test verileri kullanılarak, RTF kernel için en uygun gama ( γ ) parametresi
belirlenmiştir. Şekil 4.11’den görüleceği üzere özellikle gama parametresi 1
olduğunda test veri seti için en yüksek sınıflandırma doğruluğunun elde edildiği
görülmektedir. Şekilde, gama parametresinin aldığı yüksek değerlerin genel
sınıflandırma doğruluğunda düşüşlere neden olduğu görülmektedir.
Sınıflandırma Doğruluğu (%)
94
93
92,81
92
91
90
89
0,5
1,0
1,5
2,0
3,0
5,0
7,0
9,0
Gamma Parametresi
Şekil 4.11. Terra ASTER uydu görüntüsü için gama parametresindeki ( γ )
değişimlerin sınıflandırma doğruluğuna etkisi.
107
RTF
kernel
ile
sınıflandırma
işlemi
için
en
uygun
parametrelerin
belirlenmesinin ardından her iki veri seti için modeller oluşturulmuş ve görüntülerin
sınıflandırılması işlemi tamamlanmıştır. Her iki görüntü için belirlenen optimum
RTF kernel parametreleri ve elde edilen genel sınıflandırma doğrulukları Tablo
4.3’de gösterilmiştir. Sınıflandırma sonucu oluşturulan her iki görüntüye ait tematik
haritalar ise Şekil 4.12’de gösterilmiştir.
Tablo 4.3. Radyal Tabanlı Fonksiyon Kerneli için belirlenen en uygun parametre
değerleri ve elde edilen genel sınıflandırma doğrulukları.
Landsat ETM+
Terra ASTER
C= 75; γ = 3
C= 245; γ = 1
Genel Doğruluk (%)
Kappa Değeri
Genel Doğruluk (%)
Kappa Değeri
90.81
0.89
92.81
0.91
(a)
(b)
Şekil 4.12. Radyal Tabanlı kernel fonksiyonu kullanılarak elde edilen tematik
haritalar. (a) Landsat ETM+ görüntüsü, (b) Terra ASTER görüntüsü.
108
4.4.3.2.3. Pearson VII Fonksiyonu ile Sınıflandırma
Karl Pearson (1985) tarafından geliştirilmiş olan Pearson VII fonksiyonu
(PUK) ilk olarak X-ray ışınlarındaki dağılmaları belirlemek için kullanılmıştır. Üstün
et al., (2006) bu fonksiyonu genelleştirerek kernel fonksiyonu olarak kullanımını
ortaya koymuşlardır. Bu fonksyon ile yapılacak sınıflandırma öncesinde kullanıcı
tarafından belirlenmesi gereken üç parametre vardır. Bu parametreler; düzenleme
parametresi (C), Pearson genişliği olarak ifade edilen omega ( ω ) ve sigma ( σ )
parametreleridir. Bu parametrelerden omega ( ω ) parametresinin 0.25–0.75 değer
aralığında doğrusal fonksiyon; 0.5 değeri için RTF kernel veya yüksek dereceli
polinom kerneli gibi davranış sergilediğini, bunu yanında 1 değerini için Gauss ve
Lorentzian tepe noktasına ulaştığı ifade edilmektedir. Üstün et al. (2006) yapılan
çalışmada, sigma ( σ ) parametresindeki artışların omega parametresinde azalmaya
neden olacağını dolayısıyla doğrusal fonksiyondan radyal tabanlı fonksiyona doğru
bir geçiş söz konusu olacağını ifade etmişlerdir. Yine aynı çalışmada omega ( ω )
parametresinin sonuç model üzerindeki etkisinin daha az olduğu ifade edilmiştir.
Çalışmada
Pearson
VII
fonksiyonu
(PUK)
ile
her
iki
görüntünün
sınıflandırılmasından önce kullanıcı tarafından belirlenmesi gereken bu üç parametre
( C ,ω ,σ ) eğitim ve test verileri kullanılarak çapraz geçerlilik yöntemiyle
belirlenmiştir. Landsat ETM+ görüntüsü için eğitim ve test verileri ile yapılan çapraz
geçerlilik sonucundan omega ( ω ) ve sigma ( σ ) parametreleri için 1 değerinin en
uygun sonuçları verdiği görülmüştür. Düzenleme parametreleri (C) ve bunlara
karşılık genel sınıflandırma doğrulukları Şekil 4.13’da gösterilmiştir. Şekilde farklı
parametre değerleri ile test verisi için %89–91 aralığında genel sınıflandırma
doğruluğuna ulaşıldığı görülmektedir. Düzenleme parametrelerinden 245 değeri ile
en yüksek genel sınıflandırma doğruluğuna ulaşıldığından model oluşumunda bu
değer kullanılmıştır.
109
Sınıflandırma Doğruluğu (%)
92,0
91,0
90,90
90,0
89,0
10
100
200
245
400
600
1000
5000
Düzenleme Parametresi (C)
Şekil 4.13. Landsat ETM+ uydu görüntüsü için düzenleme parametresindeki
(C) değişimlerin sınıflandırma doğruluğuna etkisi.
Terra ASTER görüntüsünün PUK fonksiyonu ile sınıflandırılması için gerekli
parametrelerden sigma ( σ ) için 0.6 ve omega için ( ω ) 1 değerinin en uygun
parametreler
olduğu
eğitim
ve
test
verileriyle
belirlenmiştir.
Düzenleme
parametresinin (C) alacağı farklı değerler için değişik genel sınıflandırma
doğrulukları elde edilmiştir. Bu değişimlerin gösterildiği Şekil 4.14’de düzenleme
parametresinin 35 değeri için en yüksek genel sınıflandırma doğruluğunun elde
edildiği görülmektedir.
Sınıflandırma Doğruluğu (%)
93
92
92,15
91
90
10
35
70
150
300
750
5000
Düzenleme Parametresi (C)
Şekil 4.14. Terra ASTER uydu görüntüsü için düzenleme parametresindeki (C)
değişimlerin sınıflandırma doğruluğuna etkisi.
110
Pearson VII fonksiyonu için en uygun parametreler ayrı ayrı belirlendikten
sonra her iki uydu görüntüsü için modeller oluşturulmuş ve sınıflandırma işlemi
gerçekleştirilmiştir. En uygun parametreler ve bu parametrelerin kullanımı ile elde
edilen genel sınıflandırma doğrulukları Tablo 4.4’te gösterilmiştir.
Tablo 4.4. Pearson VII fonksiyonu için belirlenen en uygun parametre değerleri ve
elde edilen genel sınıflandırma doğrulukları.
Landsat ETM+
Terra ASTER
C= 245; ω = 1; σ = 1
C= 35; ω = 1; σ = 0.6
Genel Doğruluk (%)
Kappa Değeri
Genel Doğruluk (%)
Kappa Değeri
90.90
0.89
92.15
0.90
Her iki görüntünün PUK fonksiyonu kullanılarak sınıflandırılmasında en uygun
parametre değerleri ile oluşturulan modellerin tüm görüntüye uygulanması
sonucunda elde edilen tematik haritalar Şekil 4.15’te gösterilmiştir.
(a)
(b)
Şekil 4.15. PUK fonksiyonu kullanılarak elde edilen tematik haritalar. (a) Landsat
ETM+ görüntüsü, (b) Terra ASTER görüntüsü.
111
4.4.3.3. Karar Ağaçları İle Sınıflandırma
Ağaç yapılarının oluşturulmasında kullanılan kuralların anlaşılabilir ve sade
olması, karar ağacı sınıflandırma yönteminin yaygın olarak kullanılmasını
sağlamıştır. Yöntem çok karışık bir sınıflandırma problemini çok aşamalı bir hale
getirerek basit bir karar verme işlemi gerçekleştirir [Safavian and Landgrebe, 1991].
4.4.3.3.1. C4.5 Karar Ağacı Algoritması ile Sınıflandırma
Ağaç oluşumunun her bir aşamasında kullanılan değişkenlerin sayısına bağlı
olarak tek değişkenli veya çok değişkenli karar ağacı yapıları mevcuttur [Friedl and
Brodley,
1997].
Tek
değişkenli
karar
ağaçları
genellikle
arazi
örtüsü
sınıflandırmalarında kullanılan ağaç yapılarıdır [DeFries et al. 1998, Hansen et al.
2000]. Tek değişkenli karar ağaçlarından bölünme bilgisi kavramı ile bilgi
kazancından yararlanarak hesaplanan kazanç oranı yaklaşımını kullanan C4.5
gelişmiş bir karar ağacı oluşturma algoritmasıdır [Quinlan, 1993]. C4.5 algoritması
ile karar ağaçlarının oluşturulmasındaki en önemli adım ağaçtaki dallanmanın hangi
kritere veya kıstasa göre yapılacağı ya da hangi öznitelik değerlerine göre ağaç
yapısının oluşturulacağıdır.
Karar ağacı oluşturulmasında diğer önemli bir husus oluşturulan ağacın
budanması işlemidir [Özkan, 2008; Pal, 2002]. Budama ile karar ağacının
sınıflandırma
doğruluğunu
etkilemeyen
veya
katkısı
olmayan
kısımlarının
çıkarılması işlemi gerçekleştirilir. Böylece daha az karmaşık ve daha anlaşılabilir bir
ağaç elde edilir. Daha basit bir ağaç oluşturulması için karar ağacı sınıflandırıcısının
düzenlenmesinde kullanılan iki yöntem vardır [Breiman et al., 1984; Mingers, 1989].
Bunlardan ilki eğitim setinin daha ileriye bölünüp bölünmemesine karar verilen ön
budama, diğeri ağaç yapısının budama yapılmaksızın oluşturulduğu daha sonra
budamaların yapıldığı son budama yöntemleridir. C4.5 algoritmasının kullandığı ön
budama yöntemi daha az hesaplama içermesi, veri setinin ayrılması için en iyi yolu
araştırması gibi önemli avantajlara sahiptir [Breiman et al., 1984].
112
Çalışmada, Landsat ETM+ ve Terra ASTER uydu görüntülerinin karar ağacı
sınıflandırma yöntemi ile sınıflandırılması işlemi tek değişkenli karar ağacı
algoritmalarından C4.5 ile gerçekleştirilmiştir. Karar ağacının oluşumunda
dallanmaya esas olacak özniteliklerin seçiminde kazanç oranı kriteri hesaplamalarda
kullanılmıştır. Karar ağaçları ilk önce budama işlemine tabi tutulmadan oluşturulmuş
ve elde edilen modellerin genelleştirme kabiliyeti her iki görüntü için test edilmiştir.
Her iki veri seti için oluşan ağaç yapılarına ait bilgiler ve elde edilen genel
sınıflandırma doğrulukları Tablo 4.5’te gösterilmiştir. Tablodan da görüldüğü üzere
budama yapılmadan oluşturulan 324 yaprak ve 627 daldan oluşan KA modeli ile
birlikte Landsat ETM+ görüntüsü için genel sınıflandırma doğruluğu yaklaşık %87
olarak hesaplanmıştır. Aynı şekilde budama yapılmaksızın 289 yaprak ve 577 daldan
oluşan KA modeli ile birlikte Terra ASTER görüntüsü için genel sınıflandırma
doğruluğu yaklaşık %88 olarak hesaplanmıştır.
Tablo 4.5. Landsat ETM+ ve Terra ASTER görüntülerin budama yapılmaksızın
oluşturulan karar ağaçları ile sınıflandırılması ile elde edilen sonuçlar.
Landsat ETM+
Terra ASTER
Ağaçtaki Yaprak Sayısı
324
289
Ağaçtaki Dal Sayısı
627
577
Genel Sınıflandırma Doğruluğu (%)
87.14
87.55
Kappa
0.84
0.85
Budama yapılmaksızın oluşturulan karar ağacı modellerinin sadeleştirilmesi ve
elde edilen genel sınıflandırma doğruluğunun arttırılması amacıyla ön budama
yöntemi ve budama sırasındaki hataların tahmini için karamsar budama tekniğinden
yararlanılmıştır. Ön budama yöntemi ile gerçekleştirilecek sınıflandırma öncesinde
eşik değeri parametresinin belirlenmesi gerekmektedir. Eşik değeri, budama
sırasında ulaşılan bir noktadan daha ileriye ayrım yapılıp yapılmayacağının
değerlendirilmesi için kullanılır. Bu değerlendirmede ulaşılan noktada elde edilen
hata bu eşik değerinin altına düştüğünde bölünme kabul edilmez ve ulaşılan bu
noktanın veri için en uygun yaprak olduğuna karar verilir (Breiman et al., 1984).
Landsat ETM+ görüntüsü için oluşturulan KA modelinde eşik değeri 0.10, Terra
ASTER görüntüsü için oluşturulan KA modelinde eşik değeri 0.45 olarak
113
belirlenmiştir. Her iki veri seti için oluşturulan KA modellerine ait bilgiler ve elde
edilen genel sınıflandırma doğrulukları Tablo 4.6’da gösterilmiştir. Budama
sonucunda oluşan modeller ile yapılan sınıflandırma sonucunda Landsat ETM+
görüntüsü için genel sınıflandırma doğruluğu %87.62 ve Terra ASTER görüntüsü
için %87.95 olarak hesaplanmıştır.
Tablo 4.6. Landsat ETM+ ve Terra ASTER görüntülerin ön budama yöntemiyle
oluşturulan karar ağaçları ile sınıflandırılması ile elde edilen sonuçlar.
Landsat ETM+
Terra ASTER
Ağaçtaki Yaprak Sayısı
138
257
Ağaçtaki Dal Sayısı
275
513
Genel Sınıflandırma Doğruluğu (%)
87.62
87.95
Kapa
0.84
0.85
Landsat ETM+ görüntüsü için budama öncesi ve sonrası oluşan ağaç modelleri
Şekil 4.16’de görülmektedir. Bu iki ağaç modeli karşılaştırıldığında Tablo 4.5 ve
4.6’da görüldüğü üzere özellikle Landsat ETM+ görüntüsü için budama sonrasında
oluşan KA modelindeki yaprak sayısında yaklaşık %58, dal sayısında ise %56’lık bir
azalma görülmektedir. Buna karşılık genel sınıflandırma doğruluğunda yaklaşık
%0.6’lık bir artış görülmektedir. Her iki tablo incelendiğinde Terra ASTER
görüntüsü için budama yapılarak oluşturulan KA modelindeki yaprak ve dal
sayısında yaklaşık olarak %11’lik bir azalma görülürken, genel sınıflandırma
doğruluğunda %0.5’lik bir iyileşme olduğu görülmektedir. Şekil 4.16 (a)’da
görüleceği üzere C4.5 algoritması ile oluşturulan ağaç yapısı, budama işlemi
sonrasında Şekil 4.16(b)’de gösterilen daha basit ve sadeleşmiş bir ağaç yapısı halini
almıştır. Budama sonucu elde edilen modelle yapılacak eğitim için gereken zaman
azalırken, oluşturulan ağaç yapısının testi sonucunda elde edilen sınıflandırma
doğruluğunda yaklaşık %1’lik bir iyileşme gözlemlenmiştir. Budanmış C4.5
algoritması ile elde edilen modeller kullanılarak Landsat ETM+ ve Terra ASTER
uydu görüntüleri sınıflandırılarak Şekil 4.17’de gösterilen tematik haritalar
oluşturulmuştur.
114
(a)
(b)
Şekil 4.16. Landsat ETM+ görüntüsünün sınıflandırılması için (a) budama öncesi, (b)
budama sonrası oluşturulan modeller.
(a)
(b)
Şekil 4.17. C4.5 algoritması ve ön budama yöntemiyle oluşturulan tematik haritalar.
(a) Landsat ETM+ görüntüsü, (b) Terra ASTER görüntüsü.
115
4.4.3.3.2. Karar Ağacı İyileştirme Algoritmaları ile
Sınıflandırma
Karar ağacı oluşturulmasında kullanılan C4.5 algoritmasının performansını
arttırmaya yönelik olarak hızlandırma, torbalama, çoklu hızlandırma, rastgele orman
ve DECORATE iyileştirme algoritmaları kullanılmıştır. Her bir iyileştirme
yönteminde C4.5 algoritması temel sınıflandırıcı olarak kullanılmış ve Landsat
ETM+ ve Terra ASTER uydu görüntüleri için oluşturulan eğitim ve test verileri
kullanılarak her bir algoritma için modeller oluşturulmuştur.
4.4.3.3.2.1. Hızlandırma Algoritması İle Sınıflandırma
Literatürde hızlandırma algoritmalarından en çok kullanılanı Adaboost
algoritmasıdır [Freund and Schapire, 1996]. Bu algoritma birleşmeye esas olan
sınıflandırıcıların ağırlıklı örnekleri kullanabileceğini kabul etmektedir. Adaboost
algoritması kullanımında önceden belirlenmesi gereken en önemli parametre
gerçekleştirilecek iterasyon sayısıdır. Şekil 4.18 ve 4.19’te Landsat ETM+ ve Terra
ASTER görüntüleri için oluşturulacak modellerde seçilecek farklı iterasyon sayıları
ve test verisi için elde edilen genel sınıflandırma doğrulukları gösterilmiştir. Landsat
ETM+ görüntüsü için eğitim ve test verileri kullanılarak en uygun iterasyon sayısı 60
olarak belirlenmiş ve oluşturulan modelin test verisine uygulanması ile yaklaşık %90
Sınıflandırma Doğruluğu (%)
sınıflandırma doğruluğuna ulaşılmıştır.
90,0
89,5
89,6
89,0
88,5
88,0
10
20
30
40
50
60
65
70
80
90 100
İterasyon Sayısı
Şekil 4.18. Landsat ETM+ için oluşturulacak modelde seçilecek iterasyon sayısı ve
elde edilen sınıflandırma doğrulukları.
116
Şekil 4.19 incelendiğinde Terra ASTER uydu görüntüsü için iterasyon sayısının
70 seçilmesi ile elde edilen genel sınıflandırma doğruluğunun %92 olduğu
görülmektedir. Optimum parametrelerle oluşturulan modeller kullanılarak uydu
Sınıflandırma Doğruluğu (%)
görüntüleri sınıflandırılmış ve tematik haritalar oluşturulmuştur (Şekil 4.20).
93
92
92
91
90
89
10
20
30
40
50
60
70
80
90
100
İterasyon Sayısı
Şekil 4.19. Terra ASTER için oluşturulacak modelde seçilecek iterasyon sayısı ve
elde edilen sınıflandırma doğrulukları.
(a)
(b)
Şekil 4.20. Hızlandırma Algoritması ile elde edilen tematik haritalar. (a) Landsat
ETM+ görüntüsü, (b) Terra ASTER görüntüsü.
117
4.4.3.3.2.2. Torbalama Algoritması İle Sınıflandırma
İyileştirme
algoritmalarından
sınıflandırıcıların
birleştirilmesi
amacıyla
geliştirilen diğer bir yöntem torbalama yöntemidir. Bu yöntem eğitim setinin rastgele
bir şekilde yeniden oluşturulması ile ayrı ayrı her bir sınıflandırıcının eğitiminin
gerçekleştirilmesi esasına dayanmaktadır. Torbalama algoritması ile oluşturulacak
modelde kullanıcı tarafından belirlenen iki parametre vardır. Bunlar torba boyutu ve
gerçekleştirilecek iterasyon sayısıdır. Bu parametrelerden torba boyutu her iki veri
seti içinde 100 olarak belirlenmiştir. Kullanıcı tarafından belirlenen iterasyon sayısı
her iki veri seti için farklı değerler almıştır. Landsat ETM+ görüntüsü için
oluşturulacak modelde seçilecek iterasyon sayıları ve bu değerlere karşılık gelen
sınıflandırma doğrulukları Şekil 4.21’te gösterilmiştir. Şekilde iterasyon sayısının
50–70 aralığında seçilmesi durumunda yaklaşık %89 genel sınıflandırma
doğruluğuna ulaşıldığı görülmektedir. Landsat ETM+ görüntüsünün sınıflandırılması
için oluşturulacak model için iterasyon sayısı olarak bu aralıkta en yüksek
Sınıflandırma Doğruluğu (%)
sınıflandırma doğruluğuna (%89.10) ulaşılan 65 değeri kullanılmıştır.
90,0
89,5
89,0
89,10
88,5
88,0
10
20
30
40
50
60
65
70
80
90
100
İterasyon Sayısı
Şekil 4.21. Landsat ETM+ için oluşturulacak modelde seçilecek iterasyon sayısı ve
elde edilen sınıflandırma doğrulukları.
Aynı şekilde, Terra ASTER görüntüsü için iterasyon sayısı eğitim ve test
verileri ile kullanılarak belirlenmiş ve iterasyon sayısındaki değişimlere karşılık elde
edilen genel sınıflandırma doğrulukları Şekil 4.22’de gösterilmiştir. Şekil
118
incelendiğinde iterasyon sayısının 70 olarak seçilmesiyle en yüksek genel
sınıflandırma doğruluğuna (%89.70) ulaşıldığı görülmektedir. Belirlenen optimum
parametrelerle modeller oluşturularak her iki görüntü sınıflandırılmış ve Şekil
Sınıflandırma Doğruluğu (%)
4.23’de gösterilen tematik haritalar elde edilmiştir.
90,0
89,5
89,7
89,0
88,5
88,0
10
20
30
40
50
60
70
80
90
100
İterasyon Sayısı
Şekil 4.22. Terra ASTER için oluşturulacak modelde seçilecek iterasyon sayısı ve
elde edilen sınıflandırma doğrulukları.
(a)
(b)
Şekil 4.23. Torbalama yöntemiyle elde edilen tematik haritalar. (a) Landsat ETM+
görüntüsü, (b) Terra ASTER görüntüsü.
119
4.4.3.3.2.3. Çoklu Hızlandırma Algoritması İle Sınıflandırma
Çoklu hızlandırma algoritması hızlandırma ve torbalama algoritmalarının
belirli özelliklerinin bir algoritmada toplanarak daha güçlü bir iyileştirme yöntemi
oluşturulması esasına dayanmaktadır. Bu nedenle çoklu hızlandırma algoritması
hızlandırma ve torbalama algoritmalarının birleşimi gibi düşünülebilir. Bu algoritma
ile oluşturulacak modelde kullanıcı tarafından belirlenen üç parametre mevcuttur. Bu
parametreler ağırlıklı eşik değeri, alt komitelerin sayısı ve gerçekleştirilecek
iterasyon sayısıdır. Bu parametrelerden ağırlıklı eşik değeri her iki veri seti içinde
100 olarak belirlenmiştir. Kullanıcı tarafından belirlenen iterasyon sayısı ve alt
komite sayısı her iki veri seti için farklı değerler almıştır. Landsat ETM+
görüntüsünün çoklu hızlandırma algoritması ile sınıflandırılmasında kullanılacak
model için alt komite sayısındaki değişimler ve bu parametre değerlerine karşılık
gelen sınıflandırma doğrulukları Şekil 4.24’te gösterilmektedir. Bu parametre
değerlerinden en yüksek sınıflandırma doğruluğuna ulaşılan 3 alt komite sayısı
Sınıflandırma Doğruluğu (%)
model oluşumunda kullanılmıştır.
91,0
90,5
90,0
89,5
89,9
89,0
88,5
88,0
1
2
3
4
5
6
7
8
9
10
20
50
Alt Komite Sayısı
Şekil 4.24. Landsat ETM+ için alt komitelerin sayısı ve sınıflandırma doğrulukları.
Çoklu hızlandırma algoritması ile oluşturulacak model için kullanıcı tarafından
belirlenmesi gereken iterasyon sayısı Landsat ETM+ için oluşturulan eğitim ve test
verileri kullanılarak belirlenmiştir. Şekil 4.25’de iterasyon sayısındaki değişimler ve
bu değişimlere karşılık hesaplanan genel sınıflandırma doğrulukları görülmektedir.
120
Bu parametre değerleri arasında Landsat ETM+ görüntüsünün sınıflandırılması için
çoklu hızlandırma yöntemi ile oluşturulacak modelde kullanılmak üzere en yüksek
Sınıflandırma Doğruluğu (%)
sınıflandırma doğruluğunun elde edildiği 36 değeri kullanılmıştır.
90,50
90,00
89,90
89,50
89,00
88,50
10
20
30
35
36
37
40
50
60
70
80
100
İterasyon Sayısı
Şekil 4.25. Landsat ETM+ için iterasyon sayısı ve sınıflandırma doğrulukları.
Sınıflandırma Doğruluğu (%)
93
92
92,07
91
90
89
1
2
3
4
5
6
7
8
9
10
20
50
Alt Komitelerin Sayısı
Şekil 4.26. Terra ASTER için oluşturulacak modelde seçilecek alt komitelerin sayısı
ve elde edilen sınıflandırma doğrulukları.
Şekil 4.26’da Terra ASTER görüntüsü için oluşturulacak modelde kullanılmak
üzere seçilecek alt komite sayısı ve bu değerlere karşılık gelen sınıflandırma
doğrulukları gösterilmektedir. Şekilde 1–10 aralığında seçilecek parametre
121
değerleriyle yaklaşık %91’in üzerinde genel sınıflandırma doğruluğuna ulaşılacağı
görülmektedir. Bu değerler arasında alt komite sayısı 9 değerini aldığında en yüksek
sınıflandırma doğruluğuna (%92.07) ulaşılmıştır.
Bunun yanında iterasyon sayısındaki ve bu değerlere karşılık elde edilen genel
sınıflandırma doğruluğundaki değişimler Şekil 4.27’de gösterilmiştir. Şekilden de
görüleceği üzere Terra ASTER görüntüsünün sınıflandırılması için oluşturulacak
modelde iterasyon sayısı en yüksek sınıflandırma doğruluğuna ulaşılan değer olan 87
olarak belirlenmiştir.
Sınıflandırma Doğruluğu (%)
93
92
92,07
91
90
89
88
10
20
30
40
50
60
70
80
87
90
100
İterasyon Sayısı
Şekil 4.27. Terra ASTER için oluşturulacak modelde seçilecek iterasyon sayısı ve
elde edilen sınıflandırma doğrulukları.
Belirlenen en uygun parametrelerle kullanılarak modeller oluşturulmuş ve her
iki görüntünün sınıflandırılması yapılarak Şekil 4.28’de gösterilen tematik haritalar
elde edilmiştir.
122
(a)
(b)
Şekil 4.28. Çoklu hızlandırma algoritması ile elde edilen tematik haritalar. (a)
Landsat ETM+ görüntüsü, (b) Terra ASTER görüntüsü.
4.4.3.3.2.4. Rastgele Orman Algoritması İle Sınıflandırma
Rastgele orman algoritması birçok karar ağacından meydana gelen ve
torbalama yöntemiyle rastgele özellik seçiminin birleşimi olarak ifade edilen bir
sınıflandırma algoritmasıdır. Rastgele orman algoritmasında ağaç oluşumu için her
bir düğümde kullanılan özelliklerin sayısı ve ağaç sayısı kullanıcı tarafından
belirlenmesi gereken parametrelerdir. Her bir düğümde en iyi bölünme için yalnızca
seçilen özellikler araştırılır. Bu nedenle rastgele orman sınıflandırıcısı kullanıcı
tarafından belirlenen N sayıda ağaçtan oluşmaktadır. Rastgele orman sınıflandırıcısı
için kullanıcı tarafından belirlenmesi gereken parametreler için eğitim ve test verileri
kullanılarak
denemeler
gerçekleştirilmiştir.
Landsat
ETM+
görüntüsü
için
özelliklerin sayısına göre ve ağaç sayısına göre elde edilen genel sınıflandırma
doğrulukları Şekil 4.29 ve 4.30’de gösterilmiştir. Her iki şekilden de görüleceği
üzere Landsat ETM+ için rastgele orman algoritması ile oluşturulacak modelde her
bir düğümdeki özellik sayısı 3 ve ağaç sayısı 58 olarak belirlenmiştir. Bu parametre
123
değerleri ile oluşturulan modelin test edilmesi sonucunda elde edilen genel
sınıflandırma doğruluğu %89.10 olarak hesaplanmıştır.
Sınıflandırma Doğruluğu (%)
89,50
89,29
88,95
89,04
89,00
89,00
88,76 88,70
88,89
88,82
88,80 88,85
88,50
88,00
1
2
3
4
5
6
7
8
9
10
Özellik Sayısı
Şekil 4.29. Landsat ETM+ görüntüsü için çeşitli sayıdaki özellikler ile genel
sınıflandırma doğruluğundaki değişimler.
Sınıflandırma Doğruluğu (%)
90
89,3
88
86
84
82
1
5
20
40
55
60
80
100
500
Ağaç Sayısı
Şekil 4.30. Landsat ETM+ görüntüsü için üç özellik kullanılarak oluşturulacak ağaç
sayıları ile genel sınıflandırma doğruluğundaki değişimler.
Rastgele orman algoritması kullanılarak Terra ASTER görüntüsünün
sınıflandırılması için oluşturulacak model için de eğitim ve test verileri kullanılarak
en uygun ağaç sayısı ve her bir düğümdeki özellik sayısı parametreleri belirlenmiştir.
Şekil 4.31 Terra ASTER için oluşturulacak model için seçilecek özellik sayılarını ve
124
bunlara karşılık elde edilecek genel sınıflandırma doğruluklarını göstermektedir.
Şekilden bu veri seti için her bir düğümde 2 özellik seçilmesi durumunda
oluşturulacak modelin test verisine uygulanması ile en yüksek sınıflandırma
Sınıflandırma Doğruluğu (%)
doğruluğuna (%91.19) ulaşıldığı görülmektedir.
92
91
91,19
91,11
90,81
90,67
90,52
91
89,93
89,78
90
89,41 89,48 89,48
90
89
89
1
2
3
4
5
6
7
8
9
10
Özellik Sayıları
Şekil 4.31. Terra ASTER görüntüsü için çeşitli sayıdaki özellikler ile genel
sınıflandırma doğruluğundaki değişimler.
Aynı şekilde her bir düğümde iki özellik olması durumunda ağaç sayısındaki
değişimler ve buna karşılık elde edilen genel sınıflandırma doğrulukları Şekil 4.32’de
gösterilmiştir. Şekilden Terra ASTER görüntüsü için oluşturulacak rastgele orman
modelde ağaç sayısını ifade eden parametrenin 82 seçilmesi durumunda en yüksek
sınıflandırma doğruluğu olan %91.2 değerine ulaşıldığı görülmektedir.
Sınıflandırma Doğruluğu (%)
94
92
91,2
90
88
86
84
82
1
5
20
40
60
80
85
100
500
Ağaç Sayısı
Şekil 4.32. Terra ASTER görüntüsü için her bir düğümde iki özellik ile oluşturulacak
ağaç sayıları ve genel sınıflandırma doğruluğundaki değişimler.
125
Rastgele orman algoritması ile yapılacak sınıflandırma öncesinde her iki veri
seti için en uygun parametre değerleri belirlenmesinin ardından modeller
oluşturulmuş ve her iki görüntü bu modellerle sınıflandırılarak Şekil 4.33’te
gösterilen tematik haritalar elde edilmiştir.
(a)
(b)
Şekil 4.33. Rastgele orman algoritması ile elde edilen tematik haritalar. (a) Landsat
ETM+ görüntüsü, (b) Terra ASTER görüntüsü.
4.4.3.3.2.5. DECORATE Algoritması İle Sınıflandırma
DECORATE
algoritmasında
ilk
önce
sınıflandırıcının
eğitim
işlemi
tamamlandığı ve sonra eğitim işlemi tamamlanan sınıflandırıcının birleştirmeye dahil
edildiği iteratif bir yöntemdir. Her bir iterasyonda sınıflandırıcılar bir takım yapay
verilerle birleştirilmiş orijinal eğitim verisi ile eğitilirler. Yapay olarak elde edilen
eğitim örneklerine ait öznitelik bilgileri ya da etiketler birleştirilme tahminlerinden
oluşturulur. Bu algoritma ile oluşturulacak model için kullanıcı tarafından
belirlenmesi gereken üç parametre mevcuttur. Bunlardan ilki algoritma tarafından
126
gerçekleştirilecek iterasyon sayısıdır. Her bir iterasyonda bir sınıflandırıcı
oluşturulur; ancak bu sınıflandırıcının birleşime dahil edilip edilmeyeceğine
sonradan karar verilir. DECORATE algoritması gerekli birleşme boyutuna
ulaştığında durur. Bu parametre aday sınıflandırıcıların sayısından büyük olmalıdır.
İkinci parametre eğitim sırasında kullanılan yapay örneklerin sayısını gösteren yapay
boyuttur. Bu parametre eğitim verilerinin bir oranı olarak belirlenir. Üçüncü
parametre ise DECORATE birleştirme algoritmasına dahil edilecek aday
sınıflandırıcıların sayısı olarak ifade edilen beklenen boyuttur. Algoritma önceden
belirlenen bu aday sayısına ulaşmadan da iterasyon sayısına bağlı olarak eğitim
işlemini tamamlayabilir. Melville and Money (2004), yaptıkları çalışmada aday
sayısının artmasıyla doğruluğun artacağını bununla birlikte daha karmaşık bir model
ortaya çıkacağından çözüm süresinin uzayacağını ifade etmişlerdir. Aynı çalışmada
yapay boyut parametresinin 0.5–1 arasında ve beklenen boyut parametresin de 10–25
aralığında alacağı değerler ile anlamlı sonuçlara ulaşılacağı ifade edilmiştir. Bu
bağlamda her iki veri seti için en uygun yapay boyut ve beklenen boyut parametre
değerleri eğitim ve test veri setleri kullanılarak belirlenmiştir. Yapılan değerlendirme
sonucunda her iki veri setinin sınıflandırılmasında kullanılacak DECORATE
modelleri için en uygun yapay boyut parametresi Landsat ETM+ görüntüsü için 1,
Terra ASTER için 0.5 olarak belirlenmiştir. Aynı şekilde eğitim ve test verileri
kullanılarak en uygun beklenen boyut parametresi değeri her iki görüntü içinde 10
olarak belirlenmiştir.
Gerekli modellerin oluşturulmasında kullanıcı tarafından
belirlenmesi gereken son parametre olan iterasyon sayısı her iki görüntü için
belirlenen en uygun yapay boyut ve beklenen boyut parametreleri kullanılarak
belirlenmiştir. Yapılan değerlendirme sonucunda Landsat ETM+ görüntüsü için
iterasyon sayısı 15 ve Terra ASTER görüntüsü için 30 olarak belirlenmiştir.
Her iki görüntü için DECORATE algoritması ile oluşturulacak modelde
kullanılmak üzere belirlenen en uygun parametre değerleri ve elde edilen genel
sınıflandırma doğrulukları Tablo 4.7’de gösterilmiştir. Tablodan da görüleceği üzere
en uygun parametre değerleri ile yapılan eğitim sonucu oluşturulan modeller ile her
iki görüntü için yaklaşık %89 genel sınıflandırma doğruluğu elde edilmiştir.
127
Tablo 4.7. DECORATE algoritması için belirlenen en uygun parametre değerleri ve
elde edilen genel sınıflandırma doğrulukları.
Landsat ETM+
*
Terra ASTER
Y.Boyut= 1; B. Boyut=10; İ.Sayısı= 15
*
Y.Boyut= 0.5; B.Boyut=10; İ.Sayısı= 30
Genel Doğruluk (%)
Kappa Değeri
Genel Doğruluk (%)
Kappa Değeri
89.10
0.87
89.11
0.88
*
Y.Boyut=Yapay Boyut; B.Boyut=Beklenen Boyut; İ.Sayısı=İterasyon sayısını
göstermektedir.
Oluşturulan ve geçerliliği test edilen modeller ile Landsat ETM+ ve Terra
ASTER görüntüleri sınıflandırılarak Şekil 4.34’te gösterilen tematik haritalar
oluşturulmuştur.
(a)
(b)
Şekil 4.34. DECORATE algoritması kullanılarak elde edilen tematik haritalar (a)
Landsat ETM+ görüntüsü (b) Terra ASTER görüntüsü
128
4.4.3.4. Yapay Sinir Ağları İle Sınıflandırma
Yapay sinir ağları (YSA) ile uydu görüntülerinin sınıflandırılmasında çok
katmanlı perseptron ağ yapılarından geriye yayılma öğrenme algoritması
kullanılmıştır. Kullanılan YSA geri yayılım algoritmasında giriş katmanı, kullanılan
her bir banda karşılık bir yapay nöron gelecek şekilde tasarlanmıştır. Bu yaklaşıma
göre 6 banttan oluşan Landsat ETM+ görüntüsü için 6 nöron, 9 bant içeren Terra
ASTER görüntüsü için 9 nöron tesis edilmiştir. Çıktı katmanı her iki görüntü içinde
arazi örtüsü sınıflarını temsil eden 6 sınıfın (su, yerleşim, toprak-taş, bozkır, iğne
yapraklı orman ve geniş yapraklı orman) her birine bir nöron gelecek şekilde tesis
edilmiştir. Çok katmanlı persptron ağ yapısında oluşturulacak ağdaki saklı katmanlar
ve bu katmanlardaki işlemci düğüm sayısı ağın genelleştirme kabiliyeti açısından
önemlidir ve girdi çıktı katmanları arasındaki saklı katman sayısı optimum olmalıdır
[Kavzoglu and Mather, 2001]. En uygun saklı katman sayısının belirlenmesinde
kesin bir yöntem olmamasına karşın, literatürde kullanılan bir takım yaklaşımlar
mevcuttur. Bu tez kapsamında Kanellopoulos and Wilkinson (1997) tarafından
önerilen, saklı katmanlardaki düğüm sayısının, sınıflandırılacak verideki bant
sayısının iki katı olarak belirlendiği yaklaşım kullanılmıştır. Bu yaklaşımla 6 bantlı
Landsat ETM+ görüntüsü için saklı katmanda 12 düğüm, 9 bantlı Terra ASTER
görüntüsü için 18 düğüm olarak belirlenmiştir. Sonuç olarak YSA ile eğitimde
Landsat ETM+ görüntüsü için 6–12–6; Terra ASTER görüntüsü için 9–18–6
katmanlı yapay sinir ağ yapısı kullanılmıştır. Kullanılacak ağ yapıları belirlenmesinin
ardından ağın eğitiminde kullanılacak en uygun ilk ağırlık parametreleri, öğrenme
parametreleri ve momentum oranları deneme yanılma yöntemiyle belirlenmeye
çalışılmıştır. Oluşturulan ağların eğitiminde ilk ağırlıklar –0.25 ile 0.25 arasında
aralığında seçilirken, eğitimin başlangıcında öğrenme oranı 0.3 ve momentum 0.5
olarak belirlenmiştir.
Farklı sayıda iterasyonlar sonucunda en uygun parametre değerleri belirlenmiş
ve bu parametre değerleriyle oluşturulan yapay sinir ağ modelleri kullanılarak
Landsat ETM+ ve Terra ASTER uydu görüntüleri sınıflandırılmıştır. Sınıflandırma
sonucu elde edilen tematik haritalar Şekil 4.35’de gösterilmiştir.
129
(a)
(b)
Şekil 4.35. Yapay sinir ağları kullanılarak elde edilen tematik haritalar. (a) Landsat
ETM+ görüntüsü, (b) Terra ASTER görüntüsü
4.4.3.5. K-Star Algoritması İle Sınıflandırma
Örnek tabanlı öğrenme algoritmalarından K-star algoritması pikseller
arasındaki benzerliğin belirlenmesi için entropik uzaklık fonksiyonu kullanılır. Bu
algoritma ile oluşturulacak model için kullanıcı tarafından belirlenmesi gereken tek
bir parametre vardır. Bu parametre harmanlama parametresi (b) olarak ifade edilir ve
0 ile 100 arasında değerler almaktadır. Cleary and Trig (1995), bu harmanlama
parametresinin 0 değeri alması durumunda en yakın komşuluk algoritması, 100
değerini aldığında ise örneklerin eşit ağırlıklı olduğu bir özellik gösterdiğini ifade
etmişlerdir. Landsat ETM+ ve Terra ASTER uydu görüntülerinin K-star algoritması
ile sınıflandırılması için oluşturulacak modelde en uygun harmanlama parametresinin
belirlenmesi amacıyla her iki veri seti için oluşturulan eğitim ve test veri setleri
kullanılmıştır.
130
Şekil 4.36’da Landsat ETM+ görüntüsü için oluşturulacak modelde
harmanlama parametresindeki değişimler ve bu parametre değerlerine karşılık gelen
genel sınıflandırma doğrulukları gösterilmektedir. Şekilden de görüleceği üzere
harmanlama parametresi için 1–30 aralığındaki değerler ile %88’ın üzerinde genel
sınıflandırma doğruluğu elde edilirken, bu aralıkta parametre değerinin 10 olduğunda
Sınıflandırma Doğruluğu (%)
oluşturulan model ile en yüksek sınıflandırma doğruluğuna (%89) ulaşılmıştır.
94
90
89,00
86
82
78
74
1
5
10
40
70
100
Harmanlama Parametresi (b)
Şekil 4.36. Landsat ETM+ görüntüsü için harmanlama parametresi ve genel
sınıflandırma doğruluğundaki değişimler.
Terra ASTER görüntüsü için harmanlama parametresindeki değişimler ve bu
değerlere karşılık gelen genel sınıflandırma doğrulukları Şekil 4.37’de gösterilmiştir.
Bu veri setinin sınıflandırılması için oluşturulacak K-star modelinde en yüksek
Sınıflandırma Doğruluğu (%)
sınıflandırma doğruluğunun (%91.41) elde edildiği parametre değeri 9 kullanılmıştır.
96
92
91,41
88
84
80
76
1
5
9
20
40
60
80
100
Harmanlama Parametresi (b)
Şekil 4.37. Terra ASTER görüntüsü için harmanlama parametresi ve genel
sınıflandırma doğruluğundaki değişimler.
131
K-star algoritması ile yapılacak sınıflandırma öncesi gerekli olan en uygun
parametrelerin belirlenmesinin ardından her iki görüntü için modeller oluşturulmuş
ve görüntüler sınıflandırılmıştır. Sınıflandırma sonucu çalışma alanını kapsayan 6
arazi örtüsünü gösteren Landsat ETM+ ve Terra ASTER uydu görüntülerine ait
tematik haritalar Şekil 4.38’de gösterilmiştir.
(a)
(b)
Şekil 4.38. K-star algoritması kullanılarak elde edilen tematik haritalar. (a) Landsat
ETM+ görüntüsü, (b) Terra ASTER görüntüsü.
132
5. SONUÇLAR
Uzaktan algılama teknolojileri geniş alanları görüntüleyebilme kabiliyetine
sahip olduğundan yeryüzü üzerindeki bilgilerin elde edilmesi amacıyla yapılan
uygulamalar için önemli bir veri kaynağıdır. Sınıflandırma sonucu elde edilen
tematik haritaların ve sınıflara ait bilgilerin güvenirliği sınıflandırmada kullanılacak
yöntem ve elde edilecek sınıflandırma doğruluğu ile ilişkilidir.
Bu çalışmada Landsat ETM+ ve Terra ASTER uydu görüntüleri tez
kapsamında ayrıntılı olarak incelenen ileri sınıflandırma teknikleri ile sınıflandırılmış
ve çalışma alanını temsil eden 6 arazi örtüsü sınıfını gösteren tematik haritalar elde
edilmiştir. Bu sınıflandırma yöntemlerinin yanında uygulamada yaygın kullanıma
sahip en çok benzerlik yöntemi ile görüntüler sınıflandırılmıştır. Şekil 5.1’de her iki
uydu görüntüsünün sınıflandırılmasında kullanılan yöntemler ve elde edilen genel
sınıflandırma doğrulukları gösterilmiştir.
Sınıflandırma Doğruluğu (% )
94
93
92
91
90
89
88
87
86
1
2
3
4
5
6
7
8
9
10
11
12
13
Landsat ETM+ 86,95 90,05 90,81 90,90 87,14 87,62 89,60 89,10 89,90 89,29 89,10 90,14 89,00
Terra ASTER
88,00 91,04 92,81 92,15 87,55 87,95 92,00 89,70 92,07 91,19 89,11 90,82 91,41
Sınıflandırma Yöntemleri
Şekil 5.1. Landsat ETM+ ve Terra ASTER görüntüsünün sınıflandırılmasında
kullanılan yöntemler ve elde edilen genel sınıflandırma doğrulukları. 1: En Çok
Benzerlik, 2: Polinom Kernel, 3: Radyal Tabanlı Kernel, 4: PUK, 5: C4.5, 6: C4.5
(Budanmış), 7: Hızlandırma, 8: Torbalama, 9: Çoklu Hızlandırma, 10. Rastgele
Orman, 11: DECORATE, 12: Yapay Sinir Ağları, 13: K-star.
133
En çok benzerlik sınıflandırıcısı literatürde geçerliliği kabul gören ve
günümüzde uzaktan algılama yazılımlarının içerisinde temel sınıflandırıcı olarak yer
alan bir kontrollü sınıflandırma yöntemidir. Matematiksel ifadesinin basit oluşu ve
sınıflandırma işlemini gerçekleştirmedeki hızı yöntemin uzaktan algılama alanındaki
araştırmacılar tarafından yaygın kullanımını ortaya çıkarmıştır. Ancak yöntemin bir
takım istatistiki kabuller gerektirmesi ve işlem sonucunda sınıflandırılamayan
piksellerin ortaya çıkması yöntemin sınıflandırma performansını etkilemektedir.
Şekil 5.1’den görüleceği üzere her iki uydu görüntüsünün sınıflandırılması
sonucunda ile elde edile en düşük genel sınıflandırma doğrulukları en çok benzerlik
yöntemiyle elde edilmiştir.
Kullanılan metotların veri setleri için aynı trendi göstermeleri yapılan
uygulamadaki sistematiğin doğruluğunun bir göstergesi olarak düşünülebilir.
Metotların birbirinden farklı veri setleri için yaklaşık olarak aynı performansı
gösterdiğinden, söz konusu yöntemlerin veriden bağımsız oldukları söylenebilir. Her
iki uydu görüntüsü için elde edilen genel sınıflandırma sonuçlarının gösterildiği şekil
incelendiğinde
kullanılan
yöntemler
arasında
destek
vektör
makinelerinin
sınıflandırma performansının diğerlerine göre daha yüksek olduğu görülmektedir.
Destek vektör makineleri sınıflar arasında en uygun hiper düzlemin belirlenmesi
prensibine dayalı bir öğrenme algoritmasıdır. Uzaktan algılanmış görüntülerde
olduğu gibi doğrusal olmayan ve ikiden fazla sınıfa ait verilerin sınıflandırılması
probleminin çözümünde kernel fonksiyonlarından yararlanmaktadır. Bu nedenle
kernel fonksiyonun seçimi ve seçilen kernel fonksiyonuna ait en uygun parametre
değerlerinin belirlenmesi yöntemin sınıflandırma performansı açısından önemlidir.
Tez kapsamında kullanılan kernel fonksiyonları (polinom, radyal tabanlı kernel ve
Pearson VII) Bölüm 4’te ayrı ayrı değerlendirilmiş ve sınıflandırma performansları
analiz edilmiştir. Kullanılan üç fonksiyon bir arada değerlendirildiğinde birkaç
önemli husus göze çarpmaktadır. Bunlardan ilki radyal tabanlı kernel ve Pearson VII
(PUK) fonksiyonları ile polinomal fonksiyona göre Landsat ETM+ görüntüsü için
yaklaşık %0.5 ve Terra ASTER görüntüsü için yaklaşık %2 daha iyi sınıflandırma
doğruluğuna ulaşılmıştır. İkinci olarak söz konusu kernel fonksiyonları için
sınıflandırma öncesinde kullanıcı tarafından belirlenmesi gereken parametrelerle
ilgili analizlerdir. Pearson VII fonksiyonu, radyal tabanlı kernel fonksiyonu ile yakın
sınıflandırma sonuçları üretmesine karşın sınıflandırma öncesinde üç farklı
134
parametrenin belirlenmesini gerektirmektedir. Bu parametrelerin sınıflandırma
doğruluğuna direkt etkileri olduğu düşünülürse en uygun parametre değerlerinin
belirlenmesi için gerekli süre artacaktır.
Radyal tabanlı kernel ve polinom kernel fonksiyonları kullanıcı tarafından
belirlenmesi gereken iki parametre değerine sahiptirler. Radyal tabanlı kernelin
gamma ve polinom kernel kullanılacak polinomun derecesi iki önemli parametredir.
Gama parametresinin sınıflandırma doğruluğu üzerindeki etkisinin polinomun
derecesine göre daha az olduğu gözlemlenmiştir. Polinom derecesi arttıkça
matematiksel olarak daha karmaşık bir fonksiyon elde edileceğinden hesaplama
zorluğu dolayısıyla çözüm için gerekli süre artmaktadır. Kernel fonksiyonları ile
ilgili elde edilen bu sonuçlar kernel fonksiyonu ve fonksiyona ait parametre
seçimlerinin DVM ile yapılacak sınıflandırma öncesinde dikkate alınması gereken
bir durum olduğunu göstermektedir.
Kernel parametre değerleri sınıflandırmaya esas olan veri setine göre değişiklik
gösterdiğinden en yüksek performansın hangi parametre çiftleri ile elde edileceği
önceden bilinmemektedir. Bu nedenle kernel fonksiyonu seçiminde, seçilecek
fonksiyona ait parametrelerin sınıflandırma performansına etkisi dikkate alınmalıdır.
Buna ek olarak en uygun parametrelerin belirlenmesi için kullanılacak yöntem diğer
önemli bir husustur. Tez kapsamında incelenen kernel fonksiyonları ile ilgili yapılan
analizler ışığında destek vektör makineleri ile yapılacak sınıflandırmada öncesinde
kernel fonksiyonu seçiminde öncelikli olarak radyal tabanlı kernelin tercih
edilebileceği sonucuna ulaşılmaktadır.
Karar ağaçları iş akışı şemalarına benzer yapılarıyla ifade edilmesi ve
anlaşılması kolay bir sınıflandırma yöntemidir. Karar ağacı oluşumunda en önemli
hususlardan biriside ağacın budanması işlemidir. Tez kapsamında kullanılan uydu
görüntüleri için C4.5 algoritması ile oluşturulan karar ağacının ön budama
yöntemiyle budanması ile ağaç yapısındaki yaparak ve dal sayısında Landsat ETM+
görüntüsü için yaklaşık %57 ve Terra ASTER görüntüsü için %11’lik bir sadeleşme
olmuştur. Budama ile elde edilen sadeleşmiş ve basitleşmiş bu modeller ile
sınıflandırma için gerekli süre azalmıştır. Bunun yanında budama ile elde edilen
135
modeller ile yapılan sınıflandırma sonuçlarında yaklaşık %1’lik bir iyileşme olduğu
görülmüştür.
Son yıllarda literatürde karar ağaçlarının sınıflandırma performansını
arttırmaya yönelik geliştirilen çeşitli iyileştirme algoritmaları mevcuttur. Tez
çalışmasında söz konusu iyileştirme algoritmalarından hızlandırma, torbalama, çoklu
hızlandırma, rastgele orman ve DECORATE algoritmaları kullanılarak C4.5 karar
ağacı algoritması ile elde edilen sınıflandırma performansındaki değişimler naliz
edilmiştir. Şekil 5.1’den de görüleceği üzere karar ağaçlarının tekil kullanımından
ziyade
bir
iyileştirme
algoritması
ile
kullanımı
sonucunda
sınıflandırma
performansında Landsat ETM+ görüntüsü için ortalama %2 ve Terra ASTER
görüntüsü için ortalama %3’lük iyileşmeler olmuştur. Kullanılan iyileştirme
algoritmaları da sınıflandırma öncesinde birtakım parametrelerin belirlenmesini
gerektirmektedir. Kullanılan algoritmalar arasında üç farklı parametreye sahip
DECORATE algoritması ile karar ağacı sınıflandırma performansında en düşük
iyileşme (yaklaşık %1) elde edilmiştir. Diğer algoritmalar kullanıcı tarafından
belirlenecek iki parametreye sahip olmakla beraber özellikle hızlandırma ve çoklu
hızlandırma algoritmaları ile sınıflandırma doğruluğunda yaklaşık %3’lük iyileşme
elde edilmiştir. Elde edilen sonuçlar budama yöntemleri kullanılarak sadeleştirilmiş
karar
ağaçlarının
bir
sınıflandırma
probleminin
çözümünde
tekil
olarak
kullanılmalarından ziyade bir iyileştirme algoritması kullanılmasının beklenen
sınıflandırma doğruluğunu olumlu yönde etkileyeceği söylenebilir.
Yapay sinir ağları (çok katmanlı perseptron) literatürde uzaktan algılanmış
görüntülerin sınıflandırılmasında kullanılan parametrik olmayan bir yapıya sahip,
güçlü ve etkili bir sınıflandırıcıdır. YSA yapıları itibariyle karmaşık ve matematiksel
olarak ifadesi zor olan bir algoritma kullanmakta, bu özellikleriyle kara-kutu
algoritmalar olarak da adlandırılmaktadırlar. Uygun ağ yapısının belirlenmesi, ağın
başlangıç ağırlık değerleri, öğrenme oranı, iterasyon sayısı, momentum gibi
sınıflandırma doğruluğunu direkt olarak etkileyen parametrelere sahiptir. Ağın
eğitimi ve sınıflandırmada kullanılacak YSA modelinin oluşturulmasında en uygun
parametre değerlerinin belirlenmesinde kullanılan bir yöntem olmaması yaşanan en
büyük problemdir. Bu parametreler eğitim ve test verileri kullanılarak deneme
yoluyla belirlenebildiğinden, bu konuda deneyim sahibi olmak önemlidir.
136
Öğrenme tabanlı sınıflandırıcılardan K-Star algoritması örnekler arasındaki
benzerliğin belirlenmesinde bilgi teorisine dayanan entropik uzaklık fonksiyonunu
kullanmaktadır. Literatürde bu konu üzerine yapılan çalışmalar incelendiğinde söz
konusu K-star algoritmasının farklı sınıflandırma problemlerinde kullanılmakta iken
tez kapsamında uzaktan algılanmış görüntülerin sınıflandırılması probleminde
kullanımı incelenmiştir. Bu açıdan algoritmanın uzaktan algılamada kullanımı
açısından elde edilen sonuçlar önemlidir. K-star algoritmasının kullanımında
kullanıcı tarafından belirlenmesi gereken tek parametre harmanlama parametresidir.
Harmanlama parametresi 1 ile 100 aralığında değerler almaktadır. 1 değeri için en
yakın komşuluk algoritması 100 değeri içinse örneklerin eşit ağırlığa sahip olduğu
durumlar elde edilmektedir. Tek bir parametre değerine sahip oluşu ve söz konusu
parametrenin dar bir aralıkta değerler alması K-star algoritmasının kullanımındaki en
önemli avantajlardır. Bununla birlikte en uygun harmanlama parametresi kullanılarak
modelin eğitimi için gerekli süre, modelin test edilmesi için gerekli süreden çok daha
uzun olduğu gözlemlenmiştir. Bu durum tüm uydu görüntüsünün sınıflandırılması
sırasında da yaşanmıştır. Sınıflandırma için gerekli olan sürenin diğer yöntemlere
göre uzun olması K-star algoritmasının olumsuz yönüdür. K-star ile elde edilen
sınıflandırma sonuçları incelendiğinde başta en çok benzerlik sınıflandırıcısı olmak
üzere tez kapsamında kullanılan bir çok sınıflandırıcıdan daha yüksek sınıflandırma
doğruluğu elde edilmiştir.
Bu çalışmada kullanılan uydu görüntüleri farklı tarihlerde (1997 ve 2002)
algılanmış olduğundan zamansal bir çözünürlüğe sahiptir. Çalışma alanı olarak
belirlenen Gebze ilçesinin yoğun sanayi alanlarını içerisinde barındırması, İstanbul
iline yakınlığı ve taşımacılık açısından önemli yollar üzerinde bulunması bölgenin
yoğun bir nüfus ve yapılaşma baskısı altında olmasına neden olmuştur. Bu açıdan
1997 ve 2002 yılları arasındaki 5 yıllık bir süre içerisinde çalışma alanındaki arazi
kullanımında meydana gelen değişimler belirlenmiş ve analiz edilmiştir. Arazi
kullanımındaki değişimlerin belirlenmesi amacıyla en yüksek sınıflandırma
doğruluğunun elde edildiği radyal tabanlı kernel fonksiyonu ile elde edilen
sınıflandırma sonuçları kullanılmıştır. Tablo 5.1’de Landsat ETM+ ve Terra ASTER
görüntüleri üzerinden belirlenen altı arazi örtüsü sınıfının çalışma alanında
kapladıkları alanlar ve 1997–2002 yılları arasında çalışma alanındaki arazi
kullanımında meydana gelen değişimler gösterilmektedir. Tablodan görüleceği üzere
137
beş yıllık süreç içerisinde çalışma alanında yaklaşık %30’luk bir şehirleşme artışı
yaşanmıştır. Yerleşim sınıfındaki pikseller 1997 yılında 71.72 km2 iken 2002 yılında
bu piksellerin kapladığı alan 92.34 km2 olmuştur. Şehirleşmenin özellikle iğne
yapraklı ağaçların ve bozkırların kapsadığı alanlar üzerinde yaşandığı görülmüştür.
Tablo 5.1 incelendiğinde çalışma bölgesindeki geniş yapraklı ağaçların kapsadığı
alanların beş yıl gibi kısa bir süreç içerisinde yaklaşık %15 azaldığı görülmektedir.
Bu durum bölgenin sürdürülebilir çevresel yapısı açısından önemli olan arazi
bozulmalarını ve çevresel problemlerin seviyesini göstermektedir. Tabloda 1997 ve
2002 yılları arasında su alanlarında %2’lik bir artış yaşandığı görülmektedir.
Uygulama öncesinde sınıflandırmaya esas olacak arazi örtüsü sınıfları belirlenirken
su olarak genelleştirilen sınıf içerisinde denizler, göller, akarsular ve barajlar gibi
yaklaşık olarak aynı spektral özelliklere sahip alanlar tek bir sınıf altında
toplanmıştır. Su alanlarındaki söz konusu değişimin çalışma alanında 5 yıllık süreç
içerisinde tamamlanan baraj alanlarının içerdiği su kütleleri ve akarsu yataklarındaki
su miktarlarındaki değişimden kaynaklanabileceği düşünülmektedir.
Tablo 5.1. 1997 ve 2002 yıllarında arazi kullanımında meydana gelen değişimlerin
analizi.
Arazi Kullanım
Sınıfları
1997
2002
Kapladığı Alan
Kapladığı Alan
2
2
1997–2002
Değişim
2
km
%
km
%
km
%
Su
44.85
9.97
45.95
10.21
1.10
2.46
Geniş Yapraklı
22.27
4.95
18.97
4.22
-3.30
-14.82
İğne Yapraklı
65.29
14.51
54.48
12.10
-10.82
-16.56
Bozkır
227.72
50.60
219.62
48.80
-8.10
-3.56
Toprak-Taş
18.18
4.04
18.68
4.15
0.50
2.72
Yerleşim
71.72
15.94
92.34
20.52
20.62
28.75
Uzaktan algılama görüntülerinin sınıflandırılması ile elde edilen tematik
haritaların güncel ve doğru bir şekilde üretilmesi yapılacak yorum ve
değerlendirmelerle alınacak kararlar açısından çok büyük önem taşımaktadır. Tez
138
kapsamında incelenen ileri sınıflandırma teknikleri bu amaç için geliştirilen ve
literatürde bir çok araştırmacının üzerinde yoğunlaştığı alanlardan birisidir. Elde
edilen sonuçlar ileri sınıflandırma teknikleri kullanılarak hesaplanan genel
sınıflandırma doğruluklarının standart sınıflandırıcı olarak kabul gören en çok
benzerlik sınıflandırıcısına göre yaklaşık %4 daha iyi olduğunu göstermektedir. Tez
kapsamında kullanılan uydu görüntülerinin piksel bazında 500039, alansal olarak
yaklaşık
450
km2’lik
bir
alanı
kapsadığı
düşünüldüğünde
sınıflandırma
doğruluğundaki %4’lük artışın yaklaşık 20.000 pikselin, dolayısıyla yaklaşık 18
km2’lik alanın doğru sınıflandırılan alanlara ilave olacağı söylenebilir. Genel
sınıflandırma doğruluğundaki %4’lük iyileşmenin piksel bazında ve alansal olarak
karşılığı kullanılan ileri sınıflandırma tekniklerinin sınıflandırmadaki önemini ve
etkinliğini ortaya koymaktadır. Bununla birlikte tüm bu teknikler kullanıcı tarafından
belirlenmesi gereken ve sınıflandırma doğruluğuna çeşitli derecede etki eden
parametrelerin belirlenmesini gerektirmektedir. Bu durum söz konusu ileri
sınıflandırma teknikleri kullanımında bir deneyim gerektirdiğini göstermektedir. Her
iki uydu görüntüsünün sınıflandırılması sonucu elde edilen sınıflandırma sonuçları,
özellikle yüksek genelleştirme kabiliyetine sahip destek vektör makinelerinin
uzaktan algılanmış görüntülerinin sınıflandırmasında kullanılabilecek etkili ve
alternatif bir yöntem olduğunu göstermektedir.
139
KAYNAKLAR
1.
Aha, D.W., 1992. Tolerating noisy, irrelevant and novel attributes in
instance-based learning algorithms. International Journal of Man-Machine
Studies, 36, 267–287.
2.
Aha, D.W., 1997. Lazy learning. Artificial Intelligence Review, 11, 7–10.
3.
Aha, D.W., Kibler, D. and Albert, M.K., 1991. Instance-based learning
algorithms. Machine Learning, 6, 37–66.
4.
Altuntaş, C. ve Çorumluoğlu, Ö., 2002. Uzaktan algılama görüntülerinde
digital görüntü işleme ve RSImage yazılımı, Selçuk Üniversitesi Jeodezi ve
Fotogrametri Mühendisliği Öğretiminde 30. Yıl Sempozyumu, Konya,
Bildiriler Kitabı, 434-442
5.
Altun, H. and Curtis, K.M., 1998. Exploiting the statistical characteristic of
the speech signals for an improved neural learning in a MLP neural
network. Neural Networks for Signal Processing, 598, 547-556.
6.
Atkinson, P. M. and Tatnall, A. R. L., 1997. Neural networks in remote
sensing. International Journal of Remote Sensing, 18, 699–709.
7.
Ayhan, E., 2003. KTÜ Uzaktan Algılama Ders Notları (yayınlanmamış),
KTÜ, Lisans Programı, Trabzon.
8.
Ayhan, E., Karslı, F. ve Tunç E., 2003. Uzaktan algılanmış görüntülerde
sınıflandırma ve analiz, Harita Dergisi, 130, 32–46.
9.
Bauer, E. and
Kohavi, R., 1999. An empirical comparison of voting
classification algorithms: bagging, boosting and variants. Machine
Learning, 36, 105–139.
10.
Blamire, P.A., 1994. An investigation into the identification and
classification of urban areas from remotely sensed satellite data using
neural Networks. MSc Thesis, Edinburgh University, UK.
140
11.
Boser, B. E., Guyon, I. M. and Vapnik, V., 1992. A training algorithm for
optimum margin classifiers. In Fifth Annual Workshop on Computational
Learning Theory, Pittsburgh, ACM.
12.
Breiman, L., 1996. Bagging predictors. Machine Learning, 24, 123–140.
13.
Breiman, L., 2001. Random forests. Machine Learning, 45, 5-32.
14.
Breiman, L., Friedman, J.H., Olshen, R.A. and Stone, C.J., 1984.
Classification and regression trees, Monterey, CA: Wadsworth.
15.
Brodley, C.E. and Utgoff, P.E., 1995. Multivariate decision trees. Machine
Learning, 19, 45-77.
16.
Burges, C.J.C., 1998. A tutorial on support vector machines for pattern
recognition. Data Mining and Knowledge Discovery, Kluwer Academic
Publishers, 2, 121-167.
17.
Campbell, J.B., 1996. Introduction to remote sensing, Second Edition, The
Guilford Press, New York, USA.
18.
Cleary, J. G. and Trigg, L. E., 1995. K*: An instance-based learner using an
entropic distance measure. Proceedings of the 12th International
Conference on Machine Learning, 108–114.
19.
Cortes, C. and Vapnik, V., 1995. Support-vector network. Machine
Learning, 20, 273–297.
20.
Cover, T. M. and Hart, P. E.,1967. Nearest neighbor pattern classification.
IEEE Transactions on Information Theory, 21–27.
21.
Crammer, K. and Singer, Y., 2001. On the algorithmic implementation of
multiclass kernel-based vector machines. Journal of Machine Learning
Research, 2, 265-292.
22.
Dasarathy, B. V., 1991. Nearest neighbor (NN) norms: NN pattern
classification techniques. Los Alamitos, CA: IEEE Computer Society Press.
141
23.
Debnath, R., Takahide, N. and Takahashi, H., 2004. A decision based oneagainst-one method for multi-class support vector machine. Pattern
Analysis & Applications, 7, 164–175.
24.
DeFries, R. S., Hansen, M., Townshend, J. R. G. and Sohlberg, R., 1998.
Global land cover classifications at 8km spatial resolution: the use of
training data derived from Landsat imagery in decision tree classifiers.
International Journal of Remote Sensing, 19, 3141–3168.
25.
Demirci, D.A., 2007. Destek vektör makineleri ile karakter tanıma. Yüksek
Lisans Tezi, Yıldız Teknik Üniversitesi Fen Bilimleri Enstitüsü, İstanbul.
26.
Dickson, S., Thomas, B.T. and Goddard, P., 1997. Using neural networks to
automatically detect brain tumours in MR images. International Journal of
Neural Systems, 8, 91-99.
27.
Diday, E., 1974. Recent progress in distance and similarity measures in
pattern recognition. Second International Joint Conference on Pattern
Recognition, 534–539.
28.
Dietterich, T. G., 2000. An experimental comparison of three methods for
constructing ensembles of decision trees: bagging, boosting, and
randomization. Machine Learning, 40, 139 - 157.
29.
Dietterich, T., 2002. The handbook of brain theory and neural networks.
The MIT Press, Ch. Ensemble Learning, 405-408.
30.
Dixon, B. and Candade, N., 2008. Multispectral landuse classification using
neural networks and support vector machines: one or the other, or both?
International Journal of Remote Sensing, 29,1185-1206.
31.
Efron, B. and Tibshirani, R.J., 1993. An introduction to the bootstrap.
London: Chapman and Hall.
32.
Erdas, 2008. Erdas Imagine 9.2 Field Guide.
33.
Fletcher, R., 2000. Practical methods of optimization. 2nd Edition, John
Wiley & Sons, Chichester.
142
34.
Foody, G.M., 1995. Using prior knowledge in artificial neural-network
classification with a minimal training set. International Journal of Remote
Sensing, 16, 301-312.
35.
Foody, G.M. and Mathur A., 2004. A relative evaluation of multiclass
image classification by support vector machines. IEEE Transactions on
Geoscience and Remote Sensing, 42, 1335–1343.
36.
Freund, Y. and Schapire, R. E., 1996. Experiments with a new boosting
algorithm. In: Saitta, L. (Ed.), Proceedings of the Thirteenth International
Conference on Machine Learning (ICML-96). Morgan Kaufmann, 148-156.
37.
Friedl, M.A. and Brodley, C.E., 1997. Decision tree classification of land
cover from remotely sensed data. Remote Sensing of Environment, 61,
399–409.
38.
Gelfand, S.B., Ravishankar, C.S. and Delp, E.J., 1991. An iterative growing
and pruning algorithm for classification tree design. IEEE Transactions on
Pattern Analysis and Machine Intelligence, 13, 163-174.
39.
Giacinto, G. and Roli, F., 1997. Ensembles of neural networks for soft
classification of remote sensing images, Proceedings of the European
Symposium on Intelligent Techniques, European Network for Fuzzy Logic
and Uncertainty Modelling in Information Technology, Bari, Italy, 166170.
40.
Gibson, P.J., 2000. Introductory remote sensing: Principles and concepts.
Routledge publishers, London.
41.
Giles, C.L., Lawrence, S. and Tsoi, A.C., 1997. Rule inference for financial
prediction using recurrent neural networks. Proceedings of the IEEE/IAFE
1997 Computational Intelligence for Financial Engineering (CIFER), 307,
253-259.
42.
Göksel, Ç., 1996. Elmalı ve Alibey su havzalarının uydu görüntü verileriyle
izlenmesi ve bilgi sistemi oluşturma olanakları, Doktora Tezi, İstanbul.
143
43.
Hall, F. G., Townshend, J. R. and Engman, E. T., 1995. Status of remote
sensing algorithms for estimation of land surface state parameters. Remote
Sensing of Environment, 51, 138–156.
44.
Hansen, L. and Salamon, P., 1990. Neural network ensembles. IEEE
Transactions on Pattern Analysis and Machine Intelligence, 12, 993–1001.
45.
Hansen, M., Dubayah, R. and DeFries, R., 1996. Classification trees: an
alternative to traditional land cover classifiers. International Journal of
Remote Sensing, 17, 1075–1081.
46.
Hansen, M., DeFries, R. S., Townshend, J. R. G. and Sohlberg, R., 2000.
Global land cover classification at 1km spatial resulution using a
classification tree approach. International Journal of Remote Sensing, 21,
1331–1364.
47.
Hashem, S., 1997. Optimal linear combinations of neural networks. Neural
Networks, 10, 599–614.
48.
Hastie, T. J. and Tibshirani, R. J., 1998. Classification by pairwise
coupling. Advances in Neural Information Processing Systems. (Jordan, M.
I., Kearns, M. J., and Solla, S. A., eds.), 10, The MIT Press.
49.
Heisele, B., Serre, T., Prentice, S. and Poggio, T., 2003. Hierarchical
classification and feature reduction for fast face detection with support
vector machines. Pattern Recognition, 36, 2007-2017.
50.
Hewitson, B.C. and R.G. Crane, 1994. Neural computing: applications in
geography. Kluwar Academic Publishers, Dordrecht.
51.
Hong, J., Min, J., Cho, U. and Cho, S., 2008. Fingerprint classification
using one-vs-all support vector machines dynamically ordered with naïve
Bayes classifiers. Pattern Recognition, 41, 662-671.
52.
Huang, C., Davis, L. S. and Townshed, JRG., 2002. An assessment of
support vector machines for land cover classification. International Journal
of Remote Sensing, 23, 725–749.
144
53.
Hullermeier, E., 2003. Possibilistic instance-based learning. Artificial
Intelligence, 335-383.
54.
Hsu, C.W., Chang, C.C. and Lin, C.J., 2008. A practical guide to support
vector classification.
http://www.csie.ntu.edu.tw/~cjlin/papers/guide/guide.pdf.
55.
Jehnsen, J.R., 1996. Introductory digital image processing: A remote
sensing perspective, Prentice Hall, New Jersey.
56.
Jensen, J.R., 2000. Remote sensing of the environment: An Earth resource
perspective, Prentice Hall, New Jersey.
57.
Joachims, T., 1998. Text categorization with support vector machines—
learning with many relevant features. In Proceedings of European
Conference on Machine Learning, 137-142.
58.
Kanellopoulos, I. and Wilkinson, G.G., 1997. Strategies and best practice
for neural network image classification. International Journal of Remote
Sensing, 18, 711-725
59.
Kansu, O., 2006. Uzaktan algılamada görüntü sınıflandırma yöntemleri
analizi. Yüksek Lisans Tezi, KTÜ Fen Bilimleri Enstitüsü, Trabzon.
60.
Kavzoglu, T. and Mather, P.M., 2003. The use of backpropagating artificial
neural networks in land cover classification. International Journal of
Remote Sensing, 24, 4907-4938.
61.
Kavzoglu, T. and Reis, S., 2008. Performance analysis of maximum
likelihood and artificial neural network classifiers for training sets with
mixed pixels. GIScience & Remote Sensing, 45, 330-342.
62.
Kavzoğlu, T. ve Çetin, M., 2005. Gebze bölgesindeki sanayileşmenin
zamansal gelişiminin ve çevresel etkilerinin uydu görüntüleri ile
incelenmesi. TMMOB Harita ve Kadastro Mühendisleri Odası, 10. Türkiye
Harita Bilimsel ve Teknik Kurultayı, Ankara.
145
63.
Kavzoglu, T., 2001. An investigation of the design and use of feed-forwad
artificial neural Networks in the classification of remotely sensed images.
PhD Thesis, Nottingham University, UK.
64.
Kavzoğlu, T., 2008. Uzaktan algılama ve uygulamaları ders notları
(yayınlanmamış), G.Y.T.E , Yüksek Lisans Programı, Gebze.
65.
Kavzoglu, T., 2009, Increasing the accuracy of neural network
classification using refined training data. Environmental Modelling &
Software, 24, 850-858
66.
Kechman, V., 2001. Learning and soft computing. MIT.
67.
Keerthi, S. and Lin, C. J., 2003. Asymptotic behaviors of support vector
machines with gaussian kernel. Neural Computation, 15, 1667–1689.
68.
Kim, B. and Landgrebe, D. A., 1991. Hierarchical classifier design in
highdimensional, numerous class cases. IEEE Transactions on Geoscience
and Remote Sensing. 29, 518-528.
69.
Knerr, S., Personnaz, L. and Dreyfus, G., 1990. Single-layer learning
revisited: A stepwise procedure for building and training neural network.
Neurocomputing: Algorithms, Architectures and Applications, NATO ASI,
Berlin: Springer-Verlag.
70.
Kononenko, I. and Hong, S.J., 1997. Attribute selection for modelling.
Future Generation Computer Systems, 13, 181-195.
71.
Krogh, A. and Vedelsby, J., 1995. Neural network ensembles, cross
validation, and active learning. In Tesauro, G., Touretzky, D., & Leen, T.
(Eds.), Advances in Neural Information Processing Systems, 7, 231–238
Cambridge, MA. MIT Press.
72.
Landeweerd, G.H., Timmers, T., Gelsema, E.S., Bins, M. and Halie, M.R.,
1983. Binary-Tree Versus Single Level Tree Classification of White BloodCells. Pattern Recognition, 16, 571-577.
146
73.
Lee, Y., Lin, Y. and Wahba, G., 2001. Multicategory support vector
machines. Tech.Rep. 1043, Department of Statistics, University of
Wisconsin, Madison, WI.
74.
Lillesand, T.M. and R.W. Kiefer. 1994. Remote sensing and photo
interpretation. 3rd. Edition, John Wiley & Sons: New York.
75.
Lillesand, T.M., Kiefer, R.W. and Chipman, J.W., 2007. Remote sensing
and image interpretation. 6th Edition, John Wiley & Sons: New York.
76.
Lin, K.M and Lin C.J., 2003. A study on reduced support vector machines.
IEEE Transactions on Neural Networks, 6, 1449-1459.
77.
Lippman, R. P., 1987. An introduction to computing with neural nets. IEEE
ASSP Magazine, 4, 2–22.
78.
Liu, C., Nakashima, K., Sako, H. and Fujisawa, H., 2003. Handwritten digit
recognition:
bench-marking
of
state-of-the-art
techniques.
Pattern
Recognition, 36, 2271–2285.
79.
Lu, D. and Weng, Q., 2007. A survey of image classification methods and
techniques for improving classification performance. International Journal
of Remote Sensing, 28, 823–870.
80.
Maclin, R. and Opitz, D., 1997. An empirical evaluation of bagging and
boosting. In: Proceedings of the Fourteenth National Conference on
Artificial Intelligence. AAAI Press, Providence, RI, 546-551.
81.
Maktav, D. ve Sunar, F., 1991. Uzaktan algılama: Kantitatif yaklaşım.
Hürriyet Ofset A.Ş., İstanbul.
82.
Mather, P.M., 1987. Computer processing of remote-sensed images. John
Wiley and Sons Ltd.
83.
Mathur, A. and Foody, G.M., 2008a. Multiclass and binary SVM
classification: Implications for training and classification users. IEEE
Geoscience and Remote Sensing Letters 5, 241-245.
147
84.
Mathur A. and Foody, G.M.., 2008b. Crop classification by support vector
machine with intelligently selected training data for an operational
application. International Journal of Remote Sensing, 29, 2227–2240.
85.
Melgani, F. and Bruzzone, L., 2004. Classification of hyperspectral remote
sensing images with support vector machines. IEEE Transactıons on
Geoscience and Remote Sensing, 42, 1778–1790.
86.
Melville, P. and Mooney, R.J. 2004a. Creating diversity in ensembles using
artificial, In: Information Fusion: Special Issue on Diversity in
Multiclassifier Systems, 6, 99–111.
87.
Melville, P., Shah, N., Mihalkova, L. and Mooney, R. J., 2004b.
Experiments on ensembles with missing and noisy data. In: Proceedings of
the Workshop on Multi Classifier Systems, 293-302, Italy.
88.
Michalski, R. S., Stepp, R. E. and Diday, E., 1981. In L. N. Kanal and
Azriel Rosenfeld (Eds.). A recent advance in data analysis: clustering
objects into classes characterized by conjunctive concepts. Progress in
Pattern Recognition, New York: North-Holland, 1, 33–56.
89.
Milgram J, Cheriet M. and Sabourin, R., 2006. One against one or one
against all: which one is better for handwriting recognition with SVMs?
10th International Workshop on Frontiers in Handwriting Recognition
(IWFHR 2006).
http://www.livia.etsmtl.ca/publications/
90.
Mingers, J., 1989. An empirical comparison of pruning methods for
decision tree induction. Machine Learning, 4, 227–243.
91.
Murthy, S. K., Kasif, S. and Salzberg, S., 1994. A system for induction of
oblique decision trees. Journal of Artificial Intelligence Research, 2, 1-32.
92.
Nadler, M. and Smith, E. P. 1993. Pattern recognition engineering. Wiley:
New York.
148
93.
Okamoto, S. and Yugami, N., 2003. Effects of domain characteristics on
instance-based learning algorithms. Theoretical Computer Science, 207233.
94.
Opitz, D. and Maclin R., 1999. Popular ensemble methods: An empirical
study. Journal of Artificial Intelligence Research, 11, 169–198.
95.
Opitz, D. and Shavlik, J., 1996. Actively searching for an effective neuralnetwork ensemble. Connection Science, 8, 337–353.
96.
Oommen, T., Misra, D., Twarakavi, N.K.C., Prakash, A., Sahoo, B. and
Bandopadhyay, S., 2008. An objective analysis of support vector machine
based classification for remote sensing. Mathematical Geosiences 40, 409–
424.
97.
Örmeci, C., 1987. Uzaktan algılama (Temel esaslar ve algılama sistemleri),
İTÜ yayınları, cilt 1, no: 1345, İTÜ Matbaası, İstanbul.
98.
Osuna, E. E., Freund, R. and Girosi, F., 1997. Support vector machines:
training
and
applications,
http://cbcl.mit.edu/cbcl/publications/ai-
publications/1500-1999/AIM-1602.ps (10.05.2008).
99.
Özkan, C., 1998. Uzaktan algılama verileriyle orman yangını analizi,
Yüksek Lisans Tezi, İTÜ Fen Bilimleri Enstitüsü, İstanbul.
100. Özkan, C., 2001. Uydu görüntü verisinin yapay sinir ağları ile
sınıflandırılması, Doktora tezi, İTÜ Fen Bilimleri Enstitüsü, İstanbul.
101. Özkan, Y., 2008. Veri madenciliği yöntemleri. Papatya yayıncılık eğitim,
İstanbul, 216 s.
102. Pal, M., 2005a. Multiclass approaches for support vector machine based
land cover classification. In Proceedings of Map India, 8th Annual
International Conference and Exhibition in the Field of GIS, GPS, Arial
Photography, and Remote Sensing, New Delhi. Available online at:
www.mapindia.org/2005/papers/pdf/54.pdf (22.10.2008).
103. Pal, M., 2005b. Random forest classifier for remote sensing classification.
International Journal of Remote Sensing, 26, 217-222.
149
104. Pal, M. and Mather, P.M., 2003. An assessment of the effectiveness of
decision tree methods for land cover classification. Remote Sensing of
Environment, 86, 554-565.
105. Pal, M. and Mather, P.M., 2005. Support vector machines for classification
in remote sensing. International Journal of Remote Sensing, 26, 1007–1011.
106. Pal, M., 2002. Factors influencing the accuracy of remote sensing
classifications: a comparative study. PhD thesis, University of Nottingham.
107. Paola, J. D., and Schowengerdt, R. A., 1995. A review and analysis of
backpropagation neural networks for classification of remotely sensed
multi-spectral imagery. International Journal of Remote Sensing, 16, 3033–
3058.
108. Pearson, K., 1895. Contributions to the mathematical theory of evolution,
II: skew variation in homogeneous material, Philosophical Transactions of
the Royal Society of London, 186, 343-414.
109. Piramuthu, S. and Sikora, R.T., 2009. Iterative feature construction for
improving
inductive
learning
algorithms.
Expert
Systems
with
Applications, 3401-3406.
110. Platt, J. C., Cristianini, N., and Shawe-Taylor, J., 2000. Large margin
DAGs for multiclass classification. In S. A. Solla, T. K. Leen, and K. –R.
Müller, eds., Advance in Neural Information Processing Systems, The MIT
Press, 12, 547-553.
111. Quinlan, J. R., 1987. Simplifying decision trees. International Journal of
Man-Machine Studies, 27, 221-234.
112. Quinlan, J. R., 1990. Decision tree and decision making. IEEE Transactions
on Systems, Man, and Cybernetics, 20, 339-346.
113. Quinlan, J. R., 1993. C4.5: Programs for Machine Learning. Morgan
Kaufmann Publishers, San Mateo, CA.
150
114. Quinlan, J. R., 1996. Bagging, boosting, and C4.5. In: Proceedings of the
Thirteenth National Conference on Artificial Intelligence (AAAI-96).
Portland, OR, 725-730.
115. Richards, J.A., 1993. Remote sensing digital image analysis: An
introduction, Second Edition, Springer-Verlag, Berlin.
116. Roli, F., Giacinto, G. and Vernazza, G., 1997. Comparison and combination
of statistical and neural networks algorithms for remote-sensing image
classification. Neurocomputation in Remote Sensing Data Analysis, Austin,
J., Kanellopoulos, I., Roli, F. and Wilkinson G. (Eds.), Berlin: SpringerVerlag, 117-124.
117. Sabins, F.F., 1987. Remote sensing: Principles and interpretation. Freeman,
New York.
118. Safavian, S. R. and Landgrebe, D., 1991. A survey of decision tree
classifier methodology. IEEE T ransactions on Systems, Man, and
Cybernetics, 21, 660–674.
119. Sarle, W.S., 2008. Neural Network FAQ, (ftp://ftp.sas.com/pub/neural/
FAQ.html).
120. Schapire, R. E., 1999. Theoretical views of boosting and applications. In:
Proceedings of the Tenth International Conference on Algorithmic Learning
Theory, 13 – 25.
121. Schölkopf, B. and Smola, A. J., 2002. Learning with Kernels – Support
Vector Machines, Regularization, Optimization and Beyond. Cambridge,
MA: The MIT Press.
122. Sesören, A., 1999. Uzaktan algılamada temel kavramlar. Mart Matbaacılık
Sanatları Ltd. Şti., İstanbul.
123. Shannon, C.E., 1948. A mathematical theory of communication. Bell
System Technical Journal, 27, 379-423.
151
124. Sherrod, P. H., 2003. Classification and regression trees and support vector
machines for predictive modeling and forecasting. http://www.dtreg.com/
(12.06.2008).
125. Su, L., Chopping M.J., Rango, A., Martonchik, J.V. and Peters, D.P.C.,
2007. Support vector machines for recognition of semi-arid vegetation
types using MISR multi-angle imagery. Remote Sensing of Environment,
107, 299–311.
126. Süslü, A., 2007. Şereflikoçhisar ilçesindeki tarım arazilerinde uzaktan
algılama yöntemiyle ekili alanların tespiti ve rekolte tahmini. GYTE Fen
Bilimleri Enstitüsü, Yüksek Lisans Tezi, Gebze.
127. Swain, P.H. and Hauska, H., 1977. Decision tree classifier - design and
potential. IEEE Transactions on Geoscience and Remote Sensing, 15, 142147.
128. Tatar, Y. ve Tatar, O., 2006. Jeolojide uzaktan algılama, Cumhuriyet
Üniversitesi Yayınları, No: 102, Esform Ofset Ltd. Şti., Sivas. 248 s.
129. Tseng, M.H., Chen, S.J., Hwang, G.H. and Shen, M.Y., 2008. A genetic
algorithm rule-based approach for land-cover classification. ISPRS Journal
of Photogrammetry and Remote Sensing, 63, 202-212.
130. Townshend, J. R. G., 1992. Land cover. International Journal of Remote
Sensing, 1319–1328.
131. Ustun, B., Melssen, W.J. and Buydens, L.M.C. 2006. Facilitating the
application of Support Vector Regression by using a universal Pearson VII
function based kernel. Chemometrics and Intelligent Laboratory Systems,
81, 29-40.
132. Vapnik, V. N., 1995. The nature of statistical learning theory. SpringerVerlag, New York.
133. Vapnik, V.N. and Chervonenkis, A.Ja., 1968. In Russian: on the uniform
convergence of relative frequencies of events to their probabilities. Doklady
Akademii Nauk USR, 181(4). English translation: Uniform convergence of
152
frequencies of occurrence of events to their probabilities. Soviet
Mathematics Doklady, 9, 915–918.
134. Vapnik, V.N. and Chervonenkis, A.Ja., 1971. On the uniform convergence
of relative frequencies of events to their probabilities. Theory of Probability
and its Applications, 16, 264–280.
135. Vapnik, V.N., 2000. The nature of statistical learning theory, Second
Edition. Springer-Verlag, New York.
136. Wang, F., 1990, Fuzzy supervised classification of remote sensing images.
IEEE Transactions on Geoscience and Remote Sensing, 28, 194–201.
137. Webb, G.I., 2000. MultiBoosting: A technique for combining boosting and
wagging. Machine Learning, 40, 159-196.
138. Werbos, P. J., 1995. Backpropagation: Basic and new developments, in The
handbook of brain behaviour and neural networks, ed. Michael A. Arbib,
The MIT Press, Cambridge MA.
139. Weston, J. and Watkins, C., 1998. Multi-class Support Vector Machines.
Royal Holloway, University of London, U. K., Technical Report CSD-TR98-04.
140. Wilson, D.R. and Martinez, T.R., 2000. Reduction techniques for instancebased learning algorithms. Machine Learning, 38:257-286.
141. Yang, J., Ling, X., Zhu, Y. and Zheng, Z., 2008. A face detection and
recognition system in color image series. Mathematics and Computers in
Simulation, 77, 531–539.
142. Yao, X., Tham, L.G. and Dai, F.C., 2008. Landslide susceptibility mapping
based on support vector machine: a case study on natural slopes of Hong
Kong, China. Geomorphology, 101, 572-582.
143. URL-1 : http://www.yildiz.edu.tr/~bayram/sgi/saygi.htm (06.04.2008)
144. URL- 2 : http://nik.com.tr/ (18.07.2008)
145. URL- 3 : http://www.gebze.bel.tr (22.03.2008)
146. URL-4 : http://www.tuik.gov.tr/ (19.03.2008)
153
ÖZGEÇMİŞ
İsmail Çölkesen, 22 Ocak 1981 tarihinde Ankara’da doğdu. Lise eğitimini
Yabancı Dil Ağırlıklı Seyranbağları Lisesinde tamamladıktan sonra, 1999 yılında
Hacettepe Üniversitesi Ankara Meslek Yüksek Okulu Harita ve Kadastro bölümünü
kazandı. 2001 yılında dikey geçiş sınavı ile Karadeniz Teknik Üniversitesi Jeodezi
ve Fotogrametri Mühendisliği’nde lisans eğitimine başladı ve 2004 yılında mezun
oldu. 2005 yılında KTÜ Fen Bilimleri Enstitüsü Jeodezi ve Fotogrametri
Mühendisliği bölümünde yüksek lisans eğitimine başladı. 2006–2007 yılları arasında
aynı bölümde araştırma görevlisi olarak görev yaptı. 2007 yılında Gebze Yüksek
Teknoloji Enstitüsü’nde yüksek lisans eğitimine başladı. 2007 yılının Eylül ayı
içerisinde GYTE Mühendislik Fakültesi Jeodezi ve Fotogrametri Mühendisliği
Bölümü’nde araştırma görevlisi unvanı ile çalışmaya başladı. Halen bu görevi
sürdürmektedir.
Download