T.C. GEBZE YÜKSEK TEKNOLOJİ ENSTİTÜSÜ MÜHENDİSLİK VE FEN BİLİMLERİ ENSTİTÜSÜ UZAKTAN ALGILAMADA İLERİ SINIFLANDIRMA TEKNİKLERİNİN KARŞILAŞTIRILMASI VE ANALİZİ İsmail ÇÖLKESEN YÜKSEK LİSANS TEZİ JEODEZİ VE FOTOGRAMETRİ MÜHENDİSLİĞİ ANABİLİM DALI TEZ DANIŞMANI Doç. Dr. Taşkın KAVZOĞLU GEBZE 2009 ii ÖZET TEZİN BAŞLIĞI: Uzaktan Algılamada İleri Sınıflandırma Tekniklerinin Karşılaştırılması ve Analizi YAZAR ADI : İsmail ÇÖLKESEN Global ve yerel ölçekteki birçok uygulamada yeryüzüne ait doğru ve hassas bilgilere ihtiyaç duymaktadır. Bu bilgiler çevre kalitesinin analizi, şehircilik faaliyetleri, doğal kaynakların yönetimi ve planlanması gibi çeşitli uygulamalar için önemli birer kaynak durumundadır. Uzaktan algılama teknolojileri farklı konumsal ve spektral çözünürlüklerde, değişik zaman aralıklarında yeryüzünü görüntüleyebilme kabiliyetine sahip olduğundan bu bilgilerin elde edilmesinde önemli bir kaynak durumundadır. Bu geniş çalışma alanı içerisinde uzaktan algılamanın en yoğun olarak kullanıldığı alan arazi örtüsü ve arazi kullanımının belirlenmesidir. Uzaktan algılanmış görüntülerin sınıflandırılması arazi örtüsü ve/veya arazi kullanımına ait bilgilerinin elde edilmesinde kullanılan en yaygın yöntemdir. Sınıflandırma sonucu elde edilen tematik haritaların analizi ve yorumlanması ile yeryüzüne ait bilgilere ulaşmak mümkün olmaktadır. Doğru ve güncel tematik haritaların kullanımı herhangi bir çalışmanın başarı oranını artırabilir. Literatürde 1972’de ilk uydu görüntüsünün elde edilmesinden günümüze kadar birçok sınıflandırma yöntemi geliştirilmiş ve çeşitli derecelerde başarılar elde edilmiştir. Bu yöntemler arasında istatistiksel bir temele dayanan en çok benzerlik sınıflandırıcısı en yaygın kullanılanıdır. Parametrik yaklaşımların istatistiksel kabullere dayalı yapıları nedeniyle, son yıllarda uzaktan algılanmış görüntülerin sınıflandırılmasında parametrik olmayan yöntemler (yapay sinir ağları, destek vektör makineleri ve karar ağaçları) kullanılmaktadır. Bu tez çalışmasının ikinci bölümünde uzaktan algılama ve temel esasları, sayısal görüntü analizi, sınıflandırma yöntemleri ve çeşitli uydu sistemleri hakkında genel bilgiler verilmiştir. Çalışmanın üçüncü bölümünde, son yıllarda uzaktan algılamada kullanılan ileri sınıflandırma tekniklerinden destek vektör makineleri, karar ağaçları, karar ağacı iyileştirme algoritmaları, yapay sinir ağları ve K-star sınıflandırıcıları ile ilgili literatür taraması yapılmıştır. Çalışmanın dördüncü bölümü olan uygulama kısmında ise Gebze ilçesini kapsayan Landsat ETM+ (1997) ve Terra ASTER (2002) görüntülerinin söz konusu yöntemler ile sınıflandırılarak arazi örtüsü ve kullanımının belirlenmesi amaçlanmıştır. Bu yöntemler ve elde edilen sonuçlar etkili faktörlerde (parametreler) göz önüne alınarak detaylı iii bir şekilde analiz edilmiştir. Sınıflandırıcıların sahip olduğu parametreler ve bu parametrelerin sınıflandırma doğruluğuna etkileri muhtemel parametre kombinasyonları kullanılarak incelenmiştir. Son olarak metotların kullanımları ve performansları en çok benzerlik yöntemi ile karşılaştırılmıştır. İleri sınıflandırma algoritmaları uzaktan algılanmış görüntülerin sınıflandırılmasında etkili yöntemlerdir. Özellikle parametrik olmayan yapılarıyla destek vektör makineleri, yapay sinir ağları, iyileştirilmiş karar ağaçları ve K-star sınıflandırıcıları en önemlileridir. Yüksek genelleştirme kabiliyetleri ve sınıflandırma performanslarının yanında matematiksel ifadeleri zor ve karmaşıktır. Sınıflandırma öncesinde kullanıcı tarafından belirlenmesi gereken çeşitli parametrelere sahiptirler. Parametre seçimi sınıflandırma performanslarını önemli ölçüde etkilediğinden en uygun parametre değerlerinin belirlenmesinin bu yöntemlerinin kullanımında karşılaşılan en önemli problem olduğu söylenebilir. En çok benzerlik sınıflandırıcısı basit bir matematiksel ifadeye sahip olmasına karşın bu çalışmada değerlendirilen sınıflandırıcılarla karşılaştırıldığında sınıflandırma doğruluğu açısından daha düşük sonuçlar üretmektedir. Elde edilen sonuçlar ileri sınıflandırma tekniklerinin uzaktan algılanmış görüntülerin sınıflandırılmasında geleneksel sınıflandırıcılara göre iyi ve etkili bir alternatif olduklarını göstermektedir. iv SUMMARY TITLE : Comparing and Analyzing of Advanced Classifier Techniques in Remote Sensing NAME : İsmail ÇÖLKESEN Accurate and precise information about the Earth’s surface are required for many applications at global and local scales. This information is invaluable sources in various applications, such as environmental quality analysis, urban activities, managing and planning of natural resources. Having a capability of monitoring the Earth’s surface at various spatial and temporal scales, the remote sensing technology is the only source providing such information. Within this wide application area determination of land cover and land use information has been is the most concentrated issue in remote sensing field. Classification of remotely sensed images has been the way of obtaining to land cover and land use information. It is possible to acquire such information through the analysis and interpreting of thematic maps produced after the classification process. The use of accurate and up to date thematic maps can increase the success rate of any application. Numerous classification algorithms have been developed and applied in the literature for the classification of remotely sensed image since the first satellite image was acquired in 1972. Among these algorithms the maximum likelihood classifier has been the most widely used one that is based on statistical theory. In order to avoid the assumptions of the parametric approaches, non-parametric methods (i.e. artificial neural networks, support vector machines and decision trees) have been recently introduced for the classification of remote sensing images. In the introduction part of this thesis, general information about the basic principles of remote sensing, digital image analysis, classification techniques and various satellite systems are given. In the second part, literature review about the advanced classification techniques namely support vector machines, decision trees, decision tree enhancement algorithms, artificial neural networks and K-star classifier are discussed. In the application part (Section 4), the classifiers were employed to determine land cover/use types of Gebze district of Kocaeli using Landsat ETM+ (1997) and Terra ASTER (2002) images. The methods and their results were analyzed in detail considering the effective factors (i.e. parameters). Parameters of the classifiers and their effects on the classification accuracy were also examined by v applying possible combinations of the parameters. At the end, comparisons of the methods were made in terms of their use and performances with the benchmark classifier, the maximum likelihood. Advanced classifier algorithms have been reported to be effective in the classification of remotely sensed images. Especially, support vector machines, neural networks, enhanced decision trees and K-star classifiers with their non-parametric natures are the most important ones. Despite they have significant generalization capability and high classification performances, their mathematical expressions are difficult and complex. In addition, they have parameters that need to be defined by the analyst before the classification process. It can be said that determining the optimum parameters is the main problem encountered in the use of these methods since parameter choices significantly affect the classification performances. The maximum likelihood classifier has a simple mathematical expression, but they produce lower results in terms of classification accuracy compared to the classifier considered in this research. Results show that advanced classifiers are good and effective alternatives to the traditional parametric classifier for the classification of remotely sensed imagery. vi TEŞEKKÜR Yüksek lisans tez çalışmamda, tez konusunun seçiminden hazırlanmasına kadar tüm aşamalarında değerli görüşlerinden ve bilgisinden istifade ettiğim tez danışmanım değerli hocam Sayın Doç.Dr. Taşkın Kavzoğlu’na, Tez araştırması süresince değerli fikirleri yol gösteren Yrd.Doç.Dr Halis Saka’ya ve bölümümüzde görev yapmakta olan değerli öğretim elemanlarına, Bana, her konuda ilgisini ve desteğini hiçbir zaman eksik etmeyen sevgili eşim Solmaz Çölkesen’e ve değerli aileme; Teşekkürlerimi sunarım. vii İÇİNDEKİLER DİZİNİ Sayfa ÖZET ii SUMMARY iv TEŞEKKÜR vi İÇİNDEKİLER DİZİNİ vii ŞEKİLLER DİZİNİ xi TABLOLAR DİZİNİ xv 1. GİRİŞ 1 2. UZAKTAN ALGILAMA VE TEMEL ESASLARI 4 2.1. Işık Kaynağı ve Elektromanyetik Enerji 4 2.2. Atmosferik Etkiler 6 2.3. Atmosferik Pencereler ve Nesnelerin İmzası 7 2.4. Uzaktan Algılamada Çözünürlük Kavramı 11 2.4.1. Konumsal Çözünürlük 12 2.4.2. Spektral Çözünürlük 14 2.4.3. Radyometrik Çözünürlük 14 2.4.5. Zamansal Çözünürlük 15 2.5. Uzaktan Algılamada Görüntü Analiz Sistemleri 16 2.5.1. Ön İşlem 16 2.5.2. Görüntü İyileştirme 18 2.5.3. Görüntü Dönüşümleri 19 2.5.4. Görüntü Sınıflandırma ve Analiz 20 2.5.4.1. Kontrolsüz Sınıflandırma 21 2.5.4.2. Kontrollü Sınıflandırma 22 2.5.4.2.1. En Kısa Uzaklık Sınıflandırıcısı 23 2.5.4.2.2. Paralel Kenar Sınıflandırıcısı 24 2.5.4.2.3. Mahalanobis Uzaklığı Sınıflandırıcısı 25 2.5.4.2.4. En Çok Benzerlik Sınıflandırma Algoritması 26 2.6. Uzaktan Algılama Uyduları 2.6.1. LANDSAT Uydu Sistemi 27 27 viii 2.6.2. TERRA Uydu Sistemi 29 2.6.3. SPOT Uydu Sistemi 29 3. UZAKTAN ALGILAMADA İLERİ SINIFLANDIRMA TEKNİKLERİ 3.1. Destek Vektör Makineleri 31 31 3.1.1. Doğrusal Olarak Ayrım Yapılabilen Veriler 33 3.1.2. Doğrusal Olmayan Veriler 37 3.1.3. Doğrusal Olmayan Destek Vektör Makineleri 41 3.1.4. Çok Sınıflı Destek Vektör Makineleri 43 3.1.5. DVM ile Sınıflandırmada Veri Ön İşleme ve Model Seçimi 46 3.2. Karar Ağaçları 3.2.1. Karar Ağacı Oluşturulmasında Kullanılan Yöntemler 48 51 3.2.1.1. Aşağıdan-Yukarıya Yaklaşımı 52 3.2.1.2. Yukarıdan-Aşağıya Yaklaşımı 52 3.2.1.2.1. Karar Ağaçlarında Dallanma Kriterleri ve Öznitelik Seçimi 54 3.2.1.2.2. Bilgi Kazancı ve Bilgi Kazanç Oranı Kriterleri 54 3.2.1.2.3. Gini İndeksi 57 3.2.1.2.4. Towing Kuralı 58 3.2.1.2.5. Ki-Kare Olasılık Tablo İstatistiği ( χ 2 ) 58 3.2.1.3. Melez Yaklaşım 59 3.2.1.4. Gelişme-Budama Yöntemi 60 3.2.2. Veri Ayırma Yöntemine Dayalı Karar Ağacı Sınıflandırma Algoritmaları 60 3.2.2.1. Tek değişkenli Karar Ağaçları 61 3.2.2.2. Çok Değişkenli Karar Ağaçları 62 3.2.2.3. Melez Karar Ağacı Sınıflandırıcısı 64 3.2.3. Karar Ağaçlarının Budanması 65 3.2.4. Karar Ağaçlarının İyileştirilmesinde Kullanılan Yöntemler 68 3.2.4.1. Hızlandırma 69 3.2.4.2. Torbalama 71 3.2.4.3. Çoklu Hızlandırma 73 3.2.4.4. Rastgele Orman 73 3.2.4.5. DECORATE Algoritması 75 3.3. Yapay Sinir Ağları 3.3.1. Biyolojik ve Yapay Sinir Ağlarının Çalışma Prensibi 75 76 ix 3.3.2. Yapay Sinir Ağlarının Sınıflandırılması 3.3.2.1. Yapılarına Göre Yapay Sinir Ağları 79 79 3.3.2.1.1. İleri Beslemeli Yapay Sinir Ağları 79 3.3.2.1.2. Geri Beslemeli Yapay Sinir Ağları 80 3.3.2.2. Öğrenme Algoritmalarına Göre Yapay Sinir Ağları 80 3.3.2.2.1. Kontrollü Öğrenme 80 3.3.2.2.2. Kontrolsüz Öğrenme 81 3.3.2.2.3. Takviyeli Öğrenme 81 3.3.3. Çok Katmanlı Perseptron 3.3.3.1. Öğrenme Algoritmaları 3.3.4. Yapay Sinir Ağları ile Görüntü Sınıflandırma 3.4. Örnek Tabanlı Öğrenme ve K-Star Sınıflandırıcısı 4. UYGULAMA 81 82 85 87 93 4.1. Çalışma Alanı 93 4.2. Uygulama Konusu ve Amacı 94 4.3. Kullanılan Veri ve Yazılımlar 94 4.4. Uygulama Aşamaları 95 4.4.1. Uydu Görüntülerinin Geometrik Düzeltilmesi ve Yeniden Örneklenmesi 95 4.4.2. Arazi Örtüsü Sınıfları ve Eğitim Alanlarının Belirlenmesi 96 4.4.3. Uydu Görüntülerinin Sınıflandırılması 97 4.4.3.1. En Çok Benzerlik Yöntemi ile Sınıflandırma 98 4.4.3.2. Destek Vektör Makineleri ile Sınıflandırma 99 4.4.3.2.1. Polinom Kernel Fonksiyonu ile Sınıflandırma 100 4.4.3.2.2. Radyal Tabanlı Kernel Fonksiyonu ile Sınıflandırma 104 4.4.3.2.3. Pearson VII Fonksiyonu ile Sınıflandırma 108 4.4.3.3. Karar Ağaçları ile Sınıflandırma 111 4.4.3.3.1. C4.5 Karar Ağacı Algoritması ile Sınıflandırma 111 4.4.3.3.2. Karar Ağacı İyileştirme Algoritmaları ile Sınıflandırma 115 4.4.3.3.2.1. Hızlandırma Algoritması İle Sınıflandırma 115 4.4.3.3.2.2. Torbalama Algoritması İle Sınıflandırma 117 4.4.3.3.2.3. Çoklu Hızlandırma Algoritması İle Sınıflandırma 119 4.4.3.3.2.4. Rastgele Orman Algoritması İle Sınıflandırma 122 4.4.3.3.2.5. DECORATE Algoritması İle Sınıflandırma 125 x 4.4.3.4. Yapay Sinir Ağları ile Sınıflandırma 128 4.4.3.5. K-Star Algoritması İle Sınıflandırma 129 5. SONUÇLAR VE ÖNERİLER 132 KAYNAKLAR DİZİNİ 139 ÖZGEÇMİŞ 153 xi ŞEKİLLER DİZİNİ Şekil Sayfa 2.1. Elektromanyetik dalgalar. 5 2.2. Elektromanyetik spektrum ve uzaktan algılamada kullanılan bölgeleri. 6 2.3. Toprak, bitki ve su için genelleştirilmiş spektral yansıtım grafiği. 10 2.4. Uzaktan algılama uyduları için anlık görüş alanının açısal ve uzunluk olarak ifadesi. 13 2.5. Konumsal çözünürlük kavramı. (a) 1 metre, (b) 10 metre, (c) 30 metre çözünürlüklü görüntüler. 13 2.6. En kısa uzaklık (spektral uzaklık) sınıflandırıcısı. 24 2.7. Paralelkenar sınıflandırıcısı. 25 3.1. İki sınıflı bir problemde verileri ayıran hiper düzlemler. 32 3.2. İki sınıflı bir problemde en uygun hiper düzlem, sınır ve destek vektörleri. 32 3.3. Doğrusal olarak ayrılabilen veri setleri için hiper düzlemin belirlenmesi. 35 3.4. Doğrusal olarak ayrılamayan veri seti. 38 3.5. Ayrım yapılamayan veri setleri için hiper düzlemler. 38 3.6. Doğrusal olmayan verin yüksek boyutlu uzaya dönüşümü ve verinin doğrusal olarak ayrılması. 41 3.7. Beş boyutlu bir özellik uzayı ve üç sınıf için bir sınıflandırma ağacı. Şekilde xi özellik değerlerini,η i eşik değerlerini ve Y ise sınıf etiketlerini göstermektedir. 51 3.8. Tek değişkenli karar ağacının paralel eksenli karar sınırları. 61 3.9. Çok değişkenli karar ağacı sınıflandırıcısı için karar sınırları. 63 3.10. Melez karar ağacı sınıflandırıcısına ait örnek bir yapı. 64 3.11. Karar ağacı sınıflandırıcısının birleşimi olan sınıflandırıcı. 69 3.12. Biyolojik nöronun genel yapısı ve bileşenleri. 77 xii 3.13. Yapay nöronun genel yapısı ve bileşenleri. 78 3.14. Dört tabakalı ileri beslemeli basit bir çok katmanlı perseptron ağı. 82 4.1. Çalışma alanı haritası. 93 4.2. En çok benzerlik yöntemiyle elde edilen tematik haritalar. (a) Landsat ETM+ görüntüsü, (b) Terra ASTER görüntüsü. 99 4.3. Landsat ETM+ uydu görüntüsü için düzenleme parametresi C’deki değişimlerin sınıflandırma doğruluğuna etkisi. 101 4.4. Terra ASTER uydu görüntüsü için düzenleme parametresindeki (C) değişimlerin sınıflandırma doğruluğuna etkisi. 101 4.5. Landsat ETM+ uydu görüntüsü için polinom derecesindeki (d) değişimlerin sınıflandırma doğruluğuna etkisi. 102 4.6. Terra ASTER uydu görüntüsü için polinom derecesindeki (d) değişimlerin sınıflandırma doğruluğuna etkisi. 102 4.7. Polinom kernel fonksiyonu kullanılarak elde edilen tematik haritalar. (a) Landsat ETM+ görüntüsü, (b) Terra ASTER görüntüsü. 103 4.8. Landsat ETM+ uydu görüntüsü için düzenleme parametresi C’deki değişimlerin sınıflandırma doğruluğuna etkisi. 104 4.9. Terra ASTER uydu görüntüsü için düzenleme parametresi C’deki değişimlerin sınıflandırma doğruluğuna etkisi. 105 4.10. Landsat ETM+ uydu görüntüsü için Gama parametresindeki ( γ ) değişimlerin sınıflandırma doğruluğuna etkisi. 106 4.11. Terra ASTER uydu görüntüsü için Gama parametresindeki ( γ ) değişimlerin sınıflandırma doğruluğuna etkisi. 106 4.12. Radyal Tabanlı kernel fonksiyonu kullanılarak elde edilen tematik haritalar. (a) Landsat ETM+ görüntüsü, (b) Terra ASTER görüntüsü. 107 4.13. Landsat ETM+ uydu görüntüsü için düzenleme parametresindeki (C) değişimlerin sınıflandırma doğruluğuna etkisi. 109 4.14. Terra ASTER uydu görüntüsü için düzenleme parametresindeki (C) değişimlerin sınıflandırma doğruluğuna etkisi. 109 4.15. PUK fonksiyonu kullanılarak elde edilen tematik haritalar. (a) Landsat ETM+ görüntüsü, (b) Terra ASTER görüntüsü. 110 4.16. Landsat ETM+ görüntüsünün sınıflandırılması için (a) budama öncesi, (b) budama sonrası oluşturulan modeller. 114 xiii 4.17. C4.5 algoritması ve ön budama yöntemiyle oluşturulan tematik haritalar. (a) Landsat ETM+ görüntüsü (b) Terra ASTER görüntüsü. 114 4.18. Landsat ETM+ için oluşturulacak modelde seçilecek iterasyon sayısı ve elde edilen sınıflandırma doğrulukları. 115 4.19. Terra ASTER için oluşturulacak modelde seçilecek iterasyon sayısı ve elde edilen sınıflandırma doğrulukları. 116 4.20. Hızlandırma algoritması ile elde edilen tematik haritalar. (a) Landsat ETM+ görüntüsü, (b) Terra ASTER görüntüsü. 116 4.21. Landsat ETM+ için oluşturulacak modelde seçilecek iterasyon sayısı ve elde edilen sınıflandırma doğrulukları. 117 4.22. Terra ASTER için oluşturulacak modelde seçilecek iterasyon sayısı ve elde edilen sınıflandırma doğrulukları. 118 4.23. Torbalama yöntemiyle elde edilen tematik haritalar. (a) Landsat ETM+ görüntüsü, (b) Terra ASTER görüntüsü. 118 4.24. Landsat ETM+ için alt komitelerin sayısı ve sınıflandırma doğrulukları. 119 4.25. Landsat ETM+ için iterasyon sayısı ve sınıflandırma doğrulukları. 120 4.26. Terra ASTER için oluşturulacak modelde seçilecek alt komitelerin sayısı ve elde edilen sınıflandırma doğrulukları. 120 4.27. Terra ASTER için oluşturulacak modelde seçilecek iterasyon sayısı ve elde edilen sınıflandırma doğrulukları. 121 4.28. Çoklu hızlandırma algoritması ile elde edilen tematik haritalar. (a) Landsat ETM+ görüntüsü, (b) Terra ASTER görüntüsü. 122 4.29. Landsat ETM+ görüntüsü için çeşitli sayıdaki özellikler ile genel sınıflandırma doğruluğundaki değişimler. 123 4.30. Landsat ETM+ görüntüsü için üç özellik kullanılarak oluşturulacak ağaç sayıları ile genel sınıflandırma doğruluğundaki değişimler. 123 4.31. Terra ASTER görüntüsü için çeşitli sayıdaki özellikler ile genel sınıflandırma doğruluğundaki değişimler. 124 4.32. Terra ASTER görüntüsü için her bir düğümde iki özellik ile oluşturulacak ağaç sayıları ve genel sınıflandırma doğruluğundaki değişimler. 124 4.33. Rastgele orman algoritması ile elde edilen tematik haritalar. (a) Landsat ETM+ görüntüsü, (b) Terra ASTER görüntüsü. 125 xiv 4.34. DECORATE algoritması kullanılarak elde edilen tematik haritalar. (a) Landsat ETM+ görüntüsü, (b) Terra ASTER görüntüsü. 127 4.35. Yapay sinir ağları kullanılarak elde edilen tematik haritalar. (a) Landsat ETM+ görüntüsü, (b) Terra ASTER görüntüsü. 129 4.36. Landsat ETM+ görüntüsü için harmanlama parametresi ve genel sınıflandırma doğruluğundaki değişimler. 130 4.37. Terra ASTER görüntüsü için harmanlama parametresi ve genel sınıflandırma doğruluğundaki değişimler. 130 4.38. K-star algoritması kullanılarak elde edilen tematik haritalar. (a) Landsat ETM+ görüntüsü, (b) Terra ASTER görüntüsü 131 5.1. Landsat ETM+ ve Terra ASTER görüntüsünün sınıflandırılmasında kullanılan yöntemler ve elde edilen genel sınıflandırma doğrulukları. 132 xv TABLOLAR DİZİNİ Tablo Sayfa 2.1. Landsat uydularının teknik özellikleri 28 2.2. Terra ASTER uydusunun teknik özellikleri 29 2.3. SPOT uydularının teknik özellikleri 30 3.1. Kernel fonksiyonları ve kullanımları 43 3.2. Adaboost yönteminde kullanılan eğitim verilerinin oluşturulması 71 3.3. Torbalama yönteminde kullanılan eğitim verilerinin oluşturulması 72 4.1. En Çok Benzerlik (EÇB) yöntemi ile elde edilen sınıflandırma doğrulukları 98 4.2. Polinom kernel fonksiyonu için belirlenen en uygun parametre değerleri ve elde edilen genel sınıflandırma doğrulukları 103 4.3. Radyal Tabanlı Fonksiyon Kerneli için belirlenen en uygun parametre değerleri ve elde edilen genel sınıflandırma doğrulukları 107 4.4. Pearson VII fonksiyonu için belirlenen en uygun parametre değerleri ve elde edilen genel sınıflandırma doğrulukları 110 4.5. Landsat ETM+ ve Terra ASTER görüntülerin budama yapılmaksızın oluşturulan karar ağaçları ile sınıflandırılması ile elde edilen sonuçlar 112 4.6. Landsat ETM+ ve Terra ASTER görüntülerin ön budama yöntemiyle oluşturulan karar ağaçları ile sınıflandırılması ile elde edilen sonuçlar 113 4.7. DECORATE algoritması için belirlenen en uygun parametre değerleri ve elde edilen genel sınıflandırma doğrulukları 127 5.1. 1997 ve 2002 yıllarında arazi kullanımında meydana gelen değişimlerin analizi 137 1 1. GİRİŞ Uzaktan algılama teknolojilerinin kullanıldığı en önemli uygulama alanlarından birisi uydu görüntüleri yardımıyla arazi örtüsü ve/veya arazi kullanımının belirlenerek tematik haritalarının üretilmesidir. Arazi örtüsü ve/veya kullanımının belirlenmesi gerek planlama gerekse doğal çevrenin korunması açısından son derece önemlidir. Uzaktan algılama teknolojilerinin sahip olduğu en önemli avantajlar farklı konumsal, spektral, radyometrik ve zamansal çözünürlüklere sahip görüntüleri kullanma imkanı vermesidir. Zamansal çözünürlük özellikle arazi örtüsü/kullanımında meydana gelen değişimlerin tespit edilmesi ve sürdürülebilir çevre açısından önem kazanmaktadır. Uydu görüntüleri üzerinden arazi örtüsü/kullanımının belirlenmesi için en yaygın olarak kullanılan yöntem söz konusu görüntülerin sınıflandırılmasıdır. Görüntü sınıflandırma işleminin esası görüntü üzerindeki çeşitli spektral özelliklere sahip piksellerin, önceden belirlenen arazi örtüsü sınıflarından benzer olduğu bir sınıfa atanması olarak ifade edilebilir. Uzaktan algılamada uydu görüntülerinin sınıflandırılmasında kontrollü ve kontrolsüz sınıflandırma olarak bilinen iki yaklaşım vardır. Kontrolsüz sınıflandırma genellikle arazi hakkında herhangi bir ön bilgiye sahip olunmadığında veya arazi hakkında bir ön bilgi elde etmek için kullanılan bir yaklaşımdır. Bu yöntemde görüntü piksellerinin sahip olduğu spektral özellikler kullanılarak benzer özelliklere sahip piksellerin spektral sınıflar oluşturması ile işlem gerçekleştirilir. Kontrollü sınıflandırma olarak bilinen yaklaşımda sınıflandırma öncesinde tüm görüntüyü temsil eden ve sınıfları belli olan sınırlı sayıdaki piksellerin kullanımı söz konusudur. Kontrollü sınıflandırma yöntemlerinden literatürde en yaygın olarak kullanılan ve günümüzde görüntü analiz programlarının birçoğunda yer alan yöntem en çok benzerlik (EÇB) yöntemidir. EÇB istatistiksel bir teoriye dayanan parametrik bir sınıflandırma yöntemidir. Sınıfların normal dağılımda olduğu varsayımı nedeniyle sınırlandırmalar söz konusu olmasına rağmen bu yöntem en yaygın kullanılan sınıflandırma metotlarından birisidir [Wang, 1990; Hansen et al., 1996]. Son yıllarda 2 uzaktan algılanmış görüntülerin sınıflandırılmasında kullanılmaya başlanılan yapay sinir ağları, destek vektör makineleri, karar ağaçları ve örnek tabanlı sınıflandırıcılar gibi güçlü ve yüksek genelleştirme kabiliyetine sahip kontrollü sınıflandırma yöntemleri uygulamalarda yer almaktadır. Başlangıçta iki sınıflı verilerin sınıflandırılmasında kullanılan destek vektör makineleri (DVM) sınıflar arasındaki en uygun ayrımı yapan bir hiper düzlemin belirlenmesi esasına dayanmaktadır. DVM uzaktan algılanmış görüntülerde olduğu gibi çok sınıflı ve doğrusal olmayan verilerin sınıflandırılmasında kernel fonksiyonlarını kullanarak veriyi daha yüksek boyutlu bir uzayda görüntülemekte ve doğrusal olarak ayrımını gerçekleştirmektedir [Huang et al., 2002]. Karar ağaçları (KA) uydu görüntülerinin sınıflandırılması gibi karmaşık yapıdaki bir sınıflandırma problemini çok aşamalı bir hale getirerek bir karar verme işlemi gerçekleştirir [Safavaian and Landgrebe, 1991]. Her bir aşamada kullanılan değişkenlerin sayısına bağlı olarak tek değişkenli veya çok değişkenli karar ağaçları vardır [Friedl and Brodley, 1997]. Tek değişkenli karar ağaçları genellikle küresel ölçekte arazi örtüsü sınıflandırmaları için kullanılmaktadır [DeFries et al., 1998; Hansen et al., 2000]. Çok değişkenli karar ağaçları tek değişkenli karar ağaçlarına göre daha hassas olmalarına rağmen, daha karmaşık algoritmalar içermektedirler. Literartürde karar ağaçlarının sınıflandırma performansını arttırmaya yönelik çeşitli yaklaşımlar geliştirilmiştir. Bunlar arasında en çok kullanılan yaklaşım birden çok sınıflandırıcının birleştirilerek tek bir sınıflandırıcının elde edilmesi ve sonuç sınıflandırıcının kullanılması olarak ifade edilen yaklaşımdır [Opitz and Maclin, 1999; Pal and Mather, 2003]. Hızlandırma, torbalama, çoklu hızlandırma, rastgele orman ve DECORATE algoritmaları birleştirme işleminde kullanılana algoritmalardan en önemlileridir. Bu algoritmalar temel olarak yeniden örneklenen eğitim setleri ile sınıflandırıcıların ayrı ayrı eğitilmesi ve sonuçta ortaya çıkan tahminler ile sınıflandırma işleminin gerçekleştirilmesi işlemlerini içermektedirler. Yapay sinir ağları insan beynindeki nöronların temel çalışma prensibini esas alan sınıflandırma yöntemleridir. Eğitim örneklerini kullanarak problemi öğrenmekte ve test verileri ile yöntemin geçerliliği test edilmektedir. YSA algoritmalarının istatistiksel kabul gerektirmemeleri, farklı kaynaklardan gelen farklı karakterdeki 3 bilgileri aynı anda kolaylıkla kullanabilmeleri, gürültüyü tolere edebilmeleri ve öğrenebilme kabiliyetlerinden dolayı bu konuda birçok araştırma yapılmasına neden olmuştur. Günümüzde birçok yapay sinir ağı modeli geliştirilmiştir [Lippman, 1987]. Bunlar arasında çok katmanlı perseptron (ÇKP) uzaktan algılanan görüntülerin sınıflandırılmasında en yaygın olarak kullanılan [Paola and Schowengerdt, 1995; Atkinson and Tatnall, 1997] yöntem olmuştur. Örnek tabanlı sınıflandırıcılar, pikseller arasındaki spektral uzaklıkların yada benzerliklerin belirlenmesi ile sınıflandırma işlemini gerçekleştiren yöntemlerdir. Söz konusu uzaklıkların belirlenmesinde çeşitli uzaklık (benzerlik) fonksiyonlarından yararlanmaktadırlar. Cleary and Trig (1997) tarafından önerilmiş K-star sınıflandırıcısı pikseller arasındaki uzaklığın belirlenmesinde bilgi teorisine dayanan entropik uzaklık ölçüsünü kullanmaktadır. Bu tez çalışmasında Kocaeli ili, Gebze ilçesini kapsayan 1997 ve 2002 tarihli Landsat ETM+ ve Terra ASTER uydu görüntüleri üzerinden arazi örtüsü/kullanımının belirlenerek, tematik haritaların elde edilmesi amaçlanmıştır. Sınıflandırma işleminde en çok benzerlik sınıflandırıcısının yanında tez kapsamında detaylı olarak incelenen ileri sınıflandırma tekniklerinden yapay sinir ağları, destek vektör makineleri, karar ağaçları ve K-star sınıflandırıcıları kullanılmıştır. Bu tekniklerin yanında hızlandırma, torbalama, çoklu hızlandırma, rastgele orman ve DECORATE algoritmaları kullanılarak karar ağacı performansında meydana gelen değişimler analiz edilmiştir. Söz konusu ileri sınıflandırma tekniklerinin kullanımında kullanıcı tarafından belirlenmesi esas olan parametreler ve bu parametrelerin sınıflandırma sonucuna etkileri araştırılmış ve elde edilen sonuçlar analiz edilmiştir. Yöntemler için belirlenen en uygun parametre değerleri kullanılarak oluşturulan modeller ile Landsat ETM+ ve Terra ASTER görüntüleri sınıflandırılmış ve çalışma alanına ait arazi örtüsü/kullanımını gösteren tematik haritalar oluşturulmuştur. Çalışmada kullanılan tüm sınıflandırma yöntemleri karşılaştırılarak uzaktan algılanmış görüntülerin sınıflandırılmasında kullanımları, olumlu ve olumsuz yönleri değerlendirilerek irdelenmiştir. 4 2. UZAKTAN ALGILAMA VE TEMEL ESASLARI Uzaktan algılama bir cisimle direkt temas etmeksizin onun fiziksel özellikleri hakkında bilgi elde etme bilimi olarak tanımlanmaktadır [Lillesand and Kiefer, 1994]. Yeryüzünden belirli uzaklıkta, atmosferde veya uzayda hareket eden platformlara yerleştirilmiş ölçüm aletleriyle objelerle fiziksel temasa geçilmeksizin, yeryüzünün doğal ve yapay objeleri hakkında bilgi alma ve bunları değerlendirme tekniğidir [Sesören, 1999]. Jeoloji, ormancılık, hidroloji, tarım, şehircilik gibi bilim dalları uzaktan algılamanın uygulamalarının bulunduğu, bütünleştiği bilim dalıdır. Uzaktan algılamada uydular üzerinde taşınan algılayıcılar ile yapılan gözlem ve ölçümler dikkate alınmaktadır. Uzaktan algılama sistemlerinde ölçülen nicelik, ilgilenilen cisimden yayılan elektromanyetik enerjidir. Uydular veya hava araçları üzerinde taşınan aletlerle yapılan gözlem ve ölçümlerde elektromanyetik enerjiden yararlanılır [Kavzoğlu, 2008]. 2.1. Işık Kaynağı ve Elektromanyetik Enerji Uzaktan algılama teknolojileri ile yeryüzündeki objelerin algılanabilmesinde ilk gereksinim algılanmış enerji hedeften yayılmadıkça hedefi aydınlatmak için bir enerji kaynağına sahip olunmasıdır. Uzaktan algılamada kullanılan en önemli enerji kaynağı güneştir. Elektromanyetik enerji elektromanyetik dalgalar olarak yeryüzüne ulaşır. Işık bir enerjidir ve güneşten gelen elektromanyetik dalgalar halinde yeryüzüne ulaşır. Bu enerji elektromanyetik radyasyon şeklindedir. Uzaktan algılamada, enerjinin ışıma yolu ile taşınması elektromanyetik radyasyon olarak ifade edilir. Şekil 2.1’de genel yapısı gösterilen elektromanyetik radyasyon (EMR) bir elektriksel alan (E) ve elektriksel alana dik yönde bir manyetik alandan (M) oluşur. Bu alanlarda ışık hızında hareket eden sinüzoidal yapıdaki dalgaların her ikisi de yayılma yönüne dik açı yapmaktadırlar. 5 Şekil 2.1. Elektromanyetik dalgalar. Bir elektromanyetik dalga tepesinden diğerine olan uzaklığa dalga boyu denir. Birim zamanda sabit bir noktadan geçen dalga sayısı veya saniyedeki titreşim sayısı frekans olarak adlandırılır. Elektromanyetik enerjinin yayılma hızı aynı ortam içerisinde her yerde sabit olup 3x108 m/sn dir. Elektromanyetik spektrum (EMS), 3x108 m/sn hızla hareket eden, dalga uzunluğu nanometreden kilometreye kadar uzanan sürekli enerji ortamıdır. Bütün cisimler az veya çok elektromanyetik enerji yayarlar. Elektromanyetik spektrum yapılan çalışmalarda kolaylık sağlanması açısından belirli bölgelere ayrılmıştır. Ancak bu bölgeler arasında kesin bir sınır yoktur ve bazı kısımları çakışabilmektedir [Sesören, 1999]. Şekil 2.2’de elektromanyetik manyetik spektrum ve belirlenen bölgeleri gösterilmektedir. Bu bölgelerden yaklaşık olarak 0.4 µm ile 0.7 µm arası görünür bölge olarak adlandırılmakta ve insan gözünün görebildiği dalga boyu aralığını ifade etmektedir. Görünür bölge dalga boyu aralığı içerisinde 0.4 µm ile 0.5 µm mavi, 0.5 µm ile 0.6 µm yeşil ve 0.6 µm ile 0.7 µm kırmızı renge karşılık gelen dalga boylarıdır. Kızıl ötesi ışınlar özellikle de yakın kızıl ötesi; bitkilerde var olan klorofile duyarlıdır. Mikro dalga ışınlar ise yükseklik ve neme ilişkin çalışmalarda daha çok kullanılır. 0.4 µm 1.5 µm arası bitki, toprak ve kimyasal araştırmalar için kullanılmaktadır. Termal bantlar yeryüzü ısısını gösterirler. Bu bantlar özellikle jeolojik çalışmalar için önemlidir. Mineral, petrol ve kimya türü belirlenmesini bu bantlar yardımıyla yapabilmektedir. Özellikle gece ve gündüz algılanmış görüntüler bu araştırmalara yardımcı olur. Uzaktan algılanmış görüntülerin bilgisayarda görüntülenmesinde sadece üç ana renge atama yapabileceğimizden seçeceğimiz üç bantla False-Color görüntüleme yapılabilir [Kavzoğlu, 2008]. 6 Dalga Boyu (metre) Radyo Mikrodalga Kızılötesi Görünür Mor Ötesi X - ışını Gama - ışını Frekans (Hz) Şekil 2.2. Elektromanyetik spektrum ve uzaktan algılamada kullanılan bölgeleri. 2.2. Atmosferik Etkiler Güneşten yayılan elektromanyetik enerji yeryüzüne ulaşmadan önce yoğun bir atmosfer tabakasından geçişi ve atmosferi oluşturan bileşenler ile etkileşimi söz konusudur. Bu enerjinin atmosferi oluşturan bileşenlerle etkileşimi sonucunda enerji bir takım değişikliklere uğrar. Başka bir ifadeyle verilerin uçak veya uydu alıcıları tarafından algılanmalarında, algılayıcı ile hedef arasındaki atmosfer ve ışınım kaynağı ile hedef arasındaki atmosfer verileri etkiler. Atmosfer uzaktan algılama verilerini saçılma ve soğurulma olmak üzere iki şekilde etkileyebilir. Saçılım, ışınımın atmosferdeki taneciklerinden yansıması veya kırılması ile oluşur. Bu tanecikler atmosferi oluşturan gaz molekülleri, toz tanecikleri ve su damlacıklarıdır. Genel varsayım, ister güneşten gelsin ister yeryüzünden yansısın saçılan ışınımın zayıflamayıp sadece yeniden yönlendiğidir. Bu yeniden yönlenme genel olarak dalga boyuna bağlıdır. Saçılmayan ışınım ise, dalga boyuna bağlı olarak atmosfer tarafından soğurulur ve sonuçta atmosfer, soğurulan bu ışınım tarafından ısınır. Hiç soğurulma olmaması halinde saf saçılma olur. Bu durumda sadece enerji yeniden yönlenmiş olur. Uzaktan algılamada saçılımın etkisi, algılayıcının enerjinin bir bölümünü kaydedememesidir. 7 Saçılım, teorik olarak saçılan ışınımın dalga boyu ile saçılıma neden olan taneciklerin büyüklüğü arasındaki bağıntıya bağlı olarak üç farklı kategoriye ayrılabilir. Bunlar Rayleigh, Mie ve Seçici olmayan saçılımlardır. Rayleigh Saçılımı, ışının dalga boyunun, saçan taneciklerden çok daha büyük olması halinde oluşur. Bu saçılım sayesinde, gökyüzü mavi görünür. Güneşin batışındaki kızıllığın nedeni de bu saçılımdır. Güneş ufka yaklaştığında ışınlar atmosferde daha uzun bir yol kat ettiğinden daha kısa dalga boylu olan ışınımlar saçılır ve sadece kırmızı ve turuncu gibi daha uzun dalga boylu ışınım gözümüze gelir. Bu saçılımın etkisini gidermek için hava fotoğrafı çekimi sırasında özel filtreler konmaktadır. Mie saçılımı, ışığın dalga boyunun atmosferdeki taneciklerle yaklaşık eşit büyüklüklerde olmasından kaynaklanır. Bu saçılım genellikle puslu atmosferik koşullardaki spektrum boyunca oluşur ve görüntülerde genel bir kalite düşüklüğü şeklinde kendini gösterir. Seçici olmayan saçılım ise, taneciklerin ışının dalga boyundan çok daha geniş olması halinde oluşur. Bu saçılım genellikle atmosferin çok toz yüklü olması durumunda ortaya çıkar ve elde edilen verilerin önemli ölçüde zayıflamasına yol açar [Örmeci, 1987]. 2.3. Atmosferik Pencereler ve Nesnelerin İmzası Atmosfer, güneşten yeryüzüne gelen elektromanyetik enerjinin bazı bölümlerini büyük oranda soğururken, bazı bölümlerinin geçişine izin vermektedir. Elektromanyetik spektrumun fazla soğrulmadan atmosferden geçen bölümleri atmosferik pencereler olarak adlandırılmaktadır [Tatar ve Tatar, 2006]. Diğer bir ifadeyle atmosferik pencereler, elektromanyetik spektrumun radyasyonun geçmesine izin verdiği kısımlardır [Sesören, 1999]. Elektromanyetik spektrumda atmosferik pencerelerin bulunduğu dalga boyu bölgelerinde atmosferin içerisinde bulunan bileşikler güneşten gelen elektromanyetik enerjiyi; soğurma, yansıtma ve saçılma nedeniyle fazlaca etkilemezler. Bu nedenle, atmosfere gelen enerji pencerelerin bulunduğu yerlerden geçerek yeryüzüne ulaşabilirken, pencerelerin bulunmadığı dalga boyu aralıklarında atmosferden hemen hemen hiç geçememekte, dolayısıyla yer yüzeyine ulaşamamaktadır. Başlıca atmosferik pencereler, mor ötesi, görünür bölge, termal bölge, mikrodalgalar ve radar bölgelerinde bulunmaktadır. Uzaktan 8 algılama çalışmalarında uygulama konusuna göre bant seçiminde söz konusu atmosferik pencereler son derece önemlidir. Elektromanyetik enerjinin 400 µm’den küçük ve 1 µm’nin üzerindeki dalga boyları atmosferin bileşenleri tarafından soğurulur. Görünür bölge dalga boyu aralığının tamamı bir atmosferik pencereye oluştururken, kızılötesi dalga boyu aralığının yalnızca bazı bölgelerinde atmosferik pencereler mevcuttur. Bu nedenle uzaktan algılama uygulamalarında görünür, kızılötesi ve termal dalga boyları kullanılmaktadır [Sesören, 1999]. Uzaktan algılama dalga uzunluğu ve cismin ısısına bağlı olarak ışıyan enerji miktarı önemlidir. Elektromanyetik enerji katı, sıvı veya gaz halindeki cisimlerle temasta şiddet, doğrultu, dalga uzunluğu, polarizasyon ve faz farkı gibi bakımlardan birçok değişikliğe uğramaktadır. Uzaktan algılamada bu değişiklikler belirlenip, kayıt edilir. Bu işlem sonucu ortaya çıkan görüntü ve veriler kayıt edilen elektromanyetik ışınımda değişikliğe neden olan cismin özelliklerinin belirlenmesi için yorumlanmaktadır [Örmeci, 1987]. Bir cisme veya yüzeye kaynaktan (güneş) gelen enerji geçirilir, yutulur, saçılır ve/veya yansıtılır. Cisim ve enerji arasındaki bu ilişki uzaktan algılamanın temelini oluşturmaktadır. Uzaktan algılanmış görüntülerde her element veya objenin yapısına göre bu objeler farklı şekilde algılanır. Diğer bir ifadeyle, yeryüzü üzerindeki her bir objenin elektromanyetik enerji ile ilişkisi farklıdır. Uzaktan algılamada buna nesnelerin imzası veya özel davranışı denir. Yeryüzü üzerindeki objelerin uzaktan algılama yöntemiyle ayırt edilebilmelerinin en önemli nedeni; yeryüzü üzerinde bulunan objelerin farklı spektral özelliklere sahip olmasıdır. Uzaktan algılama sistemleri, seçilen dalga boyu bantlarında yer yüzeyindeki cisimlerden yansıyan ve yayılan enerji miktarlarındaki değişimleri kayıt etmektedir. Veriler, fotoğrafik algılayıcılarla doğrudan doğruya fotoğrafik film olarak kaydedilebileceği gibi; tarayıcı sistemlerle yansıyan veya yayılan enerji manyetik bir banda sayısal olarak kaydedilebilir. Daha sonra elde edilen bu veriler yeryüzü üzerindeki objelerin yorumlanması ve analizi için kullanılmaktadır. Elektromanyetik enerjinin herhangi bir cisimle etkileşimi dalga boyuyla ilişkilidir. Bir başka deyişle, farklı etkileşimler enerjinin farklı dalga boylarında olur. Enerji etkileşiminin dalga boyuna bağımlı olması nedeniyle, uzaktan algılayıcılar 9 farklı cisimlerdeki bu değişikliği çeşitli dalga boyları için ayırt edilebilecek şekilde tasarlanmıştır. Yansıyan, soğurulan ve geçirilen enerji miktarı; yeryüzüne ait nesnenin türü ve durumuna bağlı olarak değişmektedir. Bu değişiklikler, bir görüntü üzerindeki farklı nesneleri sınıflandırma olanağı verir. Söz konusu nesne için yansıyan, soğrulan ve geçirilen enerji her bağımsız dalga boyunda farklılık gösterir. Bu nedenle herhangi iki nesne bir spektral alanda sınıflandırılamazken, bir başka dalga boyu bandında çok büyük farklılıklar gösterebilir. Uzaktan algılanan verilerinin bilgisayar ortamında analiz edilebilmesi için objelerin spektral özelliklerinin bilinmesi gerekmektedir. Bu nedenle çeşitli bitki örtülerinin, toprağın, suyun ve ilgilenilen diğer yer yüzeyi özelliklerinin spektral özelliklerinin bilinmesi, uzaktan algılanan verilerin uygun bir şekilde analizi ve yorumlanması açısından son derece önemlidir [Maktav ve Sunar, 1991]. Şekil 2.3’te bitki örtüsü, toprak ve suya ait spektral yansıma eğrileri gösterilmiştir. Şekilde görüleceği üzere yeşil bitki örtüsünün spektral yansıtımı diğerlerinden farklı olup dalga boyuna göre değişmektedir. Görünür dalga boylarında (0.4–0.7 µm) özellikle yeşil bitkilerin yapısında yoğun bir şekilde bulunan klorofil maddesi önemlidir. Yakın kızılötesi bölgesinde yansıtım önemli derecede artar, çünkü bu bölgede yeşil yaprak çok az enerji soğurmaktadır. Orta kızıl ötesi bölgede ise su belirli dalga boylarındaki enerjiyi çok fazla soğurur ve yeşil yapraklar çok fazla nem içerdiğinden bu su-soğurma bantları bu bölgede baskındır. Bitkilerdeki klorofilin soğurması mavi ve kırmızı bantlarda gerçekleşir. 0.5–0.6 µm arası klorofil yansıtması mavi ve kırmızıya göre daha yüksektir. Ancak en yüksek yansıma değeri yakın kızılötesi bölgesinde oluşur. Görünür dalga boylarında, yeşil bir yaprağa gelen enerjinin büyük bir kısmı soğurulur ve çok azı yapraktan geçer. Yeşil dalga boylarındaki bu düşük soğurma sağlıklı yaprakları yeşil olarak görmemize neden olmaktadır. Bitkilerin yapısında karoten, ksantofil ve antosyanin pigmentleri bulunmaktadır. Yeşil bir bitki yaşlandıkça yapısındaki klorofil miktarı azalır ve bitki yapısındaki karoten ve ksantofil pigmentleri baskın hale gelir. Bu durum ağaç yapraklarının son baharda sarı renk almasının temel nedenidir. Bazı ağaç türlerinin sonbaharda açık kırmızı görünmesinin nedeni ise aynı şekilde klorofil miktarının azalması ile birlikte ağaç yapısındaki antosyanin pigmentlerinin baskın hale gelmesidir.[Maktav ve Sunar, 1991]. 10 60 Toprak Yansıtma Oranı (%) 50 Bitki 40 30 Yakın Kızılötesi 20 Su 10 0.3 0.5 0.7 0.9 1.1 1.3 1.5 1.7 1.9 2.1 2.3 Dalga Boyları (µm) Şekil 2.3. Toprak, bitki ve su için genelleştirilmiş spektral yansıtım grafiği. Toprak maddelerinin çoğunun spektral özellikleri genellikle bitki örtülerinde olduğu kadar karmaşık değildir. Toprağın spektral yansıması temel olarak kimyasal yapısına (mineral ve organik maddeler), optik geometrik saçılmaya (parçacık büyüklüğü ve pürüzlülük) ve yüzeyin nemlilik durumuna bağlıdır. Büyük tanecikler arasındaki boşluklarda hava ve su birikir bu da yansıma değerini düşürür. Küçük tanecikliler daha çok yansıma verir. Nemli olunca daha az yansıma verir. Organik madde içeriği arttıkça yansıma değeri düşer ve toprak daha koyu gözükür. Demir oksit miktarı da yansımayı düşürür. Topraktaki nemin belirlenmesinde termal bant çok önemlidir. Çünkü nemli olan yerde buharlaşma olur ve çevreye göre daha soğuktur. Yansıtıcı bölgede çok koyu termal bölgede çok açık olan bir toprak organik içerik açısından zayıftır [Maktav ve Sunar, 1991]. Suyun spektral duyarlılığı dalga boyuna göre değişmektedir. Su ile enerji arasındaki etkileşimler, suyun mevcut yapısının bir sonucudur ve suyun çeşitli durumlarından etkilenir. Suyun diğer örtü tiplerinden ayrımı en iyi şekilde yansıtıcı kızılötesi dalga boyları (yakın kızılötesi ve orta kızılötesi) kullanılarak yapılır. Su kitlelerinin uzaktan algılama ile konumlandırılması ve sınıflandırılması, en kolay, yakın kızılötesi dalga boylarında yapılabilir. Diğer taraftan suyun durumunun bazı yönleri ise, görünür dalga boylarında elde edilen verilerin kullanılması ile en iyi saptanabilir. Doğal bir ortamda, su çok sığ bile olsa, su kitleleri, yakın kızılötesi ve 11 orta kızıl ötesi dalga boylarının her ikisinde de, gelen enerjinin hemen hemen tümünü soğurur. Suyun, enerjiyi, yakın ve kızıl ötesi dalga boylarında bu kadar etkin bir biçimde soğurması nedeniyle, bu dalga boylarında yansıtılacak çok az enerji vardır. Bu durum, su özelliklerinin, spektrumun yansıtıcı kızılötesi bölgesi boyunca, hem bitki örtüsünden, hem topraktan daha önemli ve daha farklı bir düşük yansıtıma sahip olmasına neden olduğundan, uzaktan algılama amaçları açısından oldukça avantajlıdır. Kızılötesi yansıtımdaki bu tür belirgin farklar, su kitlelerinin kolaylıkla tanımlanmasını ve haritalanmasını sağlamaktadır [Maktav ve Sunar, 1991]. Yeryüzü üzerindeki çeşitlilik düşünüldüğünde, yer yüzeyi üzerindeki objelerin spektral özelliklerinin her yerde aynı olmadığı görülmektedir. Hatta herhangi bir objeye ait spektral özelliklerin dahi coğrafi konuma ve zamana göre değişkenlik gösterdiği söylenebilir. Örneğin buğday, güneyde olgunlaşmış ve biçilmekte iken, aynı tarihte kuzeyde halen yeşildir ve bu nedenle buğday tamamen farklı bir spektral özelliğe sahiptir. Zamana bağlı değişim göz önüne alındığında; örneğin Temmuz ayında yeşil olan bir orman örtüsü, Eylül sonlarında cinsine bağlı olarak kırmızı, sarı veya kahverengi olabilir. Çok sayıda yaprak döken ağaçlar ve geniş yeşil alanlara sahip bölgeler; sonbaharda yapraklar ağaçlardan döküldükten ve çimenler sarardıktan sonra, birkaç ay öncesine nazaran çok farklı spektral özelliğe sahip olacaklardır. Bu nedenle, uzaktan algılama verileri için en uygun zamanın belirlenmesinde; yeryüzü üzerindeki biyolojik çeşitliliğe ait mevsimsel değişimlerin veya zamana göre değişebilirliğin dikkate alınması gerekir [Kavzoğlu, 2008]. 2.4. Uzaktan Algılamada Çözünürlük Kavramı Çözünürlük genel anlamda ekranda veya monitörde görünen piksel sayısını ifade ederken uzaktan algılamada görüntüdeki bir pikselin yeryüzündeki karşılığını ifade etmektedir. Bir resim, görüntü matrisini oluşturmak üzere ızgara biçiminde küçük alanlara bölündüğü zaman oluşan her elemana resim elemanı ya da piksel adı verilir. Geometrik ayrım, diğer bir ifadeyle çözünürlük kavramı ile yakından ilişkili olan piksel sayısı görüntünün en küçük parçasıdır. Her bir piksel Ps x , Ps y boyutunda bir resim elemanına karşılık gelir. Piksellerin bu Ps x , Ps y boyutuna geometrik çözünürlük denir [Ayhan, 2003]. Pikseller genellikle kare biçimindedirler. 12 Yeryüzünde bir piksele karşılık gelen alan ne kadar değişik görünüm ve değere sahip olursa olsun, pikselin bir spektral banttaki değeri tek bir sayı ile ifade edilir. Sayısal bir görüntü, bir resmin sürekli bir biçimde sayısallaştırılması ile elde edilebileceği gibi, modern çok bantlı tarayıcılar ve bazı elektronik kameralar ile direkt olarak elde edilebilirler. Sayısal görüntü elde edebilen bir tarayıcı yapısı itibariyle belirli bir anda yeryüzünde ancak belirli bir alana ait spektral değeri kaydeder. Algılayıcının belirli bir anda yeryüzünde görüntüleyebildiği alana anlık görüş alanı adı verilir. Uzaktan algılamada konumsal, spektral, radyometrik ve zamansal çözünürlük olmak üzere dört farklı çözünürlük söz konusudur. 2.4.1. Konumsal Çözünürlük Konumsal çözünürlük veya konumsal ayırma gücü görüntü üzerindeki objelerin ayırt edilebilirliği ile ilgilidir ve belirlenebilen özelliğin olası en küçük boyutunu ifade eder. Başka bir ifadeyle; bir görüntüleme sistemi tarafından kayıt edilebilen iki nesne arasındaki en küçük uzaklık olarak tanımlanan konumsal çözünürlük amaca bağlı olarak değişik ölçütlerle belirlenebilir [Ayhan, 2003]. Bu ölçütlerden birisi algılayıcının anlık görüş alanıdır (AGA). Konumsal çözünürlüğün en genel şekilde tanımı görüntüyü kaydeden sistemin alıcısının anlık görüş alanının yeryüzünde karşılığı olarak ifade edilebilir. Anlık görüş alanı, uzaktan algılama uyduları üzerinde bulunan tarayıcı optiğin gücünü ifade eder ve herhangi bir anda belirli bir yükseklikten algılayıcı sensör ile gözlenen veya kayıt edilen yeryüzüne karşılık gelen alan olarak tanımlanabilir. Uzaktan algılamada bir sensörün veya alıcının anlık görüş alanı açısaldır; yeryüzündeki karşılığı da uydu yüksekliğine göre değişebilmektedir (Şekil 2.4). Bu büyüklük aynı zamanda pikselin boyutuna eşittir. Anlık görüş alanı açısal ve uzunluk olarak iki şekilde ifade edilebilir. 13 Şekil 2.4. Uzaktan algılama uyduları için anlık görüş alanının açısal ve uzunluk olarak ifadesi. Şekilde X-Y noktaları arasındaki mesafe anlık görüş alanıdır ve bu uzaklık uydu görüntüsünde yaklaşık olarak bir piksele karşılık gelmektedir. Bu uzunluk algılayıcı tarafından yeryüzünde ayırt edilmesi mümkün olan en küçük uzunluktur. Şekil 2.5’de aynı bölgeye ait farklı konumsal çözünürlüğe sahip uydu görüntülerine ait örnekler verilmiştir. Şekilde konumsal çözünürlüğün artmasıyla görüntüdeki objelerin birbirinden ayırt edilebilirliğinin arttığı ve yorumlanma açısından daha kolay bir hale geldiği açıkça görülmektedir. Aynı şekilde çözünürlük azaldıkça objelerin ayırt edilebilmesi ve görüntünün analizi zorlaşmaktadır. (a) (b) (c) Şekil 2.5. Konumsal çözünürlük kavramı. (a) 1 metre, (b) 10 metre, (c) 30 metre çözünürlüklü görüntüler. 14 2.4.2. Spektral Çözünürlük Spektral çözünürlük, algılayıcının kaydedebileceği elektromanyetik spektrumun dalga aralıklarını ve sayısını ifade etmektedir. Bu çözünürlük genel tanımıyla kullanılan bantların sayısını ve genişliğini ifade eder. Spektral çözünürlük yeryüzündeki cisimlerin ve arazi türlerinin uzaktan algılama yolu ile tanımlanabilmeleri için gerekli olan en önemli özelliktir. Spektral özellik, her cismin yansıma, yayılma, geçirgenlik ve soğurma özelliği olarak ifade edilebilir. Algılayıcıların tasarımı da bu spektral özelliklerdeki değişiklikleri fark edecek ve istenen ayrımları yapabilecek şekilde yapılmıştır. Yeryüzündeki cisimlerin spektral özellikleri ile kendilerine has özellikleri arasında kuvvetli bir ilişki vardır. Her spektral bant elektromanyetik spektrumun belirli bir bölümüne duyarlıdır. Bu bölümlerde başlangıç ve bitiş dalga boyları ya da merkez frekansı ve bant genişliği biçiminde verilir. Uzaktan algılama aletlerinin spektral ayırma gücü kullanılan bant genişliği ile belirlenir. Daha iyi spektral çözünürlük özel bir kanal ya da bant için daha dar dalga boyu aralığı anlamındadır. Teorik olarak spektrum ne kadar çok ve küçük parçaya ayrılırsa, spektral ayırma gücü de o kadar artar. Bu nedenle en iyi çözüm en az bant kullanılarak istenilen ayrımı yapabilmektir. Spektrumun pozisyonu, genişliği ve sayısı hedefe göre düzenlenir. Spektrumun değişik bölgelerini kullanan çok bantlı görüntülere Multi-Spektral Görüntüler adı verilir. Çok bantlı veri setleri, her bir tabaka için dijital değerler ile her bir pikselin birleştirildiği değişken sayıdaki tabakaları içermektedir. Veri içinde her bir tabaka bir bandı kapsamaktadır. Uzaktan algılama uydularına ait spektral çözünürlük uydunun kaç bantta görüntü verdiği ve kullanılan her bir bandın genişliğine özelliklerine göre tanımlanır. Örneğin, Landsat MSS dört bant içinde verileri edinirken, Landsat TM yedi bantlı bir sistem içinde aynı işlemi gerçekleştirir [Gibson, 2000]. 2.4.3. Radyometrik Çözünürlük Piksellerin yapısı, bir görüntünün uzaysal yapısını tanımlarken, radyometrik özellikler bir görüntüdeki gerçek bilgiyi ifade etmektedir. Bir filmden ya da bir algılayıcı tarafından elde edilen görüntünün elektromanyetik enerji miktarına duyarlılığı, radyometrik çözünürlüğü ifade etmektedir. Yeryüzündeki her bir piksele karşılık gelen alanlardan yansıyan ışığın şiddetine göre her obje, algılayıcılar 15 tarafından değişik derecelerde kaydedilir. Buna o alıcının radyometrik çözünürlüğü adı verilir. Kısaca radyometrik çözünürlük, objeleri tanımlamada ve ayırt etmede kullanılan toplam renk tonu sayısıdır. Derecelendirme veya tonlandırma ne kadar yüksek olursa, ayırt etme gücü de o kadar yüksek olur. Bir uzaktan algılama sisteminde radyometrik çözünürlük, siyah ve beyaz renkleri arasında ölçülen gri derecelerinin sayısını ölçmektedir. Radyometrik çözünürlükte ölçme değeri bit olarak adlandırılır. Bir bitlik sistem sadece iki gri düzeyini ölçebilmektedir (21=2). 8-bitlik bir sistemde 256 gri derecesi kaydedilmektedir. Böyle bir sistemde siyah renk dijital değer olarak sıfıra, beyaz renk ise 255 değerine atanmaktadır. Çoğu uzaktan algılama sisteminde radyometrik çözünürlük 6-bit ya da daha fazladır [Gibson, 2000]. Birbirlerinden farklı amaçlara hizmet eden uydular farklı radyometrik çözünürlüklere sahiplerdir. Örneğin, Landsat 1 ve Landsat 3 uyduları 6 bitlik çözünürlüğe sahipken, Hyperion uydusu 12 bitlik çözünürlüktedir. 2.4.4. Zamansal Çözünürlük Zaman içindeki değişimleri göstermeleri birçok cisim için ayrımı kolaylaştırıcı etken olmaktadır. Görüntülerin farklı zamanlarda, değişik zaman aralıklarıyla alınması çok zamanlı uydu görüntülerin elde edilmesini sağlar. Burada hem iki görüntü arasındaki zaman farkı hem de alım zamanı önemlidir. Uygun zaman aralığı amaca bağlı olarak yıl, mevsim, birkaç gün veya hafta olabilir. Uzaktan algılamanın önemli işlevlerinden biri de zaman içerisindeki değişimleri izlemektir. Bu nedenle algılayıcı sistemin ayırma gücü özelliklerin belirlenmesinde zamansal ayırma gücü sistem için tanıtıcı bir özellik olmaktadır [Ayhan, 2003]. Uzaktan algılama sistemleri için zamansal çözünürlük, aynı alan için hangi sıklıkta verilerin edinildiğini ifade etmektedir [Gibson, 2000]. Bir alıcının belirli bir noktayı ardışık olarak algılayabileceği zaman dilimidir. Örneğin, Spot uydusu 26 günde bir aynı noktadan geçerken Landsat uydularından 1. 2. ve 3. uydular 18 günde bir; 4. 5. ve 6. uydular ise 16 günde bir aynı noktadan geçerler. Atmosferik etkiler nedeniyle her uydu geçişi sırasında yapılan kayıt kullanılamamaktadır. 16 2.5. Uzaktan Algılamada Görüntü Analiz Sistemleri Uzaktan algılanan görüntülerin analiz ve yorumlanması, görüntüler üzerinden yararlı bilgilerin çıkarılması için görüntüdeki değişik hedeflerin belirlenmesi veya ölçümünü içerir. Hedefler; noktalar, çizgiler veya alanları içeren doğal veya yapay özellikler olabilir ve bu hedefler yansıttıkları veya yaydıkları radyasyon yardımıyla tanımlanabilirler. Bu radyasyon bir algılayıcı tarafından ölçülebilir veya kaydedilebilir. Hedefler ve onların çevresi ile arasındaki farkların gözlenmesi ton, şekil, boyut, desen, doku, gölge ve ilişki gibi görüntü elemanlarının herhangi biri veya hepsinin kullanılması ile gerçekleştirilir [Ayhan, 2003]. Elde edilen görüntüler analog veya sayısal formatta olabilirler. Analog formatta görüntülenmiş görüntülerde hedefin belirlenmesi ve yorumlanması bir yorumlayıcı tarafından manuel veya görsel olarak yapılır. Sayısal formattaki görüntüler piksellerden oluşmaktadır. Görüntü üzerindeki her bir piksel parlaklık derecesini gösteren sayısal bir değere sahiptir. Pikseller bilgisayar ortamında bir araya getirilerek sayısal görüntü elde edilir. Özel yazılımlarla bilgisayar ortamında piksellerin sayısal değerleri üzerinde sistematik değişiklikler yapılabilmesi olanağı, görüntülerin sayısal olarak işlenmesi ve yorumlanması için temel oluşturmaktadır. Görüntü analiz sistemlerinde en yaygın görüntü işleme fonksiyonları; ön işlem, görüntü iyileştirme, görüntü dönüşümleri, görüntü sınıflandırma ve analizidir [Lillesand and Kiefer, 1994]. 2.5.1. Ön İşlem Ön işlemler, elde edilen sayısal uydu görüntüsüne ait verilerden istenilen bilgilerin veya özelliklerin elde edilmesi için gerekli olan hazırlıkları içerir ve bunlar radyometrik ve geometrik düzeltmeler olarak sınıflandırılır. Ön işlem aşamasında uydu görüntüleri radyometrik ve geometrik düzeltmelere tabii tutulurlar. Bazen bu işlemlere görüntü restorasyonu veya rektifikasyonu adı verilir. Ön işlemde amaç, algılayıcı ve platformdan kaynaklanan radyometrik ve geometrik bozulmaları ortadan kaldırmaktır. Radyometrik düzeltmeler, algılayıcı düzensizlikleri, istenmeyen algılar, atmosferik gürültülerin düzeltilmesi ve sensör tarafından ölçülen radyasyonun doğru şekilde gösterimi için gerekli dönüşümleri içerir. Geometrik sapmalar ise birçok faktöre bağlıdır. Bunlar; algılayıcı aygıt optiğinin yapısı, tarama sistemlerinin hareketi, platform hareketi, platformun yüksekliği, arazinin eğimi ve 17 yeryüzünün küreselliğidir [Kavzoğlu, 2008]. Uydu platformlarına monte edilmiş algılayıcılardan elde edilen görüntüler ham hallerinde bazı hatalar ve eksiklikler içerirler. Bu hataların ve eksikliklerin düzeltilmesi, istenen amaca uygun olarak yapılacak uygulamalar öncesinde gerçekleştirdiğimizden dolayı bu tip işlemlere ön işlemler adı verilir. Düzeltmelerin bazıları yer istasyonlarında yapılmasına rağmen, kullanıcı tarafından da düzeltme yapılmasına sıkça gerek duyulmaktadır. Bu düzeltmelerden birisi, atmosferik etkilerin giderilmesi amacıyla yapılan düzeltmelerdir. Fakat bazı özel durumlarda bu düzeltmeye gerek duyulmaz. Tek bir zamanda belirli bir alandaki bitki örtüsünün veya diğer özelliklerin analizlerinin yapılmasında araştırmacı piksellerin asıl değerlerinden çok bu piksellerin birbirlerine göre göreceli değerleri ile ilgilenildiğinden piksel değerlerinin atmosferik etkilerden arındırılması gereksizdir. Fakat değişik zamanlarda elde edilen görüntülerin kullanılmasında atmosferik etkilerin giderilmesi gerekir. Geometrik ve radyometrik düzeltmeler görüntü iyileştirme ve görüntü sınıflandırma işlemlerinden önce yapılması gereken ön işlemlerdir. Geometrik düzeltmenin amacı, görüntüyü geometrik olarak gerçek dünyaya en yakın şekle dönüştürmektir. Geometrik sapmaların birçoğu sistematik olduğundan uygun modeller oluşturularak giderilebilir. Sistematik olmayan veya rastgele hatalar modellenemez. Geometrik düzeltme, bilinen bir koordinat sistemine dönüşüm yapılarak sağlanabilir. Geometrik düzeltme işlemi ile ham haldeki uydu görüntüsü, bulunduğu resim koordinat sisteminden, görüntü üzerinde ve arazideki koordinatları bilinen uygun sayı ve konumdaki yer kontrol noktaları yardımıyla arazi koordinat sistemine dönüştürülür. Bu işleme görüntüden haritaya geçiş denir. Ham haldeki görüntünün geometrik olarak düzeltilmesinde kullanılan bir diğer yöntem görüntüden görüntüye dönüşümdür. Bu yöntemde daha önce coğrafik olarak referanslandırılmış diğer bir görüntü yardımıyla, her iki görüntüdeki ortak noktalar kullanılarak geometrik düzeltme işlemi gerçekleştirilir [Mather, 1987]. Uydu görüntüleri geometrik olarak düzeltilip kullanıcı tarafından belirlenmiş herhangi bir koordinat sistemine bağlandıktan sonra ortaya çıkan görüntü eğiminden dolayı oluşan piksellere yeni değerlerin atanması gerekir. Diğer bir ifadeyle, geometrik olarak düzeltilmiş görüntü üzerindeki piksellere ait sayısal bilgiler geometrik dönüşüm sonucunda olması gerekenden farklı olabilirler. Bu nedenle 18 düzeltilmiş görüntüdeki yeni piksellerin sayısal değerlerinin belirlenmesinde yeniden örnekleme adı verilen bir işlem kullanılır. Yeniden örnekleme ile geometrik dönüşüm öncesinde görüntüdeki orijinal sayısal piksel değerleri yardımıyla yeni piksel değerleri hesaplanır. En yakın komşuluk, bilineer enterpolasyon ve kübik eğri olarak bilinen üç farklı yöntem yeniden örnekleme işleminin gerçekleştirilmesinde kullanılmaktadır. En yakın komşuluk yönteminde, orjinal görüntüde yeni piksel konumuna en yakın sayısal piksel değerlerinden faydalanılarak düzeltilmiş piksel değerleri hesaplanır. Bu metot basit bir mantığa dayanır ve orijinal değerler değişmediğinden en çok tercih edilen yöntemdir. Bilineer enterpolasyon yönteminde, orijinal görüntüde yeni piksel konumuna en yakın dört pikselin ortalama ağırlığı kullanılarak yeni piksel değerleri hesaplanır. Bu durumda orjinal piksel değerleri değişir ve yeni piksel değerleri oluşur. Kübik eğri yöntemi ile yeniden örnekleme işleminde orijinal görüntüde yeni piksel konumunu çevreleyen sekiz pikselli bir bloğun ağırlıklı ortalaması kullanılarak yeni piksel değeri hesaplanır. Bilineer enterpolasyonda olduğu gibi bu metotta tamamen yeni piksel değerleriyle sonuçlanır. Bir görüntüdeki bozukluklar ya da gürültüler; düzensizlikler ya da verinin alınması ve veri iletimi esnasında meydana gelen olaylardan dolayı olabilir. Bozuklukların ortak yapısı sistematik kayıplar içermesi ya da bant alımı esnasındaki kayıplardır. Kayıp hatlar bant alımı esnasındaki değişim ve sürüklenmeden dolayı meydana gelir. Kayıp hatlar normal olarak, hattın altında ya da üstündeki değerlerle ya da her ikisinin ortalaması yeni bir hatla düzeltilir. Radyometrik bir düzeltmenin gerçekleştirilmesi bazı filtreleme yöntemlerinin kullanılmasıyla da yapılabilmektedir [Altuntaş ve Çorumluoğlu, 2002]. 2.5.2. Görüntü İyileştirme Görüntü iyileştirme işlemi, görüntünün görsel yorumlama ve anlaşılmasını artırmak için yapılır. Görüntü üzerinde zıtlık ve netlik düzeltmeleri ve çeşitli filtreleme teknikleriyle aynı ham görüntüden farklı renkli görüntüler üretilmesi işlemidir [Tatar ve Tatar, 2006]. Hedeflerin farklı durumlarından dolayı spektral yansımalarındaki büyük değişimlerle ilgili radyometrik düzeltmeler, bütün hedeflerde optimum kontrast ve parlaklık gösterimi için hesaplanabilir. Bu nedenle, her uygulama ve her görüntü için, mutlaka alanın tanınması ve yansıma değerlerinin 19 dağıtımı gereklidir [Sabins, 1987]. En yaygın olarak kullanılan örüntü iyileştirme yöntemleri lineer kontrast artırımı, histogram eşitleme, yoğunluğa göre derecelendirme ve sahte renk (pseudo-color) dönüşümüdür. Lineer kontrast artırımı yöntemi ile görüntüdeki minimum piksel değeri sıfıra, maksimum piksel değeri de 255 değerine atanması için lineer enterpolasyon metodu geliştirilir. Eğer renkli bir görüntü elde edilecekse, bu işlem üç bant için ayrı ayrı yapılır ve sonra sonuçlar üç ana renk olan kırmızı, yeşil ve mavi (KYM)’ye atanır. Histogram eşitleme yönteminde sadece minimum ve maksimum değerler yerine görüntüdeki tüm piksel değerlerinin oluşturduğu histogram dikkate alınarak daha karmaşık bir görüntü iyileştirme yapılabilir. Böylece histogramın boyutları ve şekli dikkate alınmış olur. Bu metotta görüntüdeki her bir derecenin (renk tonunun) yaklaşık olarak eşit sayıda piksel içerdiği kabulü yapılır. Histogram eşitleme görüntü iyileştirme teknikleri arasında en çok kullanılan ve en iyi sonuç veren metottur. Bu teknikte kenar gruplar birleştirilirken orta gruplar daha ayrık hale getirilip görüntü kalitesi iyileştirilir. Yoğunluğa göre derecelendirme yönteminde amaç, ard arda gelen bazı piksel değerlerini bir grup altında birleştirip; kırmızı, yeşil ve mavi (KYM) olarak tanımlanmış bir renkle ifade etmektir. Sonuçta 0–255 aralığındaki değerler birkaç renkle ifade edilir. Özellikle siyah-beyaz görüntülerdeki homojen alanların renkli şekilde görüntülenmesinde kullanılır. Bu dönüşümle 256 renkli bir görüntüden birkaç renge dönüşüm yapıldığından, görüntüdeki ayrıntılar kaybolur. Sahte renk dönüşümü ile tek bir bandın gri tonlar yerine yalancı olara renklendirilmesidir. Bu işlemi gerçekleştirmek için asal bir KYM histogram dönüşümü kullanılır. Ayrıntılı bilgi Mather (1987) den elde edilebilir. 2.5.3. Görüntü Dönüşümleri Görüntü dönüşümleri yardımıyla görüntüde yer alan farklı fiziksel özellikler arasındaki ayrımın ve görüntünün görsel yorumlanabilirliğinin arttırılması amaçlanmaktadır. Bunu gerçekleştirmek için ise çeşitli sayısal filtreleme matrisleri kullanılır. Görüntüdeki farkların vurgulanması, kenar çizgilerinin vurgulanması ya da giderilmesi işlemleri için farklı sayı matrisleri kullanılmaktadır. Görüntüler üzerinde matris işlemlerine benzer şekilde tüm temel matematiksel işlemler (toplama, çıkarma, çarpma, bölme) gerçekleştirebilir. Bölme işlemi, özellikle topoğrafik 20 etkilerin azaltılmasına ve giderilmesine olanak sağlar. Sayısal filtreleme yönteminde her bir pikselin yeni gri renk tonları hesaplanmaktadır. Piksellerin yeni gri tonları yalnızca ortaya çıkarılacak detaya bağlı değil komşu piksellere de bağlıdır. Uzaysal frekans filtreleme de denilen bu işlemde, bir görüntüde istenilen detayı ortaya çıkarabilmek için; yüksek, orta ve düşük frekanslı filtrelerden birisi kullanır. 2.5.4. Görüntü Sınıflandırma ve Analiz Ham halde elde edilen uydu görüntülerinden yeryüzüne ait bilgilerin elde edilmesi için çeşitli istatistiksel analizler ve yorumlama teknikleri kullanılmaktadır. Verileri bilgiye dönüştürebilmek için en yaygın yöntem uydu görüntülerinin sınıflandırılmasıdır. Uzaktan algılamada sınıflandırma, cisimlerin farklı spektral yansıtma değerleri esasına dayanarak orijinal görüntüdeki her görüntü elemanını ait olduğu özellik grubuna ayırma işlemidir. Ayırt etme ya da tanıma problemi her pikselin, algılama yapılan spektral bantlara göre farklılık gösteren sayısal değerler kümesinden yaralanılarak aşılmaktadır [Mather, 1987]. Sınıflandırmada amaç, yeryüzü üzerinde aynı spektral özellikleri taşıyan nesnelerin gruplandırılmasıdır. Sınıflandırmanın yapılabilmesi için çok spektrumlu veri kullanılır. Her bir piksele ait spektral özellik verisi sınıflandırma için nümerik değerleri oluşturur. Her nesne çeşidi doğasındaki spektral yansıtım ve yutulmaya bağlı olarak farklı sayılarla ifade edilirler. Sınıflandırma, tematik bilgi çıkarmak için kullanılan en önemli yöntemdir. Sınıflandırma sonucu elde edilen görüntü tematik harita olarak adlandırılmaktadır. Tematik harita haline getirilen yani sınıflandırılan görüntü, bir harita projeksiyonuna dönüştürüldüğünde coğrafi bilgi sistemlerinde kullanılabilir [Jehnsen, 1996]. Sınıflandırma işlemi, genel olarak şu adımları içerir: 1. Yeryüzü özelliklerini ortaya koyabilecek sınıfların belirlenmesi ve kontrol alanlarının seçimi. Çalışma bölgesine ait bilgilerin toplanılması için arazi çalışmasının yapılması, sınıflandırmada kullanılmak üzere mevcut verilerin ve haritaların temini. 2. Çalışma amacına göre görüntülerin ve çalışılacak spektral bantların seçimi. 21 3. Tespit edilen sınıflara ait kontrol alanlarından yararlanarak sınıflandırılmada kullanılmak üzere eğitim ve test verilerinin oluşturulması. 4. Çalışma amacına yönelik olarak uygun bir sınıflandırma algoritmasının seçimi ve uygulanması. 5. Sınıflandırılmış görüntü için doğruluk analizi ve elde edilen tematik haritaların yorumlanması. Sınıflandırma işleminde, sınıfların oluşturulması, yapılacak çalışmanın amacına ve ölçeğine bağlı olmaktadır [Kavzoğlu, 2008]. Ayrıca, çalışmada kullanılacak spektral aralığın belirlenmesi, yeterli doğrulukta ve sayıda kontrol alanlarının seçimi ve sınıflandırılmış görüntülerde doğruluk değerlendirilmesinin yapılması, bu işlemin gerçekleştirilmesinde büyük önem taşımaktadır. Sınıflandırma işleminde genel olarak kontrollü ve kontrolsüz sınıflandırma olarak adlandırılan iki yaklaşım vardır. Kontrollü sınıflandırma farklı spektral grupları temsil eden kontrol alanları kullanılarak spektral ayrılabilirlik incelemekte, buna karşılık kontrolsüz sınıflandırmada ise spektral olarak ayrılabilir sınıflar belirlenmekte ve bunlardan bilgi elde etme yoluna gidilmektedir [Süslü, 2007]. 2.5.4.1. Kontrolsüz Sınıflandırma Kontrolsüz sınıflandırma yöntemi, görüntü üzerindeki piksellerin kullanıcı müdahalesi olmaksızın belirli algoritmalar kullanılarak otomatik olarak kümelendirilmesi veya gruplandırılması temeline dayanmaktadır. Kontrolsüz sınıflandırma; görüntüdeki veri tanımlanamadığında başvurulan yöntemdir. Çalışma alanına ait yeterli bilginin olmaması ve bölgenin genel yapısı hakkında ön bilgiye gereksinim duyulan çalışmalarda bu sınıflandırma yöntemi kullanılmaktadır. Bu yöntemde, arazi örtüsü tipini bilinmesine gerek yoktur, öncelikle görüntü üzerinde sınıf sayıları belirlenir. Kontrolsüz sınıflandırmada görüntü üzerindeki piksellere ait farklı bantlardaki sayısal değerler kullanılarak benzer piksellerin otomatik olarak bulunması ve bu piksellerin bir sınıfa atanması temel alınmaktadır. Ortak özelliklere sahip veya benzer pikseller sembol, değer ya da sınıf etiketine atanır, gerektiğinde de aynı tip sınıflarla birleştirilir [URL–1]. Kontrolsüz sınıflandırma sonucu oluşacak 22 sınıflar, spektral sınıflardır [Lillesand et al., 2007]. Elde edilen bu spektral sınıfların ne olduğu önceden bilinmemekte olup, daha sonra o bölgeye ait topoğrafik haritalar, hava fotoğrafları ve mevcut yardımcı bilgilerle karşılaştırılarak oluşturulan sınıfların doğal özellikleri belirlenebilmektedir [Özkan, 1998]. Kontrolsüz sınıflandırma da karar kuralı olarak minimum uzaklık kullanır. Pikseller, görüntünün sol üst köşesinden başlanarak soldan sağa ve satır satır analiz edilir. Aday piksel ile her bir küme ortalaması arasında spektral uzaklık hesaplanır ve en yakın kümeye atanır. Tam otomatik bir sınıflandırma yöntemi olan kontrolsüz sınıflandırmada pikseller arasındaki spektral uzaklıklar, Mahalonobis ve Öklit uzaklığı gibi formüllerle hesaplanır. Öncelikle istenilen sınıf sayısı kadar oluşturulan kümenin ortalaması hesaplanır ve her iterasyondan sonra, her bir kümenin yeni ortalaması hesaplanılarak, bu ortalamalar bir sonraki iterasyon kümelerinin tanımlanmasında kullanılır. Kontrolsüz sınıflandırmada küme merkezleri geçici olarak hesaplanarak, piksellerin dahil olacağı sınıflar belirlenir ve bu işlem küme merkezlerinin konumlarında değişim olmayana kadar devam eder [URL–1]. Uygulamada ISODATA, ardışık kümeleme ve istatistiksel kümeleme gibi çeşitli kontrolsüz sınıflandırma yöntemleri kullanılmaktadır. 2.5.4.2. Kontrollü Sınıflandırma Kontrollü sınıflandırma görüntü üzerindeki alanlara ait dış verilere dayalı olarak gerçekleştirilir. Bu veriler arazi çalışmaları yapılarak, hava fotoğraflarının analiz edilmesiyle veya konu ile ilgili mevcut haritalardan elde edilebilir [Mather, 1987]. Yöntemde görüntünün hangi sınıflara ayrılacağı, ya da görüntüden hangi sınıfların elde edilmek istenildiği önceden belirlenir. Bunun için görüntüden belirlenen sınıflara ait kontrol alanlarının seçilmesi gerekmektedir. Bu seçim için gerektiğinde arazide yer gerçekliği yapılması zorunludur. Kontrol alanlarının seçimi sınıflandırmanın doğruluğunu etkileyen bir aşamadır. Uygulamada sıkça karşılaşılan sorun sınıf çakışmasıdır. Sınıf çakışmasının nedenlerinden biri de kontrol alanlarının ölçümünde yapılan hatalardır [URL–1]. Kontrollü sınıflandırma da, çalışma alanındaki yeryüzü özelliklerini tanımlayan yeteri sayıdaki örnekleme alanları kullanılarak, piksel değerlerinin özellik dosyaları 23 oluşturulur. Kontrol alanlarının örneklediği özellik dosyalarının görüntü verilerine uygulanması ile her bir piksel, hesaplanan olasılık değerine göre en çok benzer olduğu sınıfa atanmaktadır. Kontrollü sınıflandırma da, ilk adım örnekleme adımıdır. Örnekleme aşamasında, analist her bir arazi örtüsü çeşidini temsil edecek örnekleme bölgeleri seçer ve bu bölgelerin spektral özelliklerini açıklayacak sayısal değerler geliştirir. İkinci adım, sınıflandırma adımıdır. Sınıflandırma adımında, görüntü verisindeki her bir piksel en çok benzer olduğu arazi örtüsü kategorisine dahil edilir. Görüntü elemanı örnekleme bölgeleriyle uyum sağlamıyorsa bilinmeyen olarak etiketlenir. Bilinmeyen piksel değerinin hangi arazi örtüsü grubuna dahil olacağı daha sonra belirlenir. Her bir piksele atanan sınıf, yorumlanmış veri dizisinde yerini alır ve böylece çok boyutlu görüntü matrisi, karşılık gelen yorumlanmış arazi örtü sınıfı tiplerinin oluşturduğu matrisi geliştirme de kullanılır [Kansu, 2006]. Bütün veriler kategorize edildikten sonra sonuçlar çıktı adımında sunulur. Sonuçlar tematik haritalar, istatistiksel tablolar veya coğrafi bilgi sistemlerine dahil edilebilecek nitelikteki sayısal veri kütükleri şeklinde ortaya koyulurlar [Lillesand and Kiefer, 1994]. Kontrollü sınıflandırma yönteminde kullanılan en önemli algoritmalar, en kısa uzaklık karar kuralı, paralelkenar karar kuralı, Mahalanobis uzaklığı ve en çok benzerlik algoritmalarıdır. 2.5.4.2.1. En Kısa Uzaklık Sınıflandırıcısı En kısa uzaklık sınıflandırıcısında her bir örnek sınıf için hesaplanan ortalama vektör ile aday piksel arasındaki spektral uzaklık hesaplanır. Hesaplanan spektral uzaklıklara göre aday piksel en kısa mesafedeki örnek sınıfa atanır [Erdas, 2008]. Şekil 2.6’da aday pikselin üç özelliğe ait ortalama vektöre olan spektral uzaklıkları bir çizgi ile ifade edilmiştir. Şekle göre aday piksel bu spektral uzaklıklardan en kısa mesafede olan sınıfa atanmasıyla sınıflandırma işlemi gerçekleştirilir. Örnek sınıf ortalama vektörü ile bilinmeyen piksel arasındaki uzaklığa spektral uzaklık denir ve uzaklığın bulunması Eşitlik 2.1’de ifade edilen Öklit uzaklığı esasına dayanmaktadır. SD xyc = n ( ∑ μ ci − X xyi i =1 2 ) (2.1) 24 Bu eşitlikte; n, bant sayısını (boyutu); i, belirli bir bandı; c, belli bir sınıfı; X xyi , i. banttaki pikselin x, y değerlerini; μ ci , i bandındaki c sınıfına ait örneklere ait değerlerin ortalamasını; SD xyc , aday piksel x, y ’nin c sınıfına ait ortalama vektöre olan spektral uzaklığı olarak ifade edilebilir [Erdas, 2008]. B bandı değerleri Aday piksel μ2 μ B2 μ B3 μ B1 μ3 μ1 μ A1 μ A 2 μ A3 A bandı değerleri Şekil 2.6. En kısa uzaklık (spektral uzaklık) sınıflandırıcısı. En kısa uzaklık yöntemi matematiksel ifadesi anlaşılabilir, basit ve hesaplama zamanı açısından hızlı olan bir kontrollü sınıflandırma algoritmasıdır. Yöntemin bu önemli avantajlarının yanında en önemli eksikliği görüntü üzerindeki objelerin spektral olarak birbirine çok yakın değerlere sahip olması ve yüksek varyans değerlerine sahip olması durumlarında ürettiği düşük doğruluktur. Bununla beraber yöntemle yapılan sınıflandırma sonucunda spektral uzaklıklar göz önüne alındığından her bir aday pikselin örnek sınıflardan birine atanması söz konusudur [Lillesand and Kiefer, 1994]. 2.5.4.2.2. Paralelkenar Sınıflandırıcısı Paralelkenar sınıflandırıcısında her bir örnek sınıfın her bir banttaki en düşük ve en yüksek spektral değerleri dikkate alınarak, dikdörtgen bölgeler oluşturulur. Daha sonra sınıflandırılmak istenen aday piksel içerisinde bulunduğu dikdörtgen bölgenin ait olduğu örnek sınıfa atanır [Lillesand et al., 2007]. Parametrik olmayan bir yaklaşım olan paralelkenar karar kuralı hesaplama zamanı açısından hızlı ve 25 matematiksel ifadesi basit olan bir yöntemdir. Bu yöntemin sonucunda sınıflandırılamayan piksel sayısı fazladır. Sınıflar arasında çakışan alanlar olması durumunda sınıflandırma işlemi zorlaşmaktadır. Bu durumda aday piksellerin çakışan sınıflardan birine rastgele atanması ile problem çözülür. Sonuç olarak aday pikselin olması gerekenden farklı bir sınıfa atanması da söz konusu olabilmektedir. Şekil 2.7’de iki boyutlu bir veri seti için paralelkenar karar kuralı sınıflandırıcısı gösterilmiştir. Şekilde iki banttaki üç sınıfa ait veriler ve bu sınıfların oluşturduğu dikdörtgen bölgeler görülmektedir. Sınıflandırma sonucunda bazı bölgelerde çakışma ve çok sayıda aday pikselin sınıflandırılamaması söz konusudur. Sınıf 1’e ait pikseller Sınıf 2’e ait pikseller Sınıf 3 B bandı değerleri Sınıf 1 Sınıf 3’e ait pikseller Sınıflandırılamayan pikseller Sınıf 2 A bandı değerleri Şekil 2.7. Paralelkenar sınıflandırıcısı. 2.5.4.2.3. Mahalanobis Uzaklığı Sınıflandırıcısı Mahalanobis uzaklığı sınıflandırıcısı, bantlardaki verilerin normal dağılımda olduğunu kabul eder ve bu kabulle iyi sonuçlar vermektedir. Yöntem en kısa uzaklık karar kuralına benzemekte ancak bu yöntemde eşitliklerde kovaryans matrisi de kullanılmaktadır [Erdas, 2008]. Mahalanobis yöntemi varyans ve kovaryans gibi istatistiki değerler kullanmasından ötürü parametrik bir yaklaşımdır. Varyans ve kovaryans değişik özellikteki çeşitli sınıflar için denklemde karşılıklı olarak hesaplanır. Yüksek varyansa sahip kümeler aynı şekilde varyansa sahip sınıflara, düşük varyansa sahip kümeler düşük varyanslı sınıflara atanacaktır [Göksel, 1996]. Mahalanobis uzaklığı sınıfandırıcısı, minimum uzaklık ya da paralelkenardan faklı 26 olarak sınıf değişimi göz önüne alınır. Mahalanobis uzaklığında işlenen örnekte ya da bir kümedeki piksellerde büyük bir dağılma varsa o işaretin kovaryans matrisi büyük değerler içerecektir [Kansu, 2006]. Mahalanobis uzaklığı sınıflandırıcısı için kullanılan eşitlik; ( ) D = ( X − M c )T Cov c −1 ( X − M c ) (2.2) şeklinde ifade edilmektedir. Bu eşitlikte; D, mahalanobis uzaklığını; c, belirli bir sınıfı; X, aday pikselin ölçüm vektörünü; M c , c sınıfındaki özelliklere ait ortalama vektörü; Cov c , c sınıfındaki piksellere ait kovaryans matrisini; Covc −1 , Cov c ’nin ters matrisini ve T ise transpoze fonksiyonunu ifade etmektedir. Yöntemin temel çalışma prensibi, sınıflandırılacak aday pikselin, Eşitlik 2.2 ile hesaplanan mahalanobis uzaklığının en düşük olduğu sınıfa atanması şeklindedir. Yöntem istatistiki değerlerin dikkate alınmasının zorunlu olduğu durumlarda en kısa uzaklık yöntemine göre daha doğru sonuçlar vermektedir. Diğer taraftan yöntem, paralelkenar ve en kısa uzaklık yöntemine göre daha uzun bir hesaplama süresi gerektirmektedir [Erdas, 2008]. 2.5.4.2.4. En Çok Benzerlik Sınıflandırma Algoritması En çok benzerlik yöntemi literatürde en yaygın olarak kullanılan etkili bir kontrollü sınıflandırma algoritmasıdır. Bu yöntemde ortalama değer, varyans ve kovaryans gibi istatistiki değerlerin tümü dikkate alınır. Kontrol alanlarını oluşturan sınıflar için olasılık fonksiyonları hesaplanmakta ve buna göre her bir pikselin hangi sınıfa daha yakın olduğuna karar verilmektedir. Bir pikselin hangi sınıfa ait olduğu her bir sınıfa ait olma olasılıklarının hesabından sonra en yüksek olasılıklı grubu atama şeklinde yapılır [Mather, 1987]. Bu noktada kullanıcı tarafından tespit edilecek bir eşik değer sınıflandırılacak pikselin belirlenen sınıflardan veya bu sınıfların dışında bir sınıftan olduğunun tespitinde kullanılır. Bu yöntemde, sınıf kontrol verilerini oluşturan noktalar kümesindeki dağılımın, normal dağılım olduğu kabul edilir. Sınıfların ilk olasılıkları hakkında bilgi mevcut değilse, hepsi eşit olasılıklı olarak kabul edilir. Yöntem, pikselleri sadece parlaklık değerlerine göre değil, her sınıf için ayrım oluşturacak varyans-kovaryans matris değerine göre 27 oluşturur. Böylece örnek piksellerin özellik uzayındaki dağılımları da dikkate alınmış olur. Olasılık yoğunluk fonksiyonları, bilinmeyen piksellerin olasılıklarının hesaplanarak belirli bir sınıfa atanması için kullanılır. Aday piksel olasılık değerine göre en çok benzediği sınıfa atanır. Sınıflandırma sırasında piksellerin belirlenen sınıflardan veya bu sınıfların dışında bir sınıftan olduğunun tespiti için eşik değeri kullanılmaktadır. Eğer aday pikselin olasılığı tüm sınıflar için belirlenen eşik değerinin altındaysa piksel bilinmeyen olarak etiketlenir [Lillesand and Kiefer, 1994]. En çok benzerlik yönteminde kullanılan formül aşağıdaki şekildedir: D = ln (a c ) − [0 .5 * ln ( Cov c )] − [0 .5 * ( X ( ) − M c )T * Cov c −1 * ( X − M C ] ) (2.3) Bu eşitlikte; D, uzaklık ağırlıklı olasılık değerini; C, örnek bir sınıfı; X, aday pikselin ölçüm vektörünü; M c , C örnek sınıfının ortalama vektörünü; a c , aday pikselin C sınıfına ait olma yüzdesini, Cov c , C örnek sınıfındaki piksellerin varyanskovaryans matrisini göstermektedir. 2.6. Uzaktan Algılama Uyduları 2.6.1. LANDSAT Uydu Sistemi İlk LANDSAT uydusunun 1972 yılında uzaya gönderilmesinden sonra dört adet Landsat uydusu daha yörüngeye oturtulmuştur. İlk kuşak üç uydudan oluşmaktadır. Bu uydular iki sensör taşımaktadır: Return Beam Vidicon (RBV) kamera ve Multispectral Scanner (MSS). İkinci kuşak Landsat uyduları, 1982'de Landsat 4 ile başlayarak, RBV yerine Thematic Mapper (TM) adında yeni bir cihazla donatılmışlardır. 1999 yılında, Landsat 7 Thematic Mapper+ ve yüksek çözünürlüklü scanner ile donatılarak uzaya gönderilmiştir. Landsat 7 uydusu uzaya gönderildiği zaman üzerinde tek bir aygıt olarak ETM+ (Enhanced Thematic Mapper Plus) taşımaktadır [URL–2]. Landsat uydusu tekrarlı, dairesel, güneşe senkronize, kutuplara-yakın yörüngeye sahiptir. Bu özellikleri sayesinde 81° N and 81° S arasında görüntüleme 28 yapar. LANDSAT 1 – 3 uyduları için tekrar süresi 18 gündür, LANDSAT 4 ve 5 için 16 gündür. TM ve MSS verileri için veri dizisi 8-bit'ten oluşmaktadır. Multi-Spectral Scanner (MSS) alıcısı görünür ve yakın-infrared bölgede 4 adet banda sahiptir ve 79 metre çözünürlüktedir. Thematic Mapper adlı cihazın spektral ve geometrik çözünürlük üstünlüğü nedeniyle MSS' in talebi hızla azalmıştır. Landsat 7 geliştirilmiş TM tarayıcısı taşımaktadır. Standart 7 banda ek olarak 15m çözünürlüğe sahip pankromatik band (0.50- 0.90μm) eklenmiştir. Bunlara ek olarak termal bandın çözünürlüğü de 60 metreye indirilmiştir. Landsat 5–7 uydularının genel özellikleri Tablo 2.1’de gösterilmiştir. Tabloda VNIR, görünür yakın kızılötesini; SWIR, orta kızılötesini ve TIR, termal kızılötesini göstermektedir. Tablo 2.1. Landsat uydularının teknik özellikleri. Çözünürlük Uydu Landsat 1/2/3 Sensör Tipi MSS Spektral Yersel Radyometrik (μm) (m) (bit) 79 6 VNIR: 0.5–0.6, 0.6–0.7, 0.7–0.8, 0.8–0.11 VNIR: 0.45–0.52, 0.52–0.60, Landsat 4/5 Landsat 7 TM 30 0.63–0.69, 0.76–0.90 SWIR: 1.55–1.75,2.08–2.35 30 TIR: 120 10.42–12.5 PAN 0.52–0.9 15 ETM VNIR ve SWIR Landsat 5 ile aynı 30 TIR: 10.42–12.5 60 8 8 29 2.6.2. TERRA Uydu Sistemi Terra uydusu 1999 yılında uzaya gönderilmiştir. Uydu üzerinde ASTER, MODIS, CERES, MOPITT ve MISR olarak bilinen beş adet model bulunmaktadır. Bu modüller arasında ASTER sensörü 14 bantlı ve 15m - 90m yersel çözünürlükteki görüntüler elde edilmektedir. ASTER verileri; arazi yüzeyi, sıcaklık, reflektans, parlaklık değişim oranı ve yükseklik haritalarını çıkarmak için kullanmaktadırlar. Üzerinde yüksek verimlilikte çalışan optik sensörler mevcut olup, 14 bantla termal kızıl ötesi ile kara yüzeylerini spektral bantlarla incelemektedir [URL–2]. Terra ASTER uydusuna ait teknik özellikler Tablo 2.2’de gösterilmiştir. Tabloda VNIR, görünür yakın kızılötesini; SWIR, orta kızılötesini ve TIR, termal kızılötesini göstermektedir. Tablo 2.2. Terra ASTER uydusunun teknik özellikleri. Çözünürlük Uydu Sensör Tipi VNIR Spektral Yersel Radyometrik (μm) (m) (bit) 15 8 30 8 90 12 0.52–0.60, 0.63–0.69, 0.76–0.86 1.60–1.70, 2.145–2.185, Terra/ASTER SWIR 2.185–2.225, 2.235–2.285, 2.295–2.365, 2.360–2.430 TIR 10.95–11.65 2.6.2. SPOT Uydu Sistemi SPOT uydusu Fransız, İsveç ve Belçika ortak yapımı olup 1986 yılında uzaydaki yörüngesine yerleştirilmiştir. SPOT uydusu üzerinde iki adet HRV ve vejetasyon algılayıcı mevcuttur. HRV algılayıcıları, pankromatik ve çok bantlı görüntüler elde edebilmektedir. 30 Günümüze kadar beş adet SPOT uydusu uzaya gönderilmiştir. Bunlardan SPOT-1,2,3,4 uyduları yüksek çözünürlüğe sahip (10m pankromatik ve 20m çok bantlı görüntüleme modunda) ve değişik ihtiyaçları karşılayacak spektral bandlar içermektedir. Bu uydular iyi bir tekrar görüntüleme süresine sahip olup, 900 km'lik görüntüleme alanı içerisinde kalan 60km x 60km 'lik herhangi bir bölgeyi her geçişte görüntüleme olanağı sağlamaktadırlar. SPOT–5 zenginleştirilmiş görüntü ile Spot serisinin beşincisidir. SPOT–5 deki iki yeni HRG cihazı Spot 4 deki HRVIR cihazlarından türetilmiştir ve 2,5,-5 m pankromatik ve 10 metre de çok bantlı yersel çözünürlüklü görüntü imkanı sağlar [URL–2]. SPOT uydularının teknik özellikleri Tablo 2.3’de gösterilmiştir. Tablo 2.3. SPOT uydularının teknik özellikleri Çözünürlük Uydu Sensör Tipi PAN SPOT–1/2/3 HRV PAN HRVIR SPOT–4 SPOT–5 Spektral Yersel Radyometrik (μm) (m) (bit) 0.51–0.73 10 8 20 8 10 8 20 8 VNIR: 0.50–0.59, 0.61–0.68, 0.79–0.89 0.61–0.68 VNIR: 0.50–0.59, 0.61–0.68, 0.79–0.89 SWIR: 1.58–1.75, 0.43–0.47, 0.61–0.68 Vejetasyon 0.78–0.89, 1.58–1.75 1000 4/8 PAN 0.49–0.69 2.5–5 8 HRG VNIR: 0.49–0.61, 0.61–0.68, 0.78–0.89 10 8 HRG SWIR: 1.58–1.75 20 8 1000 4/8 Vejetasyon 0.43–0.47, 0.61–0.68, 0.78–0.89, 1.58–1.75 31 3. UZAKTAN ALGILAMADA İLERİ SINIFLANDIRMA TEKNİKLERİ 3.1. Destek Vektör Makineleri Destek Vektör Makineleri (DVM), Viladimir N. Vapnik ve çalışma arkadaşları tarafından ortaya konulan istatistiksel öğrenme teorisine dayalı bir kontrollü sınıflandırma algoritmasıdır [Vapnik, 1995]. DVM’nin sahip olduğu matematiksel algoritmalar başlangıçta iki sınıflı doğrusal verilerin sınıflandırılması problemi için tasarlanmış daha sonra kullanılan algoritmalar doğrusal olmayan verilerin ve çok sınıflı verilerin sınıflandırılması problemlerinin çözümü için genelleştirilmiştir. DVM’nin en genel amacı iki sınıfı birbirinden ayırabilen en uygun karar fonksiyonun tahmin edilmesi başka bir ifadeyle iki sınıfı birbirinden en uygun şekilde ayırabilen bir hiper düzlemin tanımlanması esasına dayanmaktadır [Vapnik, 2000]. DVM optik karakterlerin tanımlanması, el yazısı tanımlamaları, parmak izi tespiti, yüz tanıma ve metin sınıflandırmaları gibi birçok uygulamada kullanılmıştır [Joachims, 1998; Heisele et al., 2003; Liu et al., 2003; Yang et al., 2008; Hong et al., 2008]. Son yıllarda DVM’nin uzaktan algılanmış görüntülerin sınıflandırılması konusunda başarıyla kullanımı literatürde bir çok yayında mevcuttur [Huang et al., 2002; Foody and Mathur, 2004; Pal and Mather, 2005; Su et al., 2007; Yao et al., 2008]. Destek vektör makinelerini diğer öğrenme algoritmalarından ayıran en önemli özellik; sahip olduğu matematiksel algoritmanın sınıflandırma sonucunda beklenen riskin üst sınırının minimum olması şeklinde ifade edilen yapısal risk azalımı (YRA) prensibine dayanmasıdır [Kechman, 2001]. Vapnik (1995)’e göre bir öğrenme makinesinin riski (R); eğitim verilerinden elde edilen deneysel gözlemlerin riski (Remp) ve güvenilirlik aralığının toplamına ((ψ ) = R ≤ Remp + ψ ) bağlıdır. YRA stratejisi deneysel gözlem riskini (Remp) sabit olarak korumak ve güvenilirlik aralığını (ψ ) minimum yapmak veya en uygun ayrım yapan hiper düzleme en yakın veri noktaları arasındaki sınırın maksimum olması olarak tanımlanabilir. En uygun ayrım yapan hiper düzlemden kasıt çok boyutlu bir uzayda veri örneklerini iki sınıfa ayıran bir hiper düzlemdir. Bu bağlamda iki sınıfı birbirinden ayıran en uygun hiper 32 düzlem, bu düzlem ile bu düzleme en yakın veri noktalarının oluşturduğu sınırı maksimum yapan hiper düzlem olarak tanımlanabilir [Huang et al., 2002]. DVM öznitelik bilgileri verilen bir test veri setine ait sınıf etiketlerini öğrenebilen veya tahmin edebilen bir model oluşturmayı amaçlamaktadır. Bu doğrultuda sınıflandırma işleminde, DVM ile eğitim seti içindeki veriler kullanılarak bir hiper düzlem belirlenir ve bu oluşturulan düzlemin geçerliliği (genelleme yeteneği) test veri seti olarak adlandırılan bağımsız veri setleri kullanılarak doğrulanır. N boyutlu bir verinin sınıflandırılmasında DVM ile (N–1) boyutlu bir hiper düzlem geliştirilir. İki sınıfa sahip doğrusal olarak ayrılabilen bir veri seti düşünülürse, Şekil 3.1’de görüleceği üzere bu veri setini ayırabilen sonsuz sayıda hiper düzlem vardır. Şekil 3.1. İki sınıflı bir problemde verileri ayıran hiper düzlemler. Ancak, bu düzlemler arasında maksimum sınıra sahip sadece bir hiper düzlem bulunmaktadır [Sherrod, 2003; Oomen et al., 2008]. Bu hiper düzleme en uygun ayrım yapan hiper düzlem ve sınır genişliğini sınırlandıran noktalara ise destek vektörleri adı verilir (Şekil 3.2). Destek Vektörleri Sınır Destek Vektörleri Optimum Hiper Düzlem Şekil 3.2. İki sınıflı bir problemde en uygun hiper düzlem, sınır ve destek vektörleri. 33 Destek vektör makineleri ile yapılan sınıflandırma problemlerinde verilerin doğrusal olarak ayrılabilen veya doğrusal olarak ayrılamayan bir yapıda olması en çok karşılaşılan iki durumdur. Doğrusal olarak ayrımı yapılabilen verilerin sınıflandırılması ve bu verileri birbirinden ayıran en uygun hiper düzlemin bulunması oldukça kolaydır. Ancak uzaktan algılanmış görüntülerin sınıflandırılmasında olduğu gibi güncel hayatta karşımıza çıkan birçok sınıflandırma probleminde verilerin doğrusal olarak ayrılması mümkün değildir. Bu tip problemlerin teorik olarak çözülmesi zor ve karmaşıktır. 3.1.1. Doğrusal Olarak Ayrım Yapılabilen Veriler Doğrusal olarak ayrılabilen sınıflar DVM’nin eğitimi için en basit durumdur. İki sınıflı k sayıda örnekten oluşan doğrusal yapıdaki bir eğitim verisi seti {xi , y i } , i = 1,..., k , şeklinde verilsin. Burada x ∈ R N olup N boyutlu bir uzayı, y ∈ { −1,+1 } ise sınıf etiketlerini göstermektedir. Osuna et al. (1997), hiper düzleme ait ağırlık vektörü w ve hiper düzlemin orijinden olan uzaklığını gösteren b sayısal büyüklüğünün hesaplanması durumunda iki sınıfı birbirinden ayıran hiper düzlemin belirlenebileceğini ifade etmiştir. İki sınıflı bir problemde ayrım yapan hiper düzleme ait eşitlikler Eşitlik 3.1 ve 3.2’de verilmiştir. w ⋅ x i + b ≥ +1 her y = +1 için (3.1) w ⋅ xi + b ≤ −1 her y = −1 için (3.2) Bu iki eşitlik tek bir eşitlik ile ifade edilecek olursa; y i ( w ⋅ xi + b) − 1 ≥ 0 (3.3) şeklinde olur. Bu durumda hipotez uzayı Eşitlik 3.4 ile verilen fonksiyonlar kümesi halini alır. f w,b = sign( w ⋅ x + b) (3.4) 34 Eğer w ve b parametreleri aynı miktarda ölçeklenirse Eşitlik 3.4’deki karar yüzeyi değişmeyecektir. Bu fazlalığı kaldırmak ve her bir karar yüzeyinin tek bir sabit (w,b) çiftine karşılık gelmesi için Eşitlik 3.5 ile verilen sınırlandırmadan yararlanılır. min w ⋅ xi + b = 1 (3.5) i =1,..., k Bu eşitlikte x1 ,..., x k veri kümesindeki noktaları göstermektedir. Eşitliği sağlayan hiper düzlem seti standart hiper düzlem olarak adlandırılır [Osuna et al., 1997]. Bütün doğrusal karar yüzeyleri standart hiper düzlem ile gösterilebilir. Vapnik (1995), (w,b) çiftleri için yararlanılan sınırlandırmalardan başka sınırlandırmalar olmaması durumunda standart hiper düzlemin Vapnik-Chervonenkis (VC) boyutunun bağımsız parametrelerinin toplam sayısını gösteren (N+1) olacağını ifade etmiştir. VC boyutu hipotez uzayının kapasitesini ölçer [Vapnik and Chervonenkis, 1968; 1971]. Kapasite bir karmaşıklığın veya zorluğun ölçülmesi anlamına gelmektedir. Başka bir ifadeyle bir fonksiyon kümesinin ifade gücünü, esnekliğini veya zenginliğini ölçer. N noktayı içeren bir veri seti düşünüldüğünde, bu N nokta pozitif veya negatif olarak etiketlenebilir. Bununla beraber, N sayıda veri noktasıyla 2 N farklı öğrenme problemi tanımlanabilir. Bu problemlerden herhangi biri için pozitif örnekleri negatif örneklerden ayırabilen bir h ∈ H hipotezi bulunabilirse, H’nın N veri noktasını parçalara ayırdığı söylenebilir. Bu durum, N örnekle tanımlanabilir herhangi öğrenme probleminin H tarafından çizilen bir hipotez ile hatasız bir biçimde öğrenilebilir olduğunu göstermektedir. H tarafından parçalanabilen maksimum nokta sayısı Vapnik-Chervonekis (VC) boyutu olarak adlandırılır. Yapısal risk azalımı prensibini uygulayabilmek için değişken VC boyutlu hiper düzlemler setinin oluşturulması gerekmektedir. Ayrıca hem eğitim sınıflandırma hatasını ifade eden deneysel riskin hem de VC boyutunun aynı anda minimum olması gerekmektedir. Bir x noktasının, (w,b) çiftine bağlı olarak oluşturulan hiper düzleme olan uzaklığı Eşitlik 3.6 ile belirlenebilir. d ( x; w, b) = x⋅w+b w (3.6) 35 Eşitlik 3.5’te (w,b) ile tanımlanan standart hiper düzlem ile bu düzleme en yakın veri noktası arasındaki uzaklık basit bir şekilde 1 / w ’dır [Foody and Mathur, 2004]. Eğer örnek grupları doğrusal olarak ayrılabiliyorsa, veriyi en doğru şekilde sınıflandıran standart hiper düzlemler arasında en iyisi minimum norma sahip veya eşit bir biçimde minimum w 2 olanıdır. Bu normun minimum olarak kalması VC boyutunun minimum olarak kalmasına neden olur. Doğrusal olarak ayrımın 2 yapılabildiği durumda w ’nin minimum olması, eğitim veri sınıfları arasında hiper düzleme olan dik çizgiler arasında hesaplanan uzaklığın bulunduğu ayırıcı hiper düzleme eşittir. Şekil 3.3’de gösterilen bu uzaklık sınır olarak adlandırılır [Burges, 1998]. Y Hiper Düzlemler w ⋅ x + b = ±1 Sınır w Destek Vektörleri b Optimum Hiper Düzlem w⋅ x + b = 0 X Şekil 3.3. Doğrusal olarak ayrılabilen veri setleri için hiper düzlemin belirlenmesi. ( x1 , y1 ),......, ( x k , y k ) xi ∈ R N , yi ∈ {−1,+1} şeklinde verilen bir veri setinin iki farklı sınıfa doğru bir şekilde ayrılması için maksimum sınıra sahip hiper düzlemin, başka bir ifadeyle en uygun ayrım yapan hiper düzlemin belirlenmesine ihtiyaç duyulmaktadır. Destek vektör makinelerinin üzerinde bulunduğu hiper düzlemler arasındaki sınırın maksimum hale getirilmesi; w ifadesinin minimum hale getirilmesi ile mümkün olacaktır. Bu durumda maksimum sınıra sahip hiper düzlemin belirlenmesi; 36 min w ,b 1 w 2 2 (3.7) koşulu ile y i ( w ⋅ x i + b) − 1 ≥ 0 i = 1,......., k (3.8) eşitliğinin çözümü ile mümkündür. Yukarıdaki koşul ve eşitlik ile ifade edilen doğrusal olmayan optimizasyon probleminin çözümü için Lagrange fonksiyonu ve Lagrange çarpanlarından (λi , i = 1,..., k ) yararlanılır. Bunun en önemli nedeni, Lagrange fonksiyonu kullanılarak Lagrange çarpanlarının dolayısıyla en uygun hiper düzleme ait parametrelerin ( w, b ) hesaplanmasının kolay olması ve doğrusal olmayan veriler için en uygun hiper düzlemin bulunması probleminin çözümü için Lagrange fonksiyonun genelleştirilebilecek bir yapıda olmasıdır [Burges, 1998]. Bu optimizasyon probleminin çözümü için oluşturulacak Lagrange fonksiyonu Eşitlik 3.9 ile ifade edilir. L( w, b, λ ) = k 1 2 k w − ∑ λ i y i ( w ⋅ x i + b ) + ∑ λi 2 i =1 i =1 (3.9) Karush-Kuhn-Tucker (KKT) şartları sınırlandırılmış optimizasyon probleminin uygulamasında ve teorisinde önemli bir rol oynamaktadır [Fletcher, 2000]. Yukarıdaki eşitliğin kısmı türevleri alınarak sıfıra eşitlenerek Eşitlik 3.10’daki ifadeler elde edilir. k ∂L( w, b, λ ) = wT − ∑ yi λi xi = 0 ∂w i =1 ∂L( w, b, λ ) k = ∑ y i λi = 0 ∂b i =1 (3.10) 37 Bu eşitliklerden KKT şartları Eşitlik 3.11 şeklinde; k w T = ∑ y i λi xi i =1 k ∑ y i λi =0 (3.11) i =1 elde edilir. KKT teorisine göre sadece Eşitlik 3.1 ve 3.2’yi sağlayan noktalar sıfırdan farklı λiq katsayılarına sahip olabilirler. Bu noktalar destek vektörleri adı verilen birbirine paralel iki hiper düzlem üzerinde olurlar (Şekil 3.3). Başka bir ifadeyle destek vektörleri λiq ≥ 0 olan aynı zamanda Eşitlik 3.1 ve 3.2’yi sağlayan noktalardır [Osuna et al., 1997]. Kısmi türevler alınarak elde edilen Eşitlik 3.11, Eşitlik 3.9’da yerine konulduğunda L( w, b, λ ) fonksiyonu; (λi ≥ 0, i = 1,..., k ) olmak üzere; L( w, b, λ ) = ∑ λi − i 1 k ∑ λi λ j y i y j ( x i ⋅ x j ) 2 i , j =1 (3.12) şeklinde elde edilir. Sonuç olarak iki sınıflı doğrusal verilerin söz konusu olduğu bir problem için iki sınıfın birbirinden ayrılması ile ilgili karar kuralı Eşitlik 3.13 ile ifade edilebilir [Vapnik, 1995; Osuna et al., 1997]. ⎛ k ⎞ f ( x) = sign⎜ ∑ λi y i ( x ⋅ xi ) + b ⎟ ⎝ i =1 ⎠ (3.13) 3.1.2. Doğrusal Olmayan Veriler Günlük hayatta karşılaşılan birçok problemde verilerin doğrusal olmadığı durumlar söz konusudur. Başka bir ifade ile Şekil 3.4’de gösterildiği gibi doğrusal bir düzlem ile verilerin birbirinden ayrılamaması durumu vardır. Cortes ve Vapnik (1995), iki sınıfın doğrusal olarak ayrımının yapılamadığı ve hiper düzlemin 38 yerleştirilemediği verilerin olması durumunda en uygun ayrım yapan hiper düzlemin bulunması metodunu genelleştirmişlerdir. Şekil 3.4. Doğrusal olarak ayrılamayan veri seti. Cortes and Vapnik (1995) çalışmalarında doğrusal olmayan verilerin sınıflandırılması probleminin Şekil 3.5’den de görüleceği üzere pozitif değerler alan ve sınıflandırma hatalarını ifade eden yapay değişkenlerin ( ξ i ) tanımlanması ve optimizasyon modeline eklenmesi ile çözümün bulunabileceğini ifade etmişlerdir. Y Hiper Düzlemler w ⋅ x + b = ±1 Sınır ξ b w Optimum Hiper Düzlem w⋅ x + b = 0 X Şekil 3.5. Ayrım yapılamayan veri setleri için hiper düzlemler. Yapay değişken ξ i ≥ 0 olan değerler alır. Doğrusal olmayan veriler olması durumunda yapay değişkenler dikkate alınarak Eşitlik 3.3 yeniden düzenlenecek olursa; 39 y i ( w ⋅ x i + b) − 1 + ξ i ≥ 0 i = 1,..., k (3.15) elde edilir. Bu durumda DVM algoritması sınırı maksimum yapacak hiper düzlemi ararken, aynı zamanda yanlış sınıflandırma hatalarının sayısı hakkındaki orantısal bir niceliği minimum yapmayı amaçlar. Sınırın maksimum hale getirilmesi ve yanlış sınıflandırma hatalarının minimum hale getirilmesi arasındaki bu denge pozitif değerler alan ve C ile gösterilen bir düzenleme parametresi (0 < C < ∞) tanımlanmasıyla kontrol edilebilir [Cortes and Vapnik, 1995]. Bu durumda k optimizasyon problemi için Eşitlik 3.7 ile ifade edilen koşula C ∑ ξ i (i = 1,..., k ) gibi i =1 yeni bir terimin eklenmesi söz konusudur. C parametresi Lagrange çarpanlarının alabilecekleri maksimum değeri göstermektedir. Bu şekilde Lagrange çarpanlarının 0 ≤ λi ≤ C aralığında kalması sağlanmaktadır. Burada C > 0 sabit bir parametredir ve kullanıcı tarafından belirlenir. Eğer C küçük ise doğru olarak sınıflandırılmayan birçok veriye izin verilir. C parametresi büyük değerler aldığında çok az sayıda hatalı veriye sahip olunmak istenir. Eğer C = ∞ kabul edilirse, verilerin tümüyle doğrusal olarak ayrılabildiği durum elde edilir [Özkan, 2008]. Diğer bir ifadeyle bu sabit terim, ξ i değişkeninin büyük değerler alması sonucunda ortaya çıkan çözümlere ceza vererek minimum koşulunun (1 / 2) w 2 katkısını ayarlamaktadır. Bu durumda doğrusal olmayan veriler için optimizasyon problemi: k ⎡1 ⎤ 2 + w C ξi ⎥ ∑ ⎢ w ,b ,ξ1 ,...,ξ k 2 i =1 ⎣ ⎦ (3.16) y i ( w ⋅ x i + b) − 1 + ξ i ≥ 0 (3.17) ξ i ≥ 0 , i = 1,......., k (3.18) min eşitlikleri halini alır. Bu optimizasyon probleminin çözümü için Lagrange fonksiyonu ve Lagrange çarpanları kullanılarak yeniden düzenlendiğinde, 40 L( w, b, λ , ξ , μ ) = 1 2 w + C ∑ ξ i − ∑ λi {y i ( w ⋅ xi + b) − 1 + ξ i } − ∑ μ i ξ i 2 i i i (3.19) şeklinde yazılabilir. Bu eşitlikte λ ve μ lagrange çarpanlarıdır ve eşitliğin çözümü Lagrange düğüm noktaları ile tanımlanır. Bu düğüm noktaları w, ξ ve b’yi minimum hale getirirken aynı zamanda λi ≥ 0 ve μ i ≥ 0 ile ilgili değerleri maksimum hale getiren noktalardır. Yukarıdaki eşitliğin kısmi türevleri alınıp sıfıra eşitlenerek KKT koşulları; k ∂L = 0 , w = ∑ λi y i x i ∂w i =1 ∂L = 0, ∂b ∑ λi y i ∂L = 0, ∂ξ λi + μ i = 0 k =0 (3.20) i =1 şeklinde elde edilir. Buradan hareketle Lagrange fonksiyonu; k L (λ ) = ∑ λi − i =1 1 k ∑ λi λ j y i y j ( x i ⋅ x j ) 2 i , j =1 (3.21) buna bağlı kısıtlamalar ise ; k ∑ λi y i = 0 , i = 1,..., k i =1 C ≥ λi ≥ 0, i = 1,..., k şeklinde elde edilir. (3.22) 41 3.1.3. Doğrusal Olmayan Destek Vektör Makineleri Eğitim verileri üzerinden doğrusal eşitlikler ile tanımlanan bir karar yüzeyi (hiper düzlem) belirlenmesi mümkün olmadığı durumlarda 3.1.1 ve 3.1.2 bölümlerinde açıklanan teknikler doğrusal olmayan karar yüzeylerinin oluşturulması için genişletilebilir. Verilerin doğrusal olarak ayrılamadığı durumlar için doğrusal sınıflandırıcı yerine doğrusal olmayan sınıflandırıcılar kullanılabilir. Boser et. al. (1992), x ∈ R N ile tanımlanan bir gözlem vektörünün, φ : R N a R F şeklinde doğrusal olmayan bir vektör fonksiyonu aracılığıyla daha yüksek boyutlu bir uzayda (özellik uzayı) eşleştirebileceğini ifade etmiştir. Başka bir ifadeyle bu problemin çözümü için Şekil 3.6’da görüleceği üzere girdi uzayında doğrusal olarak ayrılamayan veri daha yüksek boyutlu bir uzayda görüntülenir ve bu yüksek boyutlu uzayda verinin doğrusal olarak ayrımı gerçekleştirilir. φ Hiper Düzlem Özellik Uzayı Girdi Uzayı Şekil 3.6. Doğrusal olmayan verin yüksek boyutlu uzaya dönüşümü ve verinin doğrusal olarak ayrılması. Özellik uzayındaki en uygun sınır probleminin çözümü veya en uygun hiper düzlemin belirlenmesi için Eşitlik 3.21’deki xi ⋅ x j noktasal çarpım ifadesi yerine φ ( xi ) ⋅ φ ( x j ) yazılabilir. Bu durumda dönüşüm yapılan özellik uzayında λi için optimizasyon probleminin çözümü λi > 0 ile bağlantılıdır. Bu eşleştirme kullanılarak DVM’nin çözümü için karar fonksiyonu; 42 ⎛ ⎞ f ( x) = sign⎜ ∑ λi y iφ ( x) ⋅ φ ( xi ) + b ⎟ ⎝ i ⎠ (3.23) şeklinde olacaktır. Bu eşitlikten de anlaşılacağı üzere doğrusal olarak verilerin ayırt edilemediği durumlarda verileri daha yüksek boyutlu bir uzaya taşıyarak çözümlemek için doğrusal olmayan φ fonksiyonları kullanılmaktadır. Yukarıdaki eşitlikte verilen φ ( x) ⋅ φ ( xi ) skaler çarpımının yerine tek bir fonksiyon kullanılarak söz konusu dönüşümler yapılabilir [Vapnik, 1995; Özkan, 2008]. Bu skaler çarpımının hesaplama zorluğu nedeniyle Kernel fonksiyonları kullanılarak işlem gerçekleştirilir [Mathur and Foody, 2008a]. Kernel Fonksyonu’nun genel ifadesi K ( x i , x j ) = φ ( x ) ⋅ φ ( xi ) (3.24) şeklindedir. Bu fonksiyonlarının belirlenmesinde Mercer teoremine başvurulabilir. Mercer teoremine göre verinin yüksek boyutlu uzaya dönüşümü ve problemin çözümü için kullanılacak K ( xi , x j ) şeklinde ifade edilen kernel fonksiyonu aşağıdaki koşulları gerçekleştirmelidir: a) Sürekli bir fonksiyon olmalıdır. b) Simetrik olmalıdır : K ( xi , x j ) = K ( x j , xi ) c) Herhangi x1 ,..., x k değerleri için pozitif tanımlı olmalıdır. Tablo 3.1’den görüleceği gibi DVM içerisinde kullanılan birçok kernel fonksiyonu vardır. Keerthi and Lin (2003), doğrusal kernelin radyal tabanlı kernelin özel bir hali gibi düşünüleceğini ve sigmoid kernelin belirli parametreler için radyal tabanlı kernel gibi bir davranış gösterdiğini belirtmişlerdir. Literatürde uzaktan algılanmış görüntülerin sınıflandırılması uygulamaları için polinom ve radyal tabanlı kernelin yaygın olarak kullanıldığını ve radyal tabanlı kernel kullanımı ile daha iyi sonuçlar elde edildiği ifade edilmektedir [Melgani and Bruzzone 2004; Foody and Mathur, 2004; Pal and Mather, 2005; Mathur and Foody, 2008b]. 43 Tablo 3.1. Kernel fonksiyonları ve kullanımları Doğrusal Kernel Fonksiyonu Polinom Kernel İki Katmanlı Yapay Sinir ağı genel ifadesi (( x ⋅ y ) + 1) d Radyal Tabanlı Fonksiyon Kernel fonksiyonun K ( x, y ) = ( x ⋅ y ) e d, polinom derecesi γ , kullanıcı tarafından −γ x − y 2 belirlenen bir parametre b ve c, kullanıcı tanh(b( x ⋅ y ) − c ) Pearson VII Universal Kernel (PUK) tarafından belirlenen bir parametreler σ ve ω kullanıcı 1 ⎡ ⎢ ⎢1 + ⎢ ⎣ ⎛2 ⎜ ⎜ ⎜ ⎝ x − y 2 σ 2 (1 / ω ) − 1 ⎞⎟ ⎟ ⎟ ⎠ 2 ⎤ ⎥ ⎥ ⎥ ⎦ ω tarafından belirlenen parametrelerdir. 3.1.4. Çok Sınıflı Destek Vektör Makineleri Destek vektör makineleri başlangıçta iki sınıflı verilerin sınıflandırılması esasına dayanarak geliştirilmiştir. Günümüzde birçok uygulamada örneğin arazi örtüsünün sınıflandırılması probleminde olduğu gibi sınıf sayısının ikiden fazla olması durumu söz konusudur. Böyle bir problemin destek vektör makineleri ile çözümü için uygun bir çoklu sınıflandırma yöntemine ihtiyaç duyulmaktadır. DVM’nin çok sınıfı ayırması aşamasında kullanılan çeşitli yaklaşımlar vardır. Bunlardan en çok kullanılan yaklaşımlar: • Çok sınıflı amaç fonksiyonu • Bire karşı hepsi yaklaşımı • Bire karşı bir yaklaşımı • Yönlendirilmiş çevrimsiz çizge yaklaşımı şeklinde ifade edilebilir. 44 Çok sınıflı amaç fonksiyonu yaklaşımında, ikili sınıflandırma problemlerinin çözümü için geliştirilen DVM algoritmasının çoklu sınıf problemlerini direkt olarak çözecek şekilde değiştirilmesi esasına dayanmaktadır [Weston and Watkins, 1998; Lee et al., 2001; Crammer and Singer, 2001; Schölkopf and Smola, 2002; Debnath, et al., 2004]. Başka bir ifadeyle bu yaklaşımda ikili sınıflandırmalar için kullanılan Lagrange fonksiyonunun çoklu sınıfla işlem yapacak hale getirilmesidir. Bu yaklaşımda optimizasyon algoritması tüm destek vektörlerini aynı anda dikkate almaktadır. Bu nedenle sınıf sayısının çok fazla olduğu veri setlerinin olması durumunda bellek gereksinimi ve hem hesaplama zamanı çok fazla artmaktadır. Bununla beraber, tek bir Lagrange fonksiyonu kullanımından dolayı sınıflandırma hatalarının arttığı görülmüştür [Pal, 2005a; Demirci, 2007]. Bu nedenle yöntemin çok sınıflı verilerin sınıflandırılmasında kullanımı tercih edilmemektedir. Çok sınıflı amaç fonksiyonunda olduğu gibi bütün verilerin direkt olarak optimizasyon problemine eklenerek çözülmesi yerine DVM’nin sınıf sayısına bağlı olarak ikili sınıflandırmalar yapacak şekilde düzenlenmesi bir başka yaklaşımdır. Bu amaç için kullanılan yöntemlerden en önemlileri “bire karşı hepsi” ve “bire karşı bir” yaklaşımlarıdır. Bire karşı hepsi yaklaşımında, eğitim verisindeki herhangi bir sınıfa ait veriler bir kümeyi oluştururken, eğitim verisindeki diğer sınıflara ait verilerin tamamı başka bir kümeyi oluşturduğu düşünülür. Eğitim verisindeki her bir sınıf için bu ikili sınıflandırma işlemi tekrar edilir ve bu şekilde çok sınıflı bir problem ikili bir sınıflandırma problemi gibi düşünülerek DVM’nin eğitimi tamamlanır. Burada N sayıda farklı sınıfın olduğu düşünülürse N sayıda eğitim işlemi yapılacaktır [Debnath, et al., 2004; Pal, 2005a; Demirci, 2007]. Lee et al. (2001) ve Schölkopf and Smola (2002) bu yöntemle elde edilen sınıflandırma sonuçlarının çok sınıflı amaç fonksiyonu ile benzer olduğunu ifade etmişlerdir. Bu yöntemin en önemli avantajı oluşturulacak ikili sınıflandırıcı sayısının sınıf sayısına eşit olmasıdır. Bununla birlikte eğitim sırasında bellek ihtiyacının fazla olması ve eğitimde kullanılan örnek sayısının fazla olması yöntemin dezavantajıdır. Bu durum özellikle büyük eğitim verileri olması durumunda bilgisayar için bellek problemini ortaya çıkarmaktadır. Diğer taraftan N tane sınıftan oluşan eğitim verisinin her bir sınıf için eşit sayıda örnekten oluştuğu düşünüldüğünde, eğitim sırasında bir sınıfa ait örnek 45 sayısının geriye kalan diğer tüm sınıflara ait örnek sayısına oranı 1 : (N–1) olacaktır. Bu oran eğitim örnekleri boyutunun dengesiz olacağını göstermektedir [Huang et al., 2002; Milgram et al., 2006]. Mathur and Foody (2008b) bire karşı hepsi yaklaşımı ile yapılan sınıflandırma sonucunda sınıflandırılmamış pikseller oluşabileceğini ifade etmişlerdir. Bire karşı hepsi yaklaşımındaki kısıtlamalar bire karşı bir yaklaşımın ortaya atılmasına neden olmuştur. Bu metotta tüm olası sınıf çiftleri için DVM sınıflandırıcıları oluşturulur [Knerr et al., 1990; Hastie and Tibshirani, 1998]. Diğer bir ifadeyle bire karşı bir yaklaşımında, her bir sınıfa ait örnek kümeleri diğer örnek kümeleri ile ayrı ayrı eğitilir. N sayıda farklı sınıf olması halinde N(N-1)/2 tane eğitim işlemi yapılır. Eğitim işlemleri sonucunda elde edilen her bir sınıflandırıcı test verisine uygulanır. Test verisindeki her bir nokta her bir eğitim sonucunda bir oy alır. Eğitim sonucunda sınıfı belirli olmayan nokta için en çok oy alan sınıf o noktanın sınıf etiketini oluşturur. Bu yöntemde oluşturulan sınıflandırıcıların sayısı bire karşı hepsi yaklaşımından fazladır. Bununla birlikte her bir sınıflandırıcı için gerekli eğitim veri verisinin sayısı daha azdır. Eğitim vektörlerinin oransal boyutu her bir sınıf için aynıdır. Dolayısıyla bu yöntem bire karşı hepsi yöntemine göre daha simetrik bir yaklaşımdır. Tüm bu olumlu yönlerine rağmen sınıf sayısının artmasıyla kullanılacak sınıflandırıcının sayısı da artmaktadır [Pal, 2005a]. Örneğin 6 sınıfa sahip bir veri seti düşünüldüğünde oluşturulacak sınıflandırıcı sayısı 15 olacaktır. Yönlendirilmiş çevrimsiz çizge yaklaşımı Platt et al. (2000) tarafından geliştirilen bir çoklu sınıflandırma yöntemidir. Bu yaklaşımda N sınıflı bir sınıflandırma problemi için oluşturulacak sınıflandırıcı sayısı N(N–1)/2 olup her bir sınıflandırıcı ilgilenilen iki sınıfı dikkate alarak eğitilir. Bu yöntemin işleyişi bire karşı bir yöntemi ile benzerdir ve eğitim aşaması tamamen aynı şekilde yapılır. Yöntemin farklılığı ise test aşamasında olmaktadır. Bu yöntemde test yapılırken bütün eğitim işlemleri kontrol edilerek gerçekleştirilmez. Bunun yerine örneğin ait olmadığı düşünülen eğitim örnekleri elenerek ilerlenir. 46 3.1.5. DVM ile Sınıflandırmada Veri Ön İşleme ve Model Seçimi Kontrollü sınıflandırma yönteminde problemin çözümü için sınıflandırılacak veriye ait örnekleri içeren eğitim ve test verileri kullanılır. Eğitim setindeki her bir örnek, öznitelik (özellik) verilerini ve bu verilere ait sınıf etiketlerini içermektedir. DVM’nin amacı sadece öznitelik değerleri belli olan test setindeki verilerin sınıf etiketlerini tahmin edecek bir model oluşturmaktır. DVM uygulanmadan önce verilerin ölçeklenmesi önemlidir [Sarle, 2008]. Ölçeklendirmenin asıl avantajı çok geniş sayısal aralıktaki verinin daha dar bir sayısal aralıkta ifade edilmesidir. Bir başka avantajı ise hesaplamalar sırasında işlem kolaylığı sağlamasıdır. Kernel değerleri genellikle özellik vektörlerinin skaler çarpımına dayandığından geniş aralıktaki öznitelik değerleri hesaplama sırasında sayısal problemlere neden olabilmektedir. Yapay sinir ağları ile yapılan sınıflandırmada olduğu gibi her bir öznitelik verisi (uzaktan algılamada her bir bant) [ 0,1] veya [ −1, + 1 ] aralığında ölçeklenmektedir. Verinin ölçeklenmesinin ardından, DVM’nin eğitimi için kullanılacak modelin seçilmesi ve seçilen kernel fonksiyona ait parametrelerin belirlenmesi esastır. Model seçiminde öncelikli olarak RTF ve polinom kernelin düşünülmesi oldukça mantıklıdır. Bunun ilk nedeni, RTF ve polinom kernelin doğrusal olarak ayrılamayan verileri daha yüksek boyutlu bir uzayda eşleştirmesidir. Bu nedenle lineer kernelin aksine sınıf etiketleri ve öznitelik verilerinin doğrusal olmadığı durumlarda da kullanılabilmektedir. Keerthi and Lin (2003), lineer kernel RBF kernelin özel bir hali olduğunu ve C düzenleme parametresine sahip lineer kernelin bazı parametrelere sahip (C, γ ) RTF kernel ile aynı performansa sahip olduğunu belirtmişlerdir. Buna ek olarak sigmoid kernel belirli parametreler için RTF kernel gibi davranış göstermektedir [Lin and Lin, 2003]. RTF kernelin tercih edilmesindeki ikinci neden ise model seçimini karmaşık hale getiren parametrelerdir. Polinom kernelin kullanımında söz konusu olan polinom derecesindeki değişimler matematiksel olarak algoritmayı karmaşık hale getirmekte ve çözümü zorlaştırmaktadır. Buna karşın RTF kernelin sahip olduğu gamma parametresindeki 47 değişimlerin sınıflandırıcının performansına olan etkisinin daha az olduğu ifade edilmektedir [Hsu et al., 2008]. RTF ve polinom kernel kullanımında iki parametre (C, γ ve C, d) söz konusudur. Herhangi bir problem için hangi parametre çiftinin en iyi sonuç vereceği bilinmemektedir. Bu nedenle en uygun parametrelerin belirlenmesi gerekmektedir. Bu amaçla geliştirilmiş birkaç yöntem mevcuttur. Bu yöntemlerde amaç en iyi sınıflandırma sonucunu verecek parametre çiftini belirlemektir. Böylece sınıflandırıcı veriye ait bilinmeyen sınıf etiketlerini daha doğru bir şekilde tahmin edebilecektir. Yaygın olarak kullanılan yöntemlerden birisi eğitim verisini iki kısma ayırmaktır. Birinci kısım sınıflandırıcının eğitimi sırasında eğitim verisi olarak kullanılırken ikinci kısım bilinmeyen yani test verisi olarak işleme koyulur. Bu sayede bu veri seti için tahmin doğruluğu başka bir ifadeyle bilinmeyen verinin sınıflandırılma performansı daha hassas bir şekilde ifade edilecektir. Bu işlemin literatürde çapraz geçerlik olarak adlandırılmaktadır. v − katlı çapraz geçerlilikte, ilk önce eğitim seti eşit boyutta v sayıda alt kümeye ayrılır. Daha sonra bir alt küme eğitilen sınıflandırıcı ile geriye kalan v − 1 alt küme ile test edilir. Bu şekilde tüm eğitim setindeki her bir örnek tahmin edilir ve doğru olarak sınıflandırılan verinin yüzdesi çapraz geçerliliğin doğruluğunu gösterir. C, γ ve C, d parametrelerinin çapraz geçerlilik kullanılarak belirlenmesinde grid tarama yöntemi kullanılan yöntemlerden birisidir. Bu yöntemin çalışma prensibi genel olarak parametre çiftlerinin çapraz geçerlilik yoluyla denenmesi ve en iyi çapraz geçerlilik doğruluğuna sahip olan çiftin tespit edilmesidir. Girid tarama yönteminde kullanılacak parametre çiftleri için katlanarak büyüyen dizilerinin ( C = 2 −5 ,2 −3 ,...,215 , γ = 2 −15 ,2 −13 ,...,2 3 ) denenmesi en pratik yoldur [Hsu et al., 2008]. Hassas bir grid tarama yapılması zaman alacağından öncelikle kaba bir aralıkta grid taraması yapılması zaman tasarrufu sağlar. Kaba grid taraması ile en iyi çapraz geçerlilik doğruluğunu sağlayan çiftler tespit edilir. Daha sonra yakın aralıklardaki parametre çiftleri için çapraz-geçerlilik yöntemi ile bu problemdeki veri seti için en yüksek sınıflandırma doğruluğunu veren parametreler belirlenir. En iyi sınıflandırma 48 doğruluğuna ulaşan parametre çifti bu şekilde belirlenerek sınıflandırıcının eğitimi tamamlanır. Daha sonra eğitilen sınıflandırıcı ile tüm veri seti için sınıf etiketleri tahmin edilir. 3.2. Karar Ağaçları Karar ağaçları yaygın kullanımı olan sınıflandırma ve örüntü tanımlama algoritmalarından birisidir. Bu yöntemin yaygın olarak kullanımının nedeni ağaç yapılarının oluşturulmasında kullanılan kuralların anlaşılabilir ve sade olmasıdır. Eğer kullanılan veriye dayalı olarak oluşturulan ağaç yapısı çok büyük değil ise ağacın oluşturulması ve sınıflandırma işleminin gerçekleştirilmesinde kullanılan kuralların anlaşılması oldukça kolay olacaktır. Genellikle karar ağaçlarının tasarımında iki yaklaşım mevcuttur [Swain and Hauska, 1977]. Bu yaklaşımlar prensipte benzerdir ancak uygulamada ağaçların tasarlanması açısından önemli farklılıklar vardır. 1. Manuel tasarım yöntemi 2. Sezgisel atama yöntemi Manuel yöntemler tüm sınıflar için hesaplanan ortalama vektör ve kovaryans matrisi gibi istatistikleri kullanır. Her bir özellik için tüm sınıfların ortalamaları ve varyanslarından elde edilen bir grafik çizilir. Bu grafik rastlantısal spektral çizim olarak adlandırılır. Genelde birkaç karar adımında tüm sınıfların ayrıldığı bu grafikten en uygun karar sınırlarının tahmin edilmesi mümkündür. Bu, her bir aşamada bir özelliğin kullanılması koşulu ile kabaca sınıflar arasındaki basit sınır aralığının tahmin edilmesi anlamına gelmektedir. Bu yöntemin uygun bir sınıflandırma yöntemi olmamasının başlıca iki nedeni vardır. Bunlardan ilki ağacın belirli bir basamağında iki veya daha fazla özellik olması durumunda grafiğin özellikler arasındaki ilişkilerin nasıl kullanılacağını göstermemesidir. İkincisi ise, verinin normal dağılımda olmadığı durumlarda kovaryans matrisinin tahmin edilmesinin oldukça zor olmasıdır. 49 Rastlantısal spektral çizim tek bir özelliğe dayalı sınıflar arasındaki ayrılabilirliğin tahmin edilmesine olanak verir. Sınıfların ayrımının yapılması birkaç özelliğin kombinasyonunu gerektirdiğinde spektral çizime dayanan manuel tasarım yaklaşımı oldukça kısıtlıdır. Genel olarak sınıf sayısının çok olduğu veya yeterli sınıflandırma doğruluğu için birçok özelliğin kullanımının gerektiği karmaşık problemler daha fazla analitik tasarım işlemlerini gerektirmektedir. Sezgisel yöntem kullanılarak bir sınıflandırma ağacı oluşturmak için özellik vektörleri ve bu vektörlere ait sınıf etiketlerinin eğitim verisinde olduğu kabul edilir. Bundan sonra karar ağacı eğitim verisini tekrarlı bir şekilde ayırarak daha sade, daha homojen hale getirir ve bir veya daha fazla öznitelik değerine sahip test verisi ağacın her bir dalında veya düğüm noktasında uygulanır. Bu işlemler ayırma düğümleri, hangi düğümlerin uç düğümler olacağının belirlenmesi ve uç düğüm noktalarına sınıf etiketlerinin atanması olmak üzere üç adımda gerçekleşmektedir. Sınıf etiketlerinin uç düğümlere atanması açık bir şekilde ifade edilecek olursa; belirli sınıfların diğerlerinden daha yüksek olasılığa sahip olduğu düşünüldüğünde çoğunluk oyuna veya ağırlıklı oylar esas alınarak sınıf etiketlerinin atanmasıdır. Bir ağaç yapısı düğüm, dal ve yaprak olarak adlandırılan üç temel kısımdan oluşur. Bu ağaç yapısında her bir öznitelik bir düğüm tarafından temsil edilir. Dallar ve yapraklar ağaç yapısının diğer elemanlarıdır. Ağaçta en son kısım yaprak en üst kısım ise kök olarak adlandırılır. Kök ve yapraklar arasında kalan kısımlar ise dal olarak ifade edilir [Quinlan, 1993]. Başka bir ifadeyle bir ağaç yapısı verileri içeren bir kök düğümü, iç düğümler (dallar) ve uç düğümlerden (yapraklar) oluşur. Karar ağacındaki her bir düğüm sadece bir ana düğüme ve iki veya daha fazla alt düğüme sahiptir (Şekil 3.7). Veri seti ağaç tarafından belirlenen karar iskeletine göre aşağı doğru hareket ettirilerek ve sıralı olarak bir yaprağa ulaşılana kadar alt bölümlere ayrılarak sınıflandırılır. Eğitim verileri ve bu verilere ait öznitelik bilgilerinden yararlanılarak bir karar ağacı yapısı oluşturulmasında temel prensip verilere ilişkin bir dizi sorular sorulması ve elde edilen cevaplar doğrultusunda hareket edilerek en kısa sürede sonuca gidilmesi olarak ifade edilebilir. Bu şekilde karar ağacı sorulara aldığı cevapları toplayarak karar kuralları oluşturur. Ağacın ilk düğümü olan kök düğümünde verilerin sınıflandırılması ve ağaç yapısının oluşturulması için sorular sorulmaya başlanır ve dalları olmayan düğümler ya da yapraklara gelene kadar bu 50 işlem devam eder. Bu noktada belirtilmesi gereken husus yaprak sayısı kadar kural oluşacağıdır. Oluşturulan ağacın işlevselliğinin başka bir ifadeyle yeni bir veri seti için genelleme kabiliyetinin belirlenmesi için test veri seti kullanılır. Eğitim veri seti ile oluşturulan ağaç yapısına yeni gelen bir test verisi, ağacın kökünden girer. Kökte test edilen bu yeni veri test sonucuna göre bir alt düğüme gönderilir. Ağacın belirli bir yaprağına gelene kadar bu işleme devam edilir. Kökten her bir yaprağa giden tek bir yol veya tek bir karar kuralı vardır. Quinlan (1993) bir karar ağacı oluşturma yöntemini aşağıdaki gibi ifade etmiştir. Bir karar ağacı oluşturmak için m sınıfa sahip T eğitim veri seti şeklinde ifade edilsin. Bu durumda üç olasılık vardır: • T, tümü Ci gibi tek bir sınıf olan bir veya daha fazla nesneye sahip olduğunda karar ağacı Ci sınıfını tanımlayan bir yapraktan oluşur. • T hiçbir veriyi içermiyorsa, karar ağacı yine T’den başka bilgilerle tanımlanan bir yapraktan oluşur. • T karışık sınıflardan oluşan veriler içeriyorsa, seçilecek test verisi tek bir özniteliğe ya da özniteliklerin kombinasyonuna dayanır. Bu durumda test verisi {O1 ,O2 ,…,Ok} şeklinde bir veya ayrışık sonuçlara sahip olacaktır. T, bu durumda şeklinde alt kümelere ayrılır. Burada seçilen test verileri için Oi çıktı değerlerini içeren tüm T eğitim verilerini ifade etmektedir. T eğitim verisi için karar ağacı test verisini tanımlayan bir karar düğümü ve her bir olası çıktı değeri için bir daldan oluşur. Aynı ağaç yapısı işlemi tekrarlı bir şekilde eğitim verisin her bir alt kümesi için uygulanır. Sınıflandırma işlemi için oluşturulan tipik bir karar ağacı Şekil 3.7’ de gösterilmiştir. Elips biçimindeki düğümler karar düğümleridir. Bu düğümler xi değerlerine dayanan η i eşik değerleri tarafından belirlenir. Karar ağacının farklı kısımlarında aynı öznitelik değeri farklı eşik değerlerine sahip olabilir. Şekildeki dikdörtgen düğümler terminal düğümleridir ve sınıf etiketlerini içeririler. Test verisindeki değerler eğitim sırasında belirlenen eşik değerlerine dayalı olarak karar ağacında “evet” veya “hayır” şeklinde dallanmalar ile belirlenir. Bilinmeyen test 51 verisinin sınıflandırılması düşünüldüğünde, verilere ait sınıf etiketleri ulaşılan en son terminal düğümdeki değeri alır. x1 ≤ η1 Hayır Evet x4 ≤ η 4 x3 ≤ η 31 Hayır Evet Y=1 Hayır Y=3 x3 ≤ η 32 Evet Evet Y=2 x2 ≤ η 2 Hayır Hayır Evet Y=2 Y=1 x5 ≤ η 5 Evet Y=1 Hayır Y=3 Şekil 3.7. Beş boyutlu bir özellik uzayı ve üç sınıf için bir sınıflandırma ağacı. Şekilde xi özellik değerlerini, η i eşik değerlerini ve Y ise sınıf etiketlerini göstermektedir. Karar ağaçları ile sınıflandırma problemlerinde veri setine ait sınıf sayısı iki olduğunda ikili sınıflandırıcılar, sınıf sayısı ikiden fazla olması durumunda ise çoklu sınıflandırıcılar söz konusudur. İkili sınıflandırıcılara örnek olarak ID3 [Quinlan 1993] ve bu algoritmanın geliştirilmiş biçimi olan C4.5 algoritmaları gösterilebilir. Çoklu sınıflandırıcılar arasında CART [Breiman et al., 1984] algoritması örnek olarak verilebilir. 3.2.1. Karar Ağacı Oluşturulmasında Kullanılan Yöntemler Literatürde günümüze kadar birçok ağaç yapısı oluşturma yaklaşımları geliştirilmiştir. Ancak karar ağacı tasarımı üzerine yapılan birçok araştırma bölünme kurallarının bulunması konusuna yoğunlaşmıştır [Landeweerd et al., 1983; 52 Kononenko and Hong, 1997; Pal, 2002]. Karar ağacının her bir iç düğümünde eğitim verisinin bölümlenmesi için bir takım algoritmalar geliştirilmiştir. Bu algoritmalar ya eğitim verisindeki gürültüyü azaltır ya da bölümlenmenin en iyi olmasını sağlar. Bir karar ağacı oluşturulmasında yaklaşımlar: • Aşağıdan yukarıya yaklaşımı • Yukarıdan aşağıya yaklaşımı • Melez yaklaşım • Büyüme – budama yaklaşımı 3.2.1.1. Aşağıdan-Yukarıya Yaklaşımı Aşağıdan-yukarıya yaklaşımında, kullanılarak eğitim seti ve bazı uzunluk ölçüleri (örn. Mahalanobis uzaklığı) ikili bir ağaç oluşturulur. Önceden belirlenen sınıflar arasında ikili uzaklıklar hesaplanır ve her bir adımda bir birine en yakın uzaklığa sahip iki sınıf yeni bir grup olarak birleştirilir. Her bir grup için, bu grubu oluşturan sınıfların eğitim verilerinden ortalama vektör ve kovaryans matrisi hesaplanır. Bu işleme ağaç kökünde tek bir grup kalıncaya kadar tekrar edilir. Bu şekilde bir ağaç oluşturulmasında ilk önce daha belirgin olan ayrımlar kök düğümün hemen yanında yapılır, daha karmaşık olanlar ağacın daha sonraki kısımlarında yapılır [Landeweerd et al., 1983]. 3.2.1.2. Yukarıdan-Aşağıya Yaklaşımı Yukarıdan-aşağıya yaklaşımında, bir karar ağacı sınıflandırıcısının oluşturulması aşağıdaki üç aşamadan oluşur. Bunlar: 1. Bir bölünme kural düğümünün seçimi, 2. Hangi düğümlerin bağlantı düğümleri olacağına karar verilmesi, 3. Her bir bağlantı düğümüne, bir sınıf etiketinin atanmasıdır. 53 Sınıf atama problemi yukarıda bahsedilen işlerden en basit olanıdır. Çoğunluk kuralı kullanılarak en yüksek olasılığa sahip sınıflar terminal düğümlerine atanır. Bu işleme örnek olarak terminal düğümünde en fazla örneğe sahip olan sınıfa ait etiket terminal düğümüne atanması gösterilebilir. İç düğümdeki herhangi bir bölünme kriteri seçiminde temel düşünce verinin alt düğümlerde azalmasını sağlamaktır. Bu işlemin uygulamasındaki genel yaklaşım eğitim verisini en iyi şekilde sınıflara ayıran öznitelik değerinin seçilmesi ve daha sonra verinin bu öznitelik değerlerine göre bölünmesidir. Sonlandırma prosedürü ile her bir bölümlenmiş alt küme için bu işlem mevcut alt kümedeki tüm örnekler aynı sınıfa ait olana kadar tekrarlanır. Sonuç her bir düğümün bir özniteliği gösterdiği ve bir düğümden çıkan her bir dalın bu öznitelik değerine ait olası bir değeri belirttiği bir ağaç ile temsil edilir. Karar ağacının gelişiminde her bir düğüm noktasında bir dizi gözlem kümesi ve bu gözlem kümesinin sınıflandırılması için bir dizi öznitelik değeri var olacağından bu işlemin temel amacı kriter olarak kullanılacak öznitelik değerinin seçilmesidir. Tüm öznitelik değerlerinin kalitesi belirlenmeden ve her bir öznitelik bilgisinin veriyi çeşitli sınıflara ne kadar iyi ayırdığını görülmeden herhangi bir öznitelik değeri kriter olarak seçilemez. Bir öznitelik değerinin kalitesi bu öznitelik verisiyle sağlanacak yararlı bilgileri göstermelidir. Bir özniteliğin kalitesinin tahmini için iki temel yaklaşım vardır. İlk yaklaşım, bir özniteliğin kalitesinin diğer öznitelikleri ihmal edilmesiyle tahmin edilebileceğidir. Bu durumda tahmin amacıyla öznitelik değerlerinin birbirinden bağımsız olduğu kabul edilir. İkinci yaklaşım ise, bir özniteliğin kalitesinin diğer özniteliklerin içeriğinden tahmin edilebileceğidir. Hesaplama hızı avantajına sahip olan ilk yaklaşım “miyop yaklaşım” olarak da adlandırılır [Kononenko and Hong, 1997]. Diğer yaklaşım hesaplama açısından daha zahmetlidir buna karşın öznitelikler arasındaki yüksek seviyedeki bağımlılıkları ortaya çıkarma potansiyeline sahiptir. 54 3.2.1.2.1. Karar Ağaçlarında Dallanma Kriterleri ve Öznitelik Seçimi Karar ağaçlarının oluşturulmasındaki en önemli adım ağaçtaki dallanmanın hangi kritere veya kıstasa göre yapılacağı ya da hangi öznitelik değerlerine göre ağaç yapısının oluşturulacağıdır. Karar ağaçlarında dallanma kriterleri veya özniteliklerin seçimi için makine öğrenmesi ile ilgilenen araştırmacılar tarafından detaylı bir şekilde incelenen birçok yaklaşım vardır [Murthy et al., 1994; Kononenko and Hong, 1997; Mingers, 1989; Quinlan, 1993]. Diğer yaklaşımlar eğitim verisindeki gürültüyü minimum hale getirmeye çalışırken bazı yaklaşımlar “bölünmenin iyiliğini” ölçerler [Brieman et al., 1984]. Sınıflandırmada özniteliğin kalitesi sınıflara ait eğitim gözlemlerinin saflığı ile tanımlanır ve birçok yaklaşım kalite ölçümünü direkt olarak özniteliklerden belirler. Eğer tüm gözlemler aynı sınıfa ait ise gözlemler kümesi saftır (katkısızdır). Gürültü fonksiyonu bir gözlem kümesindeki gürültüyü ölçer ve saf bir küme için bu gürültüyü minimum hale getirmeyi amaçlar. Gürültü fonksiyonu esas olarak mevcut düğüm noktasından daha ileriki bölünmeler için en iyi özniteliğin seçiminde kullanılır. Karar ağaçlarında genellikle kullanılan gürültü ölçümleri: 1. Bilgi Kazancı ve Bilgi Kazanç Oranı kriteri [Quinlan, 1987, 1990, 1993]. 2. Gini İndeksi [Brieman et al., 1984] 3. Twoing Kuralı [Brieman et al., 1984] 4. Ki-Kare istatistikleri [Mingers, 1989]. 3.2.1.2.2. Bilgi Kazancı ve Bilgi Kazanç Oranı Kriterleri Bilgi kazancı ve bilgi kazanç oranının kullanımı Quinlan (1993) tarafından ortaya atılmıştır. Bu yönteme göre karar ağacında hangi özelliğe göre dallanmanın yapılacağını belirlemek üzere entropi kurallarını içeren bilgi teorisi kullanılmıştır. Entropi bir sistemdeki düzensizliğin ya da belirsizliğin ölçüsüdür. Entropi bir kodun 55 teorik bilgi içeriğini ölçen bilgi teorisinden elde edilen klasik bir formüle dayanır. Bu formül; Entropi = −∑ pi log( pi ) (3.25) şeklinde gösterilir. Bu formülde pi, i. pikselin olasılığıdır. Bu ölçünün değeri çeşitli olası piksellerin olabilirliğine dayanır. Tüm pikseller eşit olasılıkta ise (örneğin pi değerleri eşit ise) büyük miktarda belirsizlik vardır ve bilgi kazancı büyük olacaktır. Fonksiyonun değeri olası piksel sayısına da dayanmaktadır. Quinlan (1993), bilgi kazancı ve bilgi kazanç oranı ölçülerini aşağıdaki şekilde ifade etmiştir: Ci şeklinde birkaç sınıftan oluşan T ile gösterilen bir eğitim seti için olasılık ifadesi f ( Ci ,T ) T şeklindedir. Burada f ( Ci ,T ) (3.26) ifadesi Ci sınıfına ait T eğitim setindeki örnekleri ifade etmektedir ve T ifadesi ise T eğitim setindeki sınıf sayısını göstermektedir. Bu durumda bilgi, − log 2 ( f (C i , T ) T ) (3.27) şeklindedir. T eğitim setindeki bir gözlemi için sınıfın belirlenmesini gerektiren bilgi kazancının miktarı; m bi lg i( T ) = −∑ f ( C i ,T ) T × log 2 ( f ( C i ,T ) T ) (3.28) i =1 şeklinde belirlenebilir. Bu miktar T eğitim setinin entropisi olarak ifade edilebilir. Eğer T eğitim kümesini k sayıda çıktıya bölebilen bir Z test veri seti tanımlanabilirse, Z uygulandıktan sonra tüm bilgi miktarını belirten benzer bir ölçü tanımlanabilir. 56 k bi lg i z ( T ) = ∑ Tj j =1 T × bi lg i( T j ) (3.29) Bu yaklaşımın kullanılmasıyla, T eğitim setinin Z gibi bir test seti kullanarak elde edilen bilgi kazancı; Kazanç( Z ) = bi lg i( T ) − bi lg i z ( T ) (3.30) şeklinde belirlenebilir. Bu kriter Quinlan (1993) tarafından kazanç kriteri olarak ifade edilmiştir. Kazanç kriteri bilgi kazancını maksimum hale getirmek için bir test verisi seçer. Bu Z test verisi ile sınıf arasındaki karşılıklı bilgi olarak bilinir. Birçok çıktı değerini içeren test verisinin lehine güçlü bir önyargıya sahip olması kazanç kriterinin en önemli dezavantajıdır. Kazanç kriterinin özündeki bu önyargı birçok çıktı değeri ile birlikte kazancın ayarlandığı bir çeşit normalleştirilme ile düzeltilebilir. Bu normalleştirme işlemi Eşitlik 3.31’de gösterilen ayırma bilgisi ile gerçekleştirilebilir. ⎛ Tj ⎜ × log 2 ⎜ T ⎜ T j =1 ⎝ k Ayırma Bilgisi (Z) = − ∑ Tj ⎞ ⎟ ⎟⎟ ⎠ (3.31) Kazanç birkaç bölünme sonucu ortaya çıkan sınıflandırma için yararlı bilgiyi ölçerken, ayırma bilgisi Z test verisinin k sayıda alt kümeye bölünmesi ile oluşturulan potansiyel bilgi hakkında bir fikir verecektir. Bu durumda kazanç oranı; Kazanç Oranı( Z ) = Kazanç( Z ) Ayırma Bi lg isi( Z ) (3.32) şeklinde olacaktır. Bu eşitlik, sınıflandırmada işleminde kullanılacak ayırma ile elde edilen bilgi oranını vermektedir. Bu kriter kullanılarak, ağacın her bir düğümünde kazanç oranı maksimum olacak şekilde T eğitim kümesi tekrarlı bir şekilde ayrılır. 57 Bu işlem her bir yaprak düğümü sadece bir sınıfa ait gözlem değerleri içerene kadar devam eder. 3.2.1.2.3 Gini İndeksi Brieman et al. (1984) çeşitleme için Gini indeksi olarak adlandırılan bir ölçüm kullanmışlardır. Gini fonksiyonu sınıflara ilişkin özniteliklerin safsızlığını ölçer. Ci gibi bazı sınıflara sahip T şeklinde verilen bir eğitim setinin; (3.33) f ( C i ,T ) T şeklinde bir olasılığa sahip olduğu söylenebilir. Genel Gini fonksiyonu veya safsızlığın ölçümü; ∑ ∑ ( f (C ,T ) T )( f (C ,T ) T ) j ≠i i j (3.34) şeklinde ifade edilebilir. Bu fonksiyon; 2 ⎛ ⎞ ⎜ ∑ f (C j ,T ) T ⎟ − ∑ f 2 (C j ,T ) T ⎟ ⎜ j ⎠ ⎝ j (3.35) şeklinde veya; 1 − ∑ f 2 (C j ,T ) T (3.36) j şeklinde de yazılabilir. Gini indeksi basittir ve hızlı bir şekilde hesaplanabilir. Bu indeks rastgele seçilen bir objenin bir düğümden f (Ci ,T ) T olasılığı ile i sınıfına atanması olarak özetlenebilir. 58 3.2.1.2.4. Towing Kuralı Towing kuralı Brieman et al. (1984) tarafından tanımlanmıştır. Bu kural karar ağacı yapısının oluşturulmasında öznitelik seçimi için farklı bir yaklaşım kullanmaktadır. Bir dizi sınıf C = { 1,..., j ) ile gösterildiği düşünülsün. Her bir düğümde bu sınıflar C1 = { j1 ,..., j n ) ve C 2 = C − C1 şeklinde iki üst sınıfa ayrılsın. Düğümün ayrılması sonucunda safsızlığının azaldığı her bir düğümün ayrılması; (T L ⎛ ⎞ T )* ⎜⎜ ∑ Li TL − Ri TR ⎟⎟ ⎠ ⎝ T )* ( TR şeklinde hesaplanabilir. Burada TR ve 2 (3.37) TL düğümün ayrılması ile sağ ve solda kalan örneklerin sayısını göstermektedir. Li ve Ti ise ayırma sonucu sağ ve solda i. kategoriye ait örneklerin sayısını ifade etmektedir. Safsızlıktaki zamla towing kuralı olarak ifade edilir. 3.2.1.2.5. Ki-Kare Olasılık Tablo İstatistiği ( χ 2 ) Mingers (1989) bu ölçütün karar ağacı oluşturulmasında özniteliklerin seçimi için kullanımını ifade etmiştir. Bu yöntem olasılık tablosundaki iki değişken arasındaki ilişkinin ölçüldüğü geleneksel istatistiğe dayanmaktadır. Değişkenler arasında ilişki olamadığı durumlarda ise beklenen frekansların gözlemlerin frekansları ile karşılaştırılmasından elde edildiği istatistiğe dayanmaktadır. Sonuçta elde edilen istatistiğin yaklaşık olarak yüksek değerlerin büyük ilişkiyi ifade ettiği kikare dağılımında olduğu söylenebilir. Bu fonksiyona ait temel eşitlik; χ = ∑∑ 2 (x − Eij ) 2 ij Eij (3.38) 59 şeklindedir. Bu eşitlikte Eij = xi x j N ifadesi olasılık tablosundaki her bir hücreye karşılık gelen ümit değeridir. Yukarıdan-aşağıya karar ağacı sınıflandırıcısı tasarımının son aşaması ayırmanın nerede bitirilmesi gerektiğinin belirlenmesidir. Bunun için ilk yaklaşım terminal düğümlerinin seçilmesidir. Eşik değeri β > 0 için eğer t düğümü; mak Δ i( S ( t ),t ) < β (3.39) S∈T koşulunu sağlıyorsa terminal düğümü olarak seçilir. Bunu başarmak için her bir t iç düğüm noktasında i(t) şeklinde bir safsızlık fonksiyonunun tanımlanması bir yöntemdir [Breiman et al.,1984]. Eğer bir S aday ayırma, t iç düğümünü sağ düğüm tR ve sol düğüm tL şeklinde düğümlere ayırıyorsa ve t’nin tL düğümüne pL oranında, tR düğümüne pR oranında ayrılmasını sağlıyorsa; S ayırmasının iyiliği azalan safsızlıkla ölçülebilir; Δ i( S ,t ) = i( t ) − i( t L ) p L − i( t R ) p R (3.40) Bu nedenle tüm S ayırmaları içerisinden Δ i( S ,t ) ifadesini minimum hale getirecek bir ayırma seçilir. Bu kuralın kullanılması sonucunda ayırma işlemi bazı düğümlerde çok erken tamamlanmakta bazı düğümlerde çok geç tamamlanması problemi ortaya çıkmaktadır. Breiman et al. (1984) ayrılmanın durdurulma kuralının ayırma kuralına göre karar ağacı sınıflandırıcısının etkinliğinde daha fazla etkisi olduğunu ifade etmiştir. 3.2.1.3. Melez Yaklaşım Melez yöntemler karar ağacı sınıflandırıcısının tasarımının sırayla hem yukarıdan-aşağıya hem de aşağıdan-yukarıya yaklaşımlarının kullanımını öngörmektedir [Kim and Landgrebe, 1991]. Bu sınıflandırıcının temel çalışma prensibi şu şekildedir. İlk olarak, tüm sınıflardan oluşan veri aşağıdan-yukarıya yaklaşımı kullanılarak iki alt gruba ayrılır. Daha sonra her bir alt grubun ortalama ve kovaryansları hesaplanır ve yukarıdan-aşağıya yaklaşımı kullanılarak iki yeni alt 60 grup oluşturulur. Her bir alt grubun sadece bir sınıf içerip içermediği kontrol edilir. Eğer tek bir sınıf içeriyorsa bu grup terminal olarak adlandırılır. Eğer birden fazla sınıfı içeriyorsa işleme tek alt grup tek bir sınıf içerene kadar devam edilir. Bu işlem tüm alt gruplar terminal olarak belirlenene kadar devam eder. 3.2.1.4. Gelişme-Budama Yöntemi Bir karar ağacının oluşturulmasında kullanılan bu yöntem Gelfand et al. (1991) tarafından öne sürülmüştür. Bu yöntemin çalışma prensibi şu şekilde özetlenebilir. Öncelikle tüm veri seti yaklaşık olarak eşit olacak şekilde iki alt kümeye ayrılır. Geniş ağaç ilk veri alt kümesi kullanılarak saf terminal düğümleri ile birlikte büyütülür. Budanan alt-ağaç ikinci veri setine dayalı olarak hata oranını minimum hale getirilmesi ile belirlenir. Bu işlem iteratif olarak tekrar edilir. 3.2.2. Veri Ayırma Yöntemine Dayalı Sınıflandırma Algoritmaları Karar ağaçları iç düğümlerdeki ayrılmaların tahmini için kullanılan algoritmaların tek tip veya çoklu olup olmadığına göre tanımlanabilir. Bu tür algoritmalar homojen veya heterojen hipotez uzayına sahip algoritmalar olarak tanımlanır. Karar ağaçlarının tasarımı için kullanılan geleneksel yaklaşım her bir ayrımın tahmininde tek bir algoritmayı kullanan homojen sınıflandırma modellerine dayanan yaklaşımdır. Genel anlamda homojen hipotez uzayına dayanan iki tip karar ağacı vardır. Bunlar tek değişkenli ve çok değişkenli karar ağaçlarıdır [Friedl and Brodley, 1997]. Düğümlerin yapısı bakımından karar ağaçlarının üç tipi vardır: • Tek değişkenli karar ağaçları • Çok değişkenli karar ağaçları • Melez karar ağaçları 61 3.2.2.1. Tek değişkenli Karar Ağaçları Tek değişkenli karar ağaçları her bir düğüm noktasındaki karar sınırlarının girdi verisindeki tek bir özelliğe göre belirlendiği bir karar ağacı tipidir [Swain and Hauska, 1977]. Tek değişkenli karar ağacında her bir iç düğümde girdi verisindeki tek bir özelliğin test edilmesi ile verinin iki veya daha fazla alt kümeye ayrılması söz konusudur. Bununla birlikte bu karar ağacı yapıları her bir testin ayrı ve sınırlı sayıda çıktı değerine sahip olmasını gerektirmektedir. Bu şekilde karar ağacı sınıflandırması tekrarlı bir şekilde girdi verisinin bir yaprak düğümüne ulaşıncaya kadar ve yapraktaki sınıf etiketi gözlemlere atanıncaya kadar bölünme devam eder. Tek değişkenli bir karar ağacında karar sınırlarının spesifik değerleri eğitim verisinden deneysel olarak tahmin edilir. Sürekli verilerin olması durumunda, eğitim verisinden her bir iç düğüm noktasında X i ’nin veri uzayındaki bir özelliği gösterdiği ve b’nin X i ’nin gözlenen aralığında bir eşik değeri olduğu X i > b şeklindeki mantıksal sınama gerçekleştirilir. Farklılıkların maksimum hale getirilmesi veya iniş düğümlerindeki benzerliğin minimum hale getirilmesi gibi bazı koşullar kullanılarak eşik değeri b belirlenebilir. Tek değişkenli karar ağacında her bir test tek bir girdi değişkenine sahip olduğundan, değişkenlere ait eksenlerin birbirine dik olduğu özellik uzayının ayrılması şeklinde gösterilir (Şekil 3.8). Şekil 3.8. Tek değişkenli karar ağacının paralel eksenli karar sınırları. Tek değişkenli karar algoritmalarının temeli Earl B. Hunt tarafından gerçekleştirilen algoritmaya dayanmaktadır. Bu algoritma en temel karar ağacı 62 yaratma algoritmasıdır. Bu algoritmanın en önemli eksikliği dallanmaya esas olan özelliklerin rastgele seçilmesidir. Bu eksikliğin giderilmesi ve yöntemin geliştirilmesi amacıyla çeşitli algoritmalar geliştirilmiştir. Bunlardan en önemlisi 1987’te Quinlan tarafından geliştirilen ID3 algoritmasıdır. Bu algoritma sayısal olmayan verilerin sınıflandırılması için geliştirilmiş entropiye dayalı bir algoritmadır. Hunt algoritmasında dallanma için seçilecek özelliğin rastgele seçilmesinden ziyade bu yöntemde bilgi kazancı en yüksek olan özellik dikkate alınarak karar ağacı oluşturulur. Quinlan (1987) bu amaçla entropi kurallarını içeren bilgi teorisi yaklaşımından yararlanmıştır. Quinlan (1993) tarafından sayısal özellikli verilerinde karar ağaçları kullanılarak sınıflandırılması amacıyla yine entropiye dayalı C4.5 algoritması geliştirilmiştir. C4.5 algoritması ID3 algoritmasını esas alarak, ID3 algoritmasındaki bazı eksiklikleri ve sorunları gidermek amacıyla geliştirilmiştir. ID3 Ayrıca bu yöntem bilinmeyen nitelik değerlerine sahip veri setleri için karar ağacının nasıl oluşturulacağına dair bir yol göstermektedir. Quinlan (1993) C4.5 algoritmasında bölünme bilgisi kavramından yararlanarak ID3 algoritmasını güncellemiştir. Bu durumda bilgi kazancı kavramı yerine kazanç oranı kriteri kullanılarak dallanmaya hangi özellikten başlanacağı belirlenmektedir. 3.2.2.2. Çok Değişkenli Karar Ağaçları Sınıf yapısı sadece değişkenlerin kombinasyonları ile meydana geldiğinden, tek değişkenli karar ağaçları veri yapısının ortaya çıkarılmasında zayıf kalmaktadır [Brodley and Utgoff, 1995]. Doğrusal bir yapının söz konusu olduğu bir problemde kabul edilebilir ayrılmalar girdi verisindeki özelliklerin doğrusal kombinasyonlarını içerek şekilde devam ettirilir (Şekil 3.9). 63 Şekil 3.9. Çok değişkenli karar ağacı sınıflandırıcısı için karar sınırları. Çok değişkenli karar ağaçları her bir düğümdeki ayırma testinin girdi verisindeki birden fazla özelliğe dayalı olarak yapılması dışında tek değişkenli karar ağaçlarına benzemektedir. Çok değişkenli karar ağacının her bir iç düğümünde doğrusal ayırma fonksiyonları seti tahmin edilir ve eğitim verisinden yararlanılarak her bir düğüm noktasında doğrusal ayırma fonksiyonuna ait katsayılar belirlenir. Her bir düğümdeki test; ∑ ai X i ≤ c (3.41) i şeklinde gerçekleştirilir. Burada X i veri uzayındaki özellikleri, a doğrusal ayırma fonksiyonun katsayılar vektörünü ve c eşik değerini göstermektedir. Çok değişkenli karar ağaçları daha karmaşık bununla beraber daha hassas olduğu belirtilmiştir [Brodley and Utgoff, 1995]. Çok değişkenliliğin tek değişkenli karar ağacı algoritmalarına göre sahip olduğu yüksek karmaşıklık çok değişkenlilerin performansını etkileyen bir dizi faktör ile açıklanır. Bunlardan ilki, iç düğümlerde ayrılma kuralının belirlenmesinde farklı algoritmaların kullanılabilmesi ve bu algoritmaların her birinin sınıflandırma probleminde veriye bağlı olarak farklı derecelerde performansa sahip olabilmesidir. İkinci olarak, çok değişkenli karar ağacının her bir iç düğümündeki ayrımın birden fazla özellik kullanılarak yapılmasıdır. Bu durumda çok değişkenli karar ağaçlarının her bir iç düğümünde özellik seçimini gerçekleştirmek için farklı algoritmalar kullanılması söz konusudur. Bu algoritmalar ardışık olarak ileriye ve ardışık olarak geriye elemeleri içerir. Bu 64 algoritmaların global bir özellik seçiminden ziyade lokal bir özellik seçimi gerçekleştirmesi çok değişkenli karar ağacı algoritmalarındaki bir başka problemdir. Çok değişkenli karar ağaçları oluşturulmasında kullanılan en önemli yöntem Breiman et al. (1984) tarafından geliştirilen sınıflandırma ve regresyon ağaçlarıdır (CART). Bu yöntem ile karar ağacı oluşturulmasında, her bir karar düğümünden itibaren ağacın iki alt dala ayrılması yani ikili dallanmalar söz konusudur. Başka bir ifadeyle bir düğümde seçme işlemi yapıldığında, düğümlerden sadece iki dal ayrılabilir [Özkan, 2008]. CART algoritmasında bölünme işleminde kullanılan en önemli iki algoritma Gini ve Twoing algoritmasıdır. 3.2.2.3. Melez Karar Ağacı Sınıflandırıcısı Melez karar ağacı, geniş ağacın farklı alt ağaçlarında farklı sınıflandırma algoritmalarının kullanıldığı bir karar ağacıdır. Bu algoritmalar doğrusal ayırma fonksiyonu, k en yakın komşuluk veya diğer sınıflandırma algoritmaları olabilir. Melez karar sınıflandırma yaklaşımının uygulanmasındaki temel neden sınıflandırmadaki performanslarına ilişkin üstünlükleridir [Friedl and Brodley, 1997]. Tekil melez ağacı yapısında farklı sınıflandırma algoritmaları kullanılırsa, verinin farklı alt kümeleri için farklı sınıflandırıcıların kullanılması şeklinde veri seti ayrılabilir. Şekil 3.10’da doğrusal ayırma fonksiyonu (DAF), k en yakın komşuluk (K-EK) ve tek değişkenli karar ağacı (TDK) gibi üç farklı sınıflandırma algoritmasının kullanıldığı melez sınıflandırma algoritmasına ilişkin bir örnek görülmektedir. DAF K-EK Sınıf A Sınıf B TDK Sınıf A Sınıf C Şekil 3.10. Melez karar ağacı sınıflandırıcısına ait örnek bir yapı. 65 3.2.3. Karar Ağaçlarının Budanması Karar ağacı sınıflandırıcısı eğitim verisini sadece tek bir sınıf içeren alt kümelere böler. Bu işlem sonucunda çok geniş ve karmaşık bir ağaç ortaya çıkar. Birçok durumda bir karar ağacının tüm yapraklarının tek bir sınıf verisini içerecek şekilde ayarlanması eğitim verisindeki kirlilik nedeniyle overfit problemini ortaya çıkarabilir. Bu problemin çözümünde sınıflandırılacak veri eğitim seti dışarısında kaldığında oluşan sınıflandırma hatalarını azaltmak için orijinal ağaç budanabilir. Bir karar ağacı tüm ağaç yapısındaki yaprakların silinmesi ile basitleştirilmez. Bunun yerine karar ağacının sınıflandırma doğruluğunu etkilemeyen veya katkısı olmayan kısımlarının çıkarılması işlemi gerçekleştirilir. Böylece daha az karmaşık ve daha anlaşılabilir bir ağaç elde edilir. Daha basit bir ağaç oluşturulması için karar ağacı sınıflandırıcısının düzenlenmesinde kullanılan iki yöntem vardır [Breiman et al., 1984]. Bu yöntemler; 1. Eğitim veri setinin daha ileriye bölünüp bölünmemesine karar vermek; 2. Ağacın bazı kısımlarının geriye dönük bir şekilde kaldırılması için tekrarlı bir şekilde bölünme ile yapının oluşturulması. İlk yaklaşım durdurma ya da ön budama olarak adlandırılır. Bu yöntemin en önemli avantajı sadeleştirilmiş ağaç yapısında kullanılmayan bir yapının birleştirilmesinde zaman harcamamasıdır. Bu yöntem, veri setinin ayrılması için en iyi yolu araştırır ve bilgi kazancı ya da hata azalımı gibi faktörler ile bir noktadan daha ileriye ayrım yapılıp yapılmayacağı değerlendirilir. Bu değerlendirme belirli bir eşik değerinin altına düştüğünde bölünme kabul edilmez ve veri için en uygun yaprak olduğuna karar verilir. Bu yaklaşımın dezavantajı ise doğru durdurma kuralının belirlenmesidir [Pal, 2002]. Eşik değerinin çok yüksek seçilmesi durumunda ağacın daha ileriye bölünmesine izin verilmediğinden daha iyi sonuçlar verecek alt bölünmeler yapılmadan işlem sonlanacaktır. İkinci yaklaşımda, ağacın tüm yapraklar tek bir sınıfa ait veriyi içerdiğinde ulaşılan en sona kadar büyümesine izin verilir. Ağaç bundan sonra budanır. Bu 66 yöntem ağacın sonradan çıkarılan kısımlarının oluşturulmasında çok fazla hesaplama yapılmasını gerektirir. Bir karar ağacının budanması eğitim verisinde birçok sınıflandırılmamış veri oluşmasına neden olacaktır. Bu nedenle budanan karar ağacı yapraklarının tek bir sınıfa ait eğitim verisini içermesine gerek yoktur. Bir sınıfın bir yaprakla ilişkilendirmesi yerine her bir sınıf için, o sınıfa ait olan yapraktaki eğitim verisine ait olan olasılığı belirten sınıf dağılımı olacaktır Karar ağaçları bir veya daha fazla alt ağacın kaldırılması ile sadeleştirilir ve bu alt ağaçların yerine yapraklar ile ifade edilir. Bu işlem ağacın en altından başlar ve yapraksız her bir alt ağaç incelenir. Bu işleme aşağıdan yukarıya yaklaşımı denir. Alternatif olarak işlem kökten başlar dallar incelenerek ağacın yapraklarına doğru hareket edilir. Bu yaklaşıma ise yukarıdan aşağıya yaklaşımı olarak adlandırılır. Eğer tek bir yaprağı olan alt ağacın veya bu ağacın en çok kullanılan dalının değiştirilmesi beklenen hata oranının daha düşük oluşmasına neden olacaksa ağaç budanır. Alt ağaçlardaki hata oranı azaldığından tüm ağaç için hata oranı azalacaktır. Bu işlem sonucunda kabul edilebilir bir budama ile beklenen hata oranının minimum hale getirildiği bir ağaç elde edilir. Burada dikkat edilmesi gereken husus, budamanın her zaman eğitim verisi üzerindeki hatanın artmasına neden olacağıdır. Bu nedenle hata oranlarının tahmin edilmesinde uygun bir tekniğe ihtiyaç duyulmaktadır. Bir karar ağacının budanmasında kullanılan teknikler aşağıda sıralanmıştır: 1. Karmaşık değerli budama 2. Hata azaltmalı budama 3. Karamsar budama 4. Hata tabanlı budama 5. Kritik değerli budama Karmaşık değerli budama yönteminde, bir ağacın tahmin edilen hata oranı ağacın eğitim verisi üzerindeki hatası ve ağacın karmaşıklığının ağırlıklı toplamı olarak modellenir. Burada en uygun ağırlıkların belirlenmesi için ayrı veri setleri kullanılır. 67 Hata azaltılan budama yönteminde ise, ağacın test veri setini ayırdığı kısımlarının ve ağacın tamamının hata oranını belirler. Bu metotta orijinal ağaç tüm test veri setini sınıflandırır. T’nin S ile adlandırılan her bir yapraksız alt ağacı için, test veri seti üzerinde hatalı sınıflandırma sonucu oluşan değişiklikler tespit edilen en iyi olasılığa sahip yaprakla yenilenir. Eğer yeni oluşan ağaç eşit veya daha az hataya sahipse ve S aynı özelliğe sahip alt ağaçlar içermiyorsa, S alt ağacı bir yaprakla yinelenir. Bu işlem test seti üzerindeki hatalar artmaya başlayıncaya kadar tekrar edilir. Diğer bir karar ağacı budama yöntemi olan karamsar budama yönteminde, eğitim alt kümelerinin birleşimini ve boyutunu göstermek için alt ağaçların beklenen hata oranlarını arttırır. Daha sonra tahmin edilen hata oranı bir yaprağınkinden önemli derecede küçük olmayan her bir alt ağaç yerine koyulur. Bu yöntem Quinlan (1987) tarafından ortaya konulmuştur. Bu yöntem ayrı bir test veri setine olan zorunluluktan kaçınmayı amaçlamaktadır. Hatalı sınıflandırma oranının daha gerçekçi bir şekilde elde edilmesi için binom dağılımı için süreklilik düzeltmesi kullanılır. Hata tabanlı budama yöntemi karamsar budama yönteminin geliştirilmiş bir halidir. Hata tabanlı budama algoritması beklenen hata oranının daha karamsar tahmini esasına dayanır. Karamsar budamada tanımlanan yöntemin aksine bu metot ağacın büyüyen düğümlerini yukarıdan aşağıya denetler. Kritik değerli budama yöntemi, ağaç oluşumu aşamasında yapılan sınıflandırmalardan bir düğümün etkinliğinin veya öneminin tahmin edilmesi esasına dayanmaktadır. Orijinal ağaç oluşumunda bölünme ölçülerinin iyiliği bir düğümdeki özniteliği belirler. Bu ölçü değerleri, bir düğümde seçilen özniteliğin sınıflar arasındaki verileri bölmede ne kadar iyi olduğunu yansıtmaktadır. Bu budama yöntemi bir kritik değer belirler ve kritik değerlere ulaşamayan düğümleri budar. Bu işleme dallar arasında bu kritik değere ulaşan bir dal bulunana kadar devam edilir. Burada dikkat edilmesi gereken husus yüksek seçilen kritik değerin budama derecesinin yüksek olacağı ve sonuçta daha küçük boyutlu bir ağaç yapısı elde edileceğidir [Mingers, 1989]. 68 3.2.4. Karar Ağaçlarının İyileştirilmesinde Kullanılan Birleştirme Yöntemleri Son yıllarda uzaktan algılama literatüründe birçok çalışmada birden çok sınıflandırıcının birleştirilmesi ile tek bir sınıflandırıcının elde edilmesi düşüncesi ifade edilmiştir. Sınıflandırıcıların birleştirilmesi, yeniden örneklenen eğitim setleri ile sınıflandırıcıların ayrı ayrı eğitilmesi ve sonuçta ortaya çıkan tahminler ile sınıflandırma işleminin gerçekleştirilmesi işlemlerini içerir. Birleştirme sonucu elde edilen sınıflandırıcı ile yapılan sınıflandırma doğruluğunun genel olarak her bir sınıflandırıcının tekil olarak kullanılmasından daha iyi olduğu ifade edilmektedir [Opitz and Maclin, 1999; Pal and Mather, 2003]. Teorik ve deneysel gözlemlerle yapılan araştırmalar birleştirme yöntemi ile birleştirmede kullanılan sınıflandırma yönteminin doğruluğunda artış olmasının yanında sınıflandırıcının hatalarında da azalma olduğunu göstermektedir [Hansen and Salamon, 1990; Krogh and Vedelsby, 1995; Hashem, 1997; Opitz and Shavlik, 1996]. Bununla birlikte bazı makalelerde birleştirilmiş yapay sinir ağlarının kullanımı ve farklı sınıflandırıcıların birleştirilmesi ile elde edilen sonuçlardan bu yöntemin sınıflandırma doğruluğunu arttırdığı ifade edilmiştir [Giacinto and Roli,1997, Roli et al.,1997]. Sınıflandırma doğruluğu tüm öğrenme uygulamaları için öncelikli olarak önemli olduğundan bu araştırmaların birçoğu sınıflandırma doğruluğunun arttırılması üzerine yoğunlaşmıştır. Hızlandırma ve torbalama yöntemleri birleştirme işleminde kullanılan en popüler yöntemlerdir [Freund and Schapire, 1996; Schapire, 1999; Breiman, 1996]. Her iki yöntemde birleştirme işleminde kullanılacak her bir sınıflandırıcı için farklı eğitim setlerinin oluşturulmasında yeniden örnekleme tekniklerini kullanmaktadır. Bu iki yöntemin kullanımı arasındaki en temel fark hızlandırma yönteminin sürekli olarak tekrarlı bir şekilde birden çok sınıflandırıcı oluşturmasıdır. Birleştirme işleminde kullanılan diğer bir yöntem çoklu sınıflandırma yöntemidir. Çoklu hızlandırma yöntemi Adaboost yöntemi ile torbalama yönteminin birleşimi gibi düşünülebilir [Webb, 2000]. 69 3.2.4.1. Hızlandırma Yöntemi Hızlandırma yönteminin esası bir dizi sınıflandırıcı serisi oluşturulmasına dayanmaktadır [Freund and Schapire, 1996; Schapire, 1990]. Serinin üyesi olan her bir sınıflandırıcı için kullanılan eğitim seti, serideki bir önceki sınıflandırıcı veya sınıflandırıcıların performansına göre belirlenir. Bu yöntemde serideki bir önceki sınıflandırıcı tarafından hatalı tahmin edilen örnekler bir sonraki sınıflandırıcı için oluşturulacak eğitim setinde doğru tahmin edilen örneklere göre daha fazla tekrar edilirler. Bu şekilde hızlandırma yöntemi mevcut birleştirme sonucu elde edilen zayıf performansa göre örnekleri daha iyi tahmin edebilen yeni bir sınıflandırıcı oluşturmaya çalışır. Hızlandırma herhangi bir öğrenme algoritmasının performansını arttıran bir yöntemdir. Bu yöntem herhangi bir zayıf öğrenme algoritmasının hatasının azaltılması için kullanılabilir. Şekil 3.11’de birleştirilmiş bir sınıflandırıcının çalışma prensibi gösterilmiştir. Hızlandırma yöntemi genel olarak her bir gözleme bir ağırlık değeri atanması esasına dayanmaktadır. Bu ağırlık değeri arttıkça daha fazla gözlem sınıflandırıcıdan etkilenir. Her bir denemede ağırlık vektörleri hatalı sınıflandırılmış gözlemlerin ağırlıklarının artması sonucu ile sınıflandırıcı ile ilgili olan performansı yansıtacak şekilde ayarlanır. Sonuç sınıflandırıcı bir oylama ile her bir iterasyon sonucu oluşturulan sınıflandırıcıların birleşimidir. Girdi Sınıflandırıcı–1 Sınıflandırıcı–2 Sınıflandırıcı–3 Birleşmiş Sınıflandırıcı Çıktıları Birleştirilmiş Sonuç Şekil 3.11. Karar ağacı sınıflandırıcısının birleşimi olan sınıflandırıcı. 70 Literatürde hızlandırma algoritması ile ilgili çeşitli yöntemler kullanılmaktadır. Bu algoritmalardan en çok kullanılanı Adaboost algoritmasıdır [Freund and Schapire, 1996]. Bu algoritma birleşmeye esas olan sınıflandırıcıların ağırlıklı örnekleri kullanabileceğini kabul etmektedir. Adaboost algoritması örneklerin seçilmesinde iki yaklaşım kullanır. Bunlardan birincisi örneklerin olasılıklarına dayalı olarak eğitim setinin oluşturulmasıdır. İkincisi ise, basit bir biçimde tüm örnekleri ve ağırlıklarının kullanılmasıdır. Bu yöntemin ana düşüncesi her bir örneğin hatasının o örneğin olasılığı ile belirleneceğidir. Örnek olarak yüksek olasılığa sahip örneklerin hataya daha fazla etki etmesi gösterilebilir. İkinci yaklaşım eğitim setindeki her bir örneğin birleştirilmesi gibi bir avantaja sahiptir. Adaboost yönteminde başlangıçta her bir örneğin olasılıkları 1 N olarak ayarlanır. Daha sonra eğitilen her bir sınıflandırıcının ardından yöntem bu olasılıkları tekrar hesaplar. Adaboost yönteminde ε k ’nın son eğitilen sınıflandırıcının ( C K ) kullanımı sonucunda hatalı sınıflandırılan örneklere ait olasılıkların toplamı olduğu düşünülsün. Bir sonraki deneme için kullanılacak bu olasılıklar, C K ’nın hatalı sınıflandırılmış örneklerinin olasılığı ile β K = (1 − ε K ) ε K şeklinde hesaplanan bir katsayı ile çarpımından elde edilir. Bu şekilde tüm olasılıklar yeniden normalleştirilir ve toplamları 1 olur. Adaboost yöntemi, C K ’nın log( β K ) şeklinde ağırlığa sahip olduğu ağırlıklı oylama yöntemi kullanarak C1 ,..., C K şeklinde gösterilen sınıflandırıcıları birleştirir. Bu ağırlıklar Adaboost yönteminin sınıflandırıcıların tahminlerini hesaplamasına imkan sağlar. Tablo 3.2’de hızlandırma algoritmasında kullanılacak eğitim veri setlerini gösteren bir örnek verilmiştir. Tabloda sekiz örnekten oluşan orijinal eğitim seti ve ağırlıklara göre yeniden örneklenen eğitim veri setleri gösterilmiştir. Yeniden örneklemede orijinal veri setindeki 1 ile ifade edilen örneğin bir önceki sınıflandırıcı tarafından hatalı tahmin edildiği göz önüne alınsın. Bu durumda, Adaboost yöntemi bir sonraki sınıflandırıcı için oluşturulacak eğitim setinde bu örneğin birden fazla tekrarlayarak bu örneğin bir sonraki sınıflandırıcı tarafından doğru tahmin edilmesini amaçlamaktadır [Opitz and Maclin, 1999]. 71 Tablo 3.2. Adaboost yönteminde kullanılan eğitim verilerinin oluşturulması. Eğitim Seti (Orijinal) 1, 2, 3, 4, 5, 6, 7, 8 Eğitim seti–1 (yeniden örneklenmiş) 2, 7, 8, 3, 7, 6, 3, 1 Eğitim seti–2 (yeniden örneklenmiş) 1, 4, 5, 4, 1, 5, 6, 4 Eğitim seti–3 (yeniden örneklenmiş) 7, 1, 5, 8, 1, 8, 1, 4 Eğitim seti–4 (yeniden örneklenmiş) 1, 1, 6, 1, 1, 3, 1, 5 Eğitimden sonra, her bir sınıflandırıcının ağırlıklı oyu kullanılarak birleşime ait tahminler yapılır. Her bir sınıflandırıcıya ait ağırlıklar, sınıflandırıcıların eğitiminde kullanılan ağırlıklı örneklerden elde edilen doğruluğa göre hesaplanır. Adaboost yöntemi literatürde birçok araştırmacı tarafından kullanılmış ve etkinliği test edilmiş etkili bir birleştirme yöntemidir [Bauer and Kohavi, 1999; Dietterrich, 2000; Quinlan, 1996; Maclin and Opitz, 1997]. Yöntemin popüler bir hızlandırma yöntemi olmasına karşın bir takım olumsuz yönleri vardır. Hızlandırma yöntemi özellikle yetersiz veri olması durumunda iyi bir performans sağlayamamaktadır [Schapire, 1999]. Bununla birlikte hızlandırma algoritması sınıflandırılacak veride gürültü miktarının fazla olması (örneğin eğitim verisinde yanlış sınıf etiketlerinin olması) durumunda da iyi bir performans sergilememektedir [Dietterich, 2000; Melville et al., 2004]. 3.2.4.2. Torbalama Yöntemi Torbalama yöntemi, birleştirme için eğitim setinin rastgele bir şekilde yeniden oluşturulması ile ayrı ayrı her bir sınıflandırıcının eğitimini gerçekleştiren ön yüklemeli bir birleştirme metodudur [Breiman, 1996; Efron and Tibshirani, 1993]. Torbalama yönteminde, hızlandırma yönteminde olduğu gibi eğitim setinin yeniden örneklenmesinde bir önceki sınıflandırıcının performansı dikkate alınmamaktadır. Bu yöntemde her bir sınıflandırıcının kullandığı eğitim seti rastgele örnekleme ile oluşturulur. Orijinal eğitim setinin boyutunun N olduğu düşünülürse yeni 72 oluşturulacak eğitim setinde N boyutlu olacaktır. Buna karşın yeni eğitim seti içerisinde orijinal veri setindeki birçok örnek tekrar edilirken, orijinal veri setindeki bazı örnekler ise hiç bulunmayacaktır. Başka bir ifadeyle, torbalama yönteminde eğitim seti tekrarlı bir şekilde yeniden örneklenirken oluşturulacak eğitim setinde bazı örnekler tekrarlanırken bazıları ise hiç yer alamayacaktır. Rastgele örnekleme yöntemiyle oluşturulan farklı eğitim verileri ile birleştirme işlemindeki bir sınıflandırıcının eğitimi tamamlanır. Farklı değerlendirmeler sonucu birleştirme işlemine katılan tüm sınıflandırıcılar birleştirerek sonuç sınıflandırıcıyı oluşturur [Breiman,1996]. Herhangi bir örneğin sınıflandırılmasında her bir sınıflandırıcı bu örneğin hangi sınıfa ait olduğu ile ilgili bir oy kaydeder. Sonuç olarak örneğe ait öznitelik bilgisi ya da sınıf etiketi en çok oy alan sınıf olarak belirlenir [Pal, 2002]. Tablo 3.3’de torbalama yönteminde kullanılan eğitim setlerinin nasıl oluşturulmasında ilişkin basit bir örnek gösterilmektedir. Tablo 3.3. Torbalama yönteminde kullanılan eğitim verilerinin oluşturulması. Eğitim Seti (Orijinal) 1, 2, 3, 4, 5, 6, 7, 8 Eğitim seti–1 (yeniden örneklenmiş) 2, 7, 8, 3, 7, 6, 3, 1 Eğitim seti–2 (yeniden örneklenmiş) 7, 8, 5, 6, 4, 2, 7, 1 Eğitim seti–3 (yeniden örneklenmiş) 3, 6, 2, 7, 5, 6, 2, 2 Eğitim seti–4 (yeniden örneklenmiş) 4, 5, 1, 4, 6, 4, 3, 8 Tabloda torbala yönteminde kullanılmak üzere oluşturulan 1. eğitim setinde 3 ve 7 örneklerinin iki kez tekrar edildiği, bunun yanında 4 ve 5 örneklerinin ise bu eğitim setinde olmadığı görülmektedir. Sonuçta eğitim seti–1 ile eğitimi tamamlanan bir sınıflandırıcının bir test seti ile genelleştirme kabiliyeti test edildiğinde ortaya çıkan hata miktarı sınıflandırıcının orijinal veri seti ile sınıflandırılması sonucu ortaya çıkan hatadan daha yüksek olacaktır. Bu durum örnekteki diğer üç eğitim seti kullanılarak eğitilecek üç sınıflandırıcı içinde geçerli olacaktır. Buna karşın bu dört sınıflandırıcının birleşimi ile test seti üzerindeki hata miktarı tek bir sınıflandırıcının kullanılması sonucu ortaya çıkan hata miktarından daha az olacaktır. Breiman (1996) eğitim setindeki küçük değişimlerin sonuç tahminlerinde büyük değişiklere yol açtığı değişken öğrenme algoritmaları için bu yönteminin etkili olduğunu ifade etmiştir. 73 Birleşme işlemindeki her bir sınıflandırıcı aynı örnek kümesiyle işlem yapmadığından, her biri birbirinden farklı sonuç üretecektir. Birleşmeyi oluşturan her bir sınıflandırıcının tahminlerinin oylanması ile torbalama algoritması temel sınıflandırıcının varyansı nedeniyle oluşan hatayı azaltmaya çalışır. 3.2.4.3. Çoklu Hızlandırma Yöntemi Çoklu hızlandırma yöntemi sınıflandırıcıların birleştirilmesinde başarılı sonuçlar veren Adaboost tekniğinin genişletilmiş bir halidir. Adaboost ve torbalama yöntemleri farklı etkilere sahip farklı mekanizmalar ile çalışıyormuş gibi görünseler de bu iki yöntemin birleştirilmesinin ile daha yararlı olduğu düşünülebilir. Çalışma mekanizmaları farklı olduğu için, her iki yöntemin ayrı ayrı kullanılmasından ziyade iki yöntemin birleştirilmesi daha iyi sonuçlar üretebilecektir [Webb, 2000]. Adaboost yöntemi eğilim ve varyansı azaltırken, torbalama yöntemi temel olarak varyansı azaltmaktadır. Bunun yanında Bauer and Kohavi (1999), varyansın azaltılmasında torbalama yönteminin Adaboost yöntemine göre daha etkili olduğunu ifade etmişlerdir. Web (2000), bu iki yöntemin birleşmesi ile Adaboost yönteminin eğilim azaltmasına torbalama yönteminin varyans azaltmasının eklenmesi ile devam edebileceğini ifade etmiştir. Özetlenecek olursa çoklu hızlandırma yöntemi, Adaboost yönteminin torbalama yönteminin yüksek varyans azaltmasındaki etkinliğini kullanılması ile yeniden düzenlenmesi olarak ifade edilebilir [Web, 2000]. C4.5 algoritmasının temel sınıflandırma algoritması olarak kullanıldığı sınıflandırıcıların birleştirilmesi işleminde çoklu hızlandırma yöntemi, Adaboost veya torbalama yöntemlerinin ayrı ayrı kullanılması sonucunda ortaya çıkan hata oranına göre daha düşük bir hataya sahiptir. 3.2.4.4. Rastgele Orman Yöntemi Rastgele orman yöntemi girdi verilerinin oluşturduğu bir vektörden bağımsız olarak örneklenen rastgele bir vektör kullanarak her bir sınıflandırıcının oluşturulduğu karar ağacı sınıflandırıcılarının birleşimini içeren bir yöntemdir. Bu birleşimde her bir ağaç modeli girdi vektörünü sınıflandırmak için en popüler sınıfa bir oy verirler [Breiman, 2001]. Rastgele orman sınıflandırıcısı rastgele seçilen 74 örnekleri veya ağacın büyümesi için her bir düğümdeki özelliklerin birleşimini içerir. Torbalama yönteminde eğitim veri seti N sayıdaki örneğin rastgele tekrarlanması ile oluşturulmaktadır [Breiman, 1996]. Öznitelik bilgisi olmayan herhangi bir örnek (piksel), tüm ağaç tahminlerinde en fazla oy alan sınıfa atanması suretiyle sınıflandırılır. Bir karar ağacının oluşturulmasında dallanma kriterlerinin belirlenmesi ve uygun bir ağaç budama yönteminin seçilmesi söz konusudur. Karar ağacı oluşturulması için dallanma kriterlerinin belirlenmesinde kullanılan birçok yöntem vardır. Bunlar arasında en çok kullanılan yöntemler bilgi kazanç oranı kriteri ve Gini indeksidir [Quinlan, 1993; Breiman et al., 1984]. Rastgele orman sınıflandırıcısı karar ağacı oluşumunda dallanma kriterlerinin belirlenmesinde başka bir ifadeyle dallanma için özniteliklerin seçiminde Gini indeksi yöntemini kullanır. Bu yöntemde sınıflara ait öz niteliklerin zayıflılığını ölçülmesi esasına dayanmaktadır [Pal, 2005b]. Rastgele orman yöntemi karar ağaçları için torbalama yöntemi ile rastgele özellik seçiminin birleştirilmesi ile elde edilen bir sınıflandırma algoritması olarak da ifade edilebilir [Breiman, 2001]. Bu yöntemde grubun her bir üyesi torbalama yönteminde olduğu gibi ön yinelemeli kopyalama ile eğitilir. Daha sonra karar ağaçları rastgele seçilen özelliklerden (F) her bir düğümdeki dallanma için seçilen özellik ile ağaç yapısı büyür. Rastgele seçilen özellikler kümesi F, [log 2 (k + 1)] şeklinde ifade edilebilir [Breiman, 2001]. Bu ifadede k tüm özelliklerin sayısının göstermektedir. Bu şekilde oluşturulacak rastgele ağaçta herhangi bir budama algoritması kullanılmaz [Melville and Mooney, 2004]. Birçok sınıflandırma yönteminde kullanıcı tarafından belirlenen bazı parametreler söz konusudur. Rastgele orman sınıflandırıcısı için kullanıcılar tarafından belirlenen bu parametreler ağaç yapısının oluşturulması için her bir düğümde kullanılacak örneklerin sayısı ve oluşturulacak ağaç sayısıdır. Her bir düğümde en iyi dallanma için sadece seçilen özellikler araştırılır. Bu nedenle rastgele orman sınıflandırıcısı kullanıcı tarafından belirlenen ve oluşturulacak ağaç sayısını ifade N ağaçtan oluşacaktır. Yeni bir veri setinin sınıflandırılmasında, veri seti bu N sayıda ağacın her birinden geçirilir. Rastgele orman sınıflandırıcısı bu N sayıda ağaçtan elde edilen N sayıda oy arasından en fazla oya sahip olan sınıfı seçer ve bu şekilde yeni veri setine ait öznitelik değerlerini belirler [Pal, 2005b; Dietterich, 2002]. 75 3.2.4.5. DECORATE Algoritması Decorate algoritmasında, sınıflandırıcıların birleştirilmesi işlemi iteratif olarak gerçekleştirilir. İlk önce sınıflandırıcının öğrenme işlemi tamamlanır ve sonra bu sınıflandırıcı birleştirmeye dahil edilir. Her bir ardışık iterasyonda sınıflandırıcılar bir takım yapay verilerle birleştirilmiş orijinal eğitim verisi ile eğitilirler. Her bir iterasyonda yapay eğitim örnekleri veri dağılımından elde edilir. Yapay olarak elde edilen eğitim örneklerine ait öznitelik bilgileri ya da etiketler birleştirilme tahminlerinden farklı maksimumları bulmak için oluşturulur [Melville and Mooney, 2004]. 3.3. Yapay Sinir Ağları Yapay Sinir Ağları (YSA) geleneksel istatistiksel sınıflandırıcılarla karşılaştırıldığında karmaşık yapıya sahip ve gürültü miktarı fazla olan verilerin tanımlanmasında ve veriler arasındaki doğrusal olmayan ilişkilerin belirlenmesinde teorik olarak daha gelişmiş ve daha güçlü bir sınıflandırma yöntemidir [Kavzoglu, 2001; Tseng et al., 2008]. YSA, eğitim verileri aracılıyla problemi öğrenme ve daha sonra yeni bir verinin tanımlanmasını yapabilme özelliğine sahip olduğundan sezgisel algoritma grubunda yer alır. YSA’nın esas amacı insan beyninin üstün karakteristiklerini simule ederek bilgisayarın tanıma işlemindeki performansını arttırmaktır. İnsan beyninin biyolojik teorisine dayalı olan YSA insan beyninin fonksiyonelliğini ve karar verme işlemini simule eden modellerdir. YSA coğrafya, finans, imalat ve ses tanımlama gibi farklı bir çok alanda kullanılan bir yöntemdir [Hewitson and Crane, 1994; Dicson et al., 1997; Giles et al., 1997; Altun and Curtis, 1998]. Yapay sinir ağlarının önemli avantajları aşağıda maddeler halinde verilmiştir [Kavzoglu, 2001]: • Parametrik olmayan bir yapıdadırlar, • Keyfi karar sınır yeteneklerine sahiptirler, • Farklı veri türlerini ve girdi yapılarını birleştirilmesi kolaydır, • Daha iyi genelleştirme yapabilmektedirler, • Gürültü için toleranslıdırlar. 76 Bu avantajlar arasında beklide en önemli olanı YSA’nın parametrik olmayan yani verinin dağılımı ile ilgili herhangi bir ön bilgiye ihtiyaç duymamalarıdır. YSA eğitim verisinin karakteristik özelliklerini iteratif bir şekilde öğrendiklerinden veriden bağımsız teknikler olarak da ifade edilebilirler. YSA ağlarının geleneksel istatistiksel sınıflandırıcılarla karşılaştırıldığında az sayıda eğitim seti kullanarak daha iyi sonuçlar verebilmektedirler [Blamire, 1994; Foody, 1995; Kavzoglu, 2009]. Yapay sinir ağları geleneksel istatistiksel sınıflandırıcılara göre daha güçlü bir sınıflandırma yöntemi olmasına rağmen bir takım olumsuzluklar vardır. Bunlar; kısmen daha fazla eğitim zamanı gerektirmesi, en etkili ağ yapısının belirlenmesi ve sınıflandırma doğruluğunun parametre değişimlerine karşı duyarlı olması olarak ifade edilebilir [Kavzoglu, 2001]. Bunlar arasında ağ yapısı eğitim zamanını ve sınıflandırma doğruluğunu direkt olarak etkilemektedir [Dixon and Candade, 2008]. Günümüze kadar birçok yapay sinir ağı modeli ve öğrenme algoritması geliştirilmiş ve çeşitli derecelerde başarılar elde edilmiştir. Yapay ağ modellerini iki kritere göre kategorize etmek mümkündür. Bunlardan ilki modelin kontrollü veya kontrolsüz öğrenme stratejilerinden hangisini uyguladığıdır. Kontrolsüz yapay sinir ağı modellerine örnek olarak self-organising map (SOM), Hopfield ağları ve Grossberg ağları gösterilebilir. Perseptron, çok katmanlı perseptron (ÇKP), radyal tabanlı ağlar (RBF) gibi modeller ise kontrollü öğrenme prensibine göre geliştirilmiş YSA modellerindendir [Kavzoglu, 2001]. İkinci kriter ise ağ modeli ile ilgili öğrenme yönteminin yönlülüğü ile ilgilidir. Eğer bilgi akışı girdi katmanından çıktı katmanına doğru ilerliyorsa bu öğrenme yöntemi ileri beslemeli ağ modeli olarak adlandırılır. Bu durumun tersi olan durumda yani bilgi akışının, çıktı katmanından girdi katmanına doğru ilerlediği öğrenme yöntemi geri beslemeli ağ modeli olarak ifade edilir. Literatürde çok katmanlı perseptron (ÇKP) modeli uygulamada en yaygın olarak kullanılan yapay sinir ağı modellerindendir. Çok katmanlı perseptron ağ modelleri eğitim sırasında bilgi akışının girdi katmanından çıkış katmanına doğru ilerlediği ileri beslemeli ağ yapılarındandır. 77 3.3.1. Biyolojik ve Yapay Sinir Ağlarının Çalışma Prensibi Yapay sinir ağları insan beyninin yapısı ve çalışma prensibinden yola çıkılarak geliştirilmiş sistemlerdir. İnsan beyni ve çalışma şekli karmaşık yapıya sahip olduğundan tam olarak açıklanması zor bir konudur. Ancak genel yapısı ve temel çalışma prensibinin açıklanması YSA’nın anlaşılması açısından önemlidir. İnsan beyni, sinir sisteminin merkezini oluşturan en temel elemandır. İnsan beyni sürekli olarak vücudun çeşitli organlarından gelen sinyalleri alır, bu sinyalleri işler ve işlem sonucunda alınan kararları vücudun ilgili noktalarına gönderir. Beyin, sinir sisteminin merkezidir ve beynin temel yapı taşları sinir hücreleri yani biyolojik nöronlardır. Beyin, işlevini birbirleri arasında yoğun bağlantılar bulunan nöronlar yerine getirir. Bir biyolojik nöron, temel olarak, diğer kaynaklardan girdiler alır, belirli bir şekilde bunları birleştirir, sonuç üzerinde bir işlem (genelde doğrusal olmayan) uygular ve nihai sonucu üretir. Şekil 3.12’de biyolojik nöronun genel yapısı ve bu yapıyı oluşturan dört temel bileşen gösterilmiştir. Bu bileşenler dendrit, çekirdek, akson ve sinaps olarak adlandırılmaktadırlar. Dendritler, çekirdeğin saça benzeyen uzantılarıdır ve girdi kanalları olarak işlev görürler. Sinapslar, nöronlar arası etkileşimi sağlarlar. Bu girdi kanalları diğer nöronların sinapsları aracılığıyla girdilerini alırlar. Daha sonra çekirdek, gelen bu sinyalleri zaman içinde işler. Çekirdek, bu işlenmiş değeri bir çıktıya dönüştürdükten sonra bu çıktıyı akson ve sinapslar aracılığıyla diğer nöronlara gönderir. Dendrit Akson Çekirdek Sinapslar Şekil 3.12. Biyolojik nöronun genel yapısı ve bileşenleri. 78 Yapay sinir ağları, insan beyninin yapısı göz önüne alınarak geliştirilen basitleştirilmiş sistemler olduğundan, bu sistemlerin temel elemanları da nöronlardır. Bu yapay nöronlar, aralarındaki bağlantılar oluşturularak ve tabakalar halinde gruplandırılarak yapay sinir ağlarını oluşturulmaktadır. Yapay sinir ağlarının temel işlem elemanı olan yapay nöronlar, biyolojik nöronların dört temel bileşenine benzer yapıda dört fonksiyona sahiptir. Şekil 3.13’te yapay nöronun genel yapısı ve bu yapıda işlevselliği olan dört temel fonksiyon görülmektedir. Bunlardan ilki şekilde xi , i = 0,1,…,n şeklinde ifade edilen gelen sinyaller ya da girdi değerleridir. Bu girdi değerlerin her biri wi ile gösterilen bir bağlantı ağırlığıyla çarpılmaktadır. En basit yapay sinir ağı yapısında, bu çarpımlar toplanır ve belirlenen bir aktivasyon (uygulama) fonksiyonuna gönderilerek sonuç üretilir. Elde edilen sonuç çıktı katmanına gönderilir. Bu yapay nöron yapısında değişik toplama ve aktivasyon fonksiyonları kullanılarak farklı ağ yapıları oluşturulabilir. x0 w0 x1 w1 x2 w2 Toplam fonksiyonu Σ ϕ Çıktılar Aktivasyon fonksiyonu xn Girdiler wn Ağırlıklar Şekil 3.13. Yapay nöronun genel yapısı ve bileşenleri. Aktivasyon fonksiyonu, yapay sinir ağlarına doğrusal olamayan bir yapı kazandırma amacıyla kullanılan matematiksel bir fonksiyondur. Bu fonksiyonun kullanımıyla YSA doğrusal olmayan verilerin bulunduğu problemlerin çözümünde kullanılan güçlü bir yapıya kavuşmaktadır. Kullanılacak aktivasyon fonksiyonu doğrusal olduğunda, YSA’nın işlemsel yapısı da doğrusal bir özellik gösterecektir [Kavzoglu, 2001]. Yapay sinir ağı yapılarından çok katmanlı perseptron yapılarında genellikle logaritmik sigmoidal veya tanjant hiperbolik aktivasyon fonksiyonları ve radyal tabanlı fonksiyon yapıları ise aktivasyon fonksiyonu olarak Gauss 79 fonksiyonlarını kullanılmaktadır. Bu nedenle kullanılacak aktivasyon fonksiyonu seçilecek YSA yapısına dolayısıyla çözülecek probleme göre belirlenmelidir. 3.3.2. Yapay Sinir Ağlarının Sınıflandırılması Yapay sinir ağları, yapay nöronlar ve bu elemanlar arasındaki bağlantılardan meydana gelen bir yapıdır. YSA’nın genel çalışma prensibi birbirine benzer olmasına rağmen yapay nöronlar ve bu nöronlar arasındaki bağlantılar YSA’nın özelliğini belirler. Başka bir ifadeyle, yapay sinir ağı yapısının oluşturulmasında nöronların dizilimi ve nöronlar arasındaki bağlantılara ait ağırlıkların belirlenmesi ağın karakteristiği açısından önemlidir. Bu durum göz önüne alındığında, yapay sinir ağlarını yapılarına ve öğrenme algoritmalarına göre iki ana başlık altında sınıflandırılmak mümkündür. 3.3.2.1. Yapılarına Göre Yapay Sinir Ağları Yapay sinir ağları, içerdiği yapay nöronların birbirine bağlanış şekillerine göre diğer bir ifadeyle yapılarına göre, ileri beslemeli ve geri beslemeli ağlar olmak üzere iki sınıfa ayrılmaktadır. 3.3.2.1.1. İleri Beslemeli Yapay Sinir Ağları İleri beslemeli bir ağda yapay nöronlar genellikle katmanlara ayrılmıştır. Veriler, giriş katmanından çıkış katmanına doğru tek yönlü bağlantılarla iletilir. Genellikle parametrelere bağlı olarak tanımlanan giriş verileri, çıkış katmanına doğru tek yönlü bir şekilde iletilir ve dağıtılır. Aynı katmanda bulunan yapay nöronlar arasında bağlantı tanımlanmazken bir katmanın tüm yapay nöronları bir üst katmanın yapay nöronları ile bağlantılıdır. Diğer bir ifadeyle, nöronlar bir katmandan diğer bir katmana bağlanırken, aynı katman içerisinde bağlantıları bulunmamaktadır. Bu tip ağlarda herhangi bir andaki çıkış o andaki giriş vektörünün bir fonksiyonu olarak ifade edilir. İleri beslemeli ağlara örnek olarak çok katmanlı perseptron ve LVQ (Learning Vector Quantization) ağları verilebilir. 80 3.3.2.1.2. Geri Beslemeli Yapay Sinir Ağları Geri beslemeli yapay sinir ağlarında ileri beslemeli olanların aksine bir nöronun çıktısı kendinden önceki katmana veya kendi katmanında bulunan herhangi bir nörona girdi olarak bağlanabilir. Geri beslemeli yapay sinir ağları çıkış katmanı dahil herhangi bir katmanın veya tüm katmanların girişleri bir önceki katmana geri iletilir. Böylece, girişler hem ileri yönde, hem de geri yönde aktarılmış olur. Bu tip sinir ağlarında herhangi bir andaki çıkış, o andaki girişlerin bir fonksiyonu olduğu kadar önceki giriş ve çıkış değerlerini de yansıtmaktadır. Bu yapısı ile geri beslemeli yapay sinir ağları doğrusal olmayan bir yapıdadır. Veri akışının çift yönlü olmasından dolayı bu tip ağlarda ağırlıklar dinamik bir hafıza yapısı tanımlarlar. Geri besleme özelliğini kazandıran bağlantıların bağlanış şekline göre geri aynı yapay sinir ağıyla farklı davranışta ve yapıda geri beslemeli yapay sinir ağları elde edilebilir. Bu yapılardaki yapay sinir ağlarında herhangi bir andaki çıkış o ana kadar işlenmiş tüm verilerin bir sonucudur. Hopfield, Elman ve Jordan yapıları bu tür yapay sinir ağları yapılarına örnektir. 3.3.2.2. Öğrenme Algoritmalarına Göre Yapay Sinir Ağları Yapay sinir ağlarının verilen girdilere göre çıktı üretebilmesinin yolu ağın öğrenebilmesidir. Öğrenme algoritmalarına göre yapay sinir ağları kontrollü, kontrolsüz ve takviyeli öğrenme olarak üçe ayrılmaktadır. 3.3.2.2.1. Kontrollü Öğrenme Kontrollü öğrenmede ağa öznitelik bilgileri ve bu öznitelik bilgilerine ait sınıf etiketlerini içeren eğitim verisi giriş verisi olarak tanımlanır. Ağ, verilen girdiler için istenen çıkışları oluşturabilmek için kendi ağırlıklarını günceller. Diğer bir ifadeyle, kontrollü öğrenme algoritması yapay nöronlar arasındaki bağlantı ağırlıklarını, eğitim verisindeki gerçek sınıf etiketleri ile ağın çıkış katmanında elde edilen sınıf etiketleri arasındaki farka göre güncellemektedir. Ağın çıktıları ile beklenen çıktılar arasındaki hata hesaplanarak ağın yeni ağırlıkları bu hata payına göre düzenlenir. Hata payı hesaplanırken ağın bütün çıktıları ile beklenen çıktıları arasındaki fark 81 hesaplanır ve bu farka göre her nörona düşen hata payı bulunur. Daha sonra her nöron kendine gelen ağırlıkları günceller. Bu algoritmaya örnek olarak Delta kuralı ve LVQ algoritması gösterilebilir. 3.3.2.2.2. Kontrolsüz Öğrenme Kontrolsüz öğrenme algoritmasında, ağın eğitimi sırasında girdi verisi olarak sınıf etiketleri belli olmayan öznitelik verileri kullanılmaktadır. Ağın giriş katmanında tanımlanan bu verilere göre ağ her bir örneği kendi arasında sınıflandıracak şekilde kendi kurallarını oluşturur. Ağ bağlantı ağırlıklarını aynı özellikte olan dokuları ayırabilecek şekilde düzenleyerek öğrenme işlemini tamamlar. Girişe verilen örnekten elde edilen çıkış bilgisine göre ağ, sınıflandırma kurallarını kendi kendine geliştirmektedir. Kontrolsüz öğrenme algoritmasını kullanan yapay sinir ağlarına örnek olarak ART ve SOM gösterilebilir. 3.3.2.2.3. Takviyeli Öğrenme Kontrolsüz öğrenme algoritmasında olduğu gibi bu algoritmada da giriş verilerine ait sınıf etiketleri kullanılmamaktadır. Takviyeli öğrenme algoritmasında ağın her iterasyonu sonucunda elde ettiği sonucun iyi veya kötü olup olmadığına dair bir bilgi verilir. Ağ bu bilgilere göre kendini yeniden düzenler. Bu sayede ağ herhangi bir girdi dizisiyle hem öğrenerek hem de sonuç çıkararak işlemeye devam eder. Bu algoritmada yapay sinir ağlarına çıkış verileri verilmezken, elde edilen çıkışın verilen girişe karşılık uygunluğunu değerlendiren bir ölçüt kullanılmaktadır. Takviyeli öğrenme algoritmalarına örnek olarak genetik algoritma gösterilebilir. 3.3.3. Çok Katmanlı Perceptron Günümüzde en çok bilinen ve yaygın biçimde kullanılan ileri beslemeli ağ yapısı algoritmalarından çok katmanlı perseptron (ÇKP) modelidir. Çok katmanlı perseptron modelleri esnek ve çoklu tabakalar halinde organize edilmiş işlemci elemanlardan (nöron) oluşan doğrusal olamayan bir yapıya sahiptirler. ÇKP 82 modelinin yaygın olarak kullanılmasının en önemli nedeni sinir ağının üstünlüğü, işlemci elemanlarda kullanılan doğrusal olmama özelliğidir. Çok katmanlı perceptron ağ yapısının esas aldığı ileri beslemeli ağ algoritması üç farklı katmandan meydana gelir. Çok katmanlı perceptronun genel yapısını gösteren Şekil 3.14’den de görüleceği üzere bu katmanlar, girdi katmanı, bir veya birden fazla saklı katman ve çıktı katmanıdır. Girdi verilerini temsil eden girdi tabakası her bir sınıfa ait değerlerin ağdaki dağılımını tanımlar. Saklı katmanlar hesaplamalar için kullanılırlar ve her bir düğüme ilişkin değerler girdi düğümü ile bu düğüme gelen bağlantılara ait ağırlıklarının çarpımının toplamından elde edilir. Çıktı katmanı tanımlanacak sınıfları göstermek için bir grup koda sahip son işlem katmanıdır. Tüm ara düğüm bağlantıları ağırlıklarla birleştirilir. Bir değer ara bağlantılarından geçerken ara düğüm bağlantılarıyla birleştirilen ağırlıklarla çarpılır [Kavzoglu and Reis, 2008]. Saklı Katmanlar Girdi Katmanı Çıktı Katmanı Arazi Örtüsü Şekil 3.14. Dört tabakalı ileri beslemeli basit bir çok katmanlı perseptron ağı. 3.3.3.1. Öğrenme Algoritmaları Öğrenme algoritması yapay sinir ağları uygulamalarının temelini oluşturmaktadır. Nöron ağlarının oluşturulması ve ağırlıkların belirlenebilmesi açısından öğrenme algoritmalarına ihtiyaç duyulmaktadır. Farklı yapay sinir ağı modelleri için birçok öğrenme stratejisi geliştirilmiştir [Kavzoglu, 2001]. Bunlar arasında ileri beslemeli yapay sinir ağlarının eğitiminde geri yayılım öğrenme algoritması en popüler yöntemlerdendir [Werbos, 1995]. 83 Genelleştirilmiş delta kuralı olarak da bilinen geri yayılım öğrenme algoritması, iteratif gradyan azaltım öğrenme yöntemidir. Geri yayılım öğrenme algoritması hataları çıkıştan girişe geriye doğru azaltmaya hedeflemektedir. Bu işlem iki adımda gerçekleşir. İlk adımda, tüm ağa ait başlangıç ağırlıkları gelişi güzel belirlenir, girdi verisi ağa sunulur ve çıktı değerlerinin belirlenmesi için ileri doğru yayılır. İkinci adımda, bilinen ve tahmin edilen çıktı değerleri arasındaki fark (hata) ağdan geriye doğru beslenir ve ağırlıklar bu farkı (hatayı) azaltacak şekilde değiştirilir. Her iterasyonda tüm bu işlemler yeniden hesaplanan ağırlıklar ile hata en aza olana veya önceden belirlenen bir eşik değerine ulaşılıncaya kadar tekrar edilir. İşlem düğümü ya da yapay nöron, bağlantılara ait ağılıklar ile çarpılan girdi değerlerini toplar ve aktivasyon fonksiyonunu kullanarak çıkış düğümünü tahmin eder. Girdi verilerinin toplamı ve çıktı düğümüne ilişkin eşitlikler: net Pj = ∑ w ji i Pi (3.42) o Pj = f ( net Pj ) (3.43) i şeklindedir. Bu eşitliklerde; net Pj , girdi değerlerinin toplamını; w ji , ağırlık vektörünü; iPi , girdi değerlerinden i . elemanın değerini; o Pj , p örneği için j çıktı düğümünü ve f ( o ) doğrusal olmayan aktivasyon fonksiyonunu göstermektedir. Doğrusal olmayan aktivasyon fonksiyonlardan en çok kullanılanı sigmoid fonksiyondur [Kavzoglu, 2001]. Geriye yayılma algoritması gerçek ve hesaplanan çıktı değerleri arasındaki farkın toplamı olara ifade edilen hatayı minimum hale getirmeyi amaçlar. Bu hata p örneği için: Ep = ( ) 1 2 ∑ t Pj − o Pj 2 j (3.44) 84 eşitliği ile hesaplanır. Bu eşitlikte; t Pj , p örneğinin j . bileşenine ait hesaplanan çıktı değerini; oPj , p girdi örneğinin j . bileşenine ait gerçek çıktı değerini göstermektedir. Bu durumda ağın toplam hatası: E = ∑ EP (3.45) eşitliği ile hesaplanır. Yeni ağırlıklar, bir önceki ağırlıkların Δw ji şeklinde güncellenmesi ile: w1 ji = w ji + Δw ji Δw ji = −η ∂E ∂w ji (3.46) (3.47) şeklinde hesaplanır. Eşitlik 3.47’de η öğrenme oranı olarak ifade edilir ve kullanıcı tarafından belirlenen bir parametredir. Bu parametre her bir iterasyonda hesaplanan hatalarla ilgili ağırlıklardaki değişimin derecesinin kontrolü için kullanılır [Kavzoglu, 2001]. Bir veri setinin karakteristiklerinin belirlenmesi için öğrenme algoritmaları kullanılır. Bu öğrenme algoritmaları ağırlıkların eğitim döngüleri veya evreleri arasında nasıl ayarlanacağını belirler. YSA uygulamalarında, ağ yapısının tasarlanması ve seçilen algoritmaya ait parametrelerin kullanıcı tarafından belirlenmesi en önemli iki adımı oluşturmaktadır. Saklı katmanın boyutu ve düğüm sayısı ile ilgili özellikler eğitim veri setinin özeliklerinin öğrenilmesi ve ağ için yeni olan piksellerin tanımlanmasında ağın kapasitesi açısından önemlidir. Buna ağın genelleştirme kabiliyeti denir. Saklı tabakadaki düğümlerin sayısı yapay ağın gücünü ve karmaşıklığını direkt olarak belirler [Kavzoglu and Mather, 2003]. Ağın eğitim parametrelerinin ayarlanması (öğrenme oranı, momentum, ağırlıklar için başlangıç değerleri, vb.) öğrenme algoritmasının çalışmasını ve eğitilen ağın performansını etkileyen ana unsurdur. Dış ve iç parametreler olarak ele alınabilecek bu parametrelerden; dış parametreler, giriş verisinin karakteristikleri ve çalışma 85 ölçeğini, iç parametreler ise, uygun ağ yapısının seçimi, ağ parametrelerinin başlangıç değerlerinin belirlenmesi, iterasyon sayısı, aktivasyon fonksiyon tipi ve öğrenme oranının belirlenmesi gibi sınırlamaları içermektedir [Özkan, 2001]. İleri beslemeli bir yapay ağın geri yayılma algoritmasıyla eğitimi ağ yapısı, öğrenme oranı, momentum katsayısı ve aktivasyon fonksiyonu gibi birkaç parametrenin başlangıçta belirlenmesini gerektirmektedir. Öğrenme oranı yapay sinir ağlarının başarısı açısından önemli bir etkiye sahiptir. Bu parametre bağlantıların ağırlık değerlerindeki değişimin miktarını ifade eder. Eğer öğrenme oranı çok yüksek seçilirse global minimuma ulaşılamaz ve hatada bir artış gözlenir. Bununla beraber öğrenme oranı çok küçük seçilirse minimum hatanın aranması için gereken süre artacağından ağın eğitim süreci artacaktır. Momentum katsayısı, bir önceki iterasyonda hesaplanan ağırlık değişimlerinin oranı olarak yeni oluşturulan ağırlıklara eklenir. Bu katsayı öğrenme işleminin hızını arttırmak için kullanılır. 3.3.4. Yapay Sinir Ağları ile Görüntü Sınıflandırma Yapay sinir ağları, herhangi bir istatistiksel kabul gerektirmediğinden parametrik olmayan kontrollü bir sınıflandırma algoritmasıdır. Kontrollü öğrenme işleminde, öğrenmeyi temsil eden bağlantı ağırlık değerleri, iteratif bir şekilde ağın ürettiği çıkışların hedef çıkışlarla karşılaştırılmalarıyla elde edilen belirli bir hata değerinin minimize edilmesiyle güncellenirken, kontrolsüz öğrenme işleminde, ağırlık değerlerinin güncelleştirilmesi (öğrenme, eğitim) giriş örneğine en büyük benzerlik değerini üreten işlemci elemanın aktifleşmesiyle gerçekleştirilmektedir [Özkan, 2001]. Yapay sinir ağları ile eğitim öncesinde gerçekleştirilmesi gereken bir takım işlem adımları mevcuttur. Bunlar; ön işlemler, ağ giriş ve çıkışının kodlanması, sınıfların çıkarılması, ağ topolojisinin oluşturulması ve ağın eğitilmesi ve genelleştirme kabiliyetinin test edilmesi olarak ifade edilebilir. Ön işlemlerde amaç, YSA sınıflandırma performansını arttırmak için özellik çıkartımıdır. Bu amaçla ana-bileşen dönüşümüyle boyutluluk azaltılabilir veya piksel verileriyle birlikte veya sadece doku, moment gibi uzaysal bilgiler kullanılabilir. Bununla beraber, öncül işlemeyle elde edilen bilgilerle ağın hız ve performans kapasitesi artabilmesine rağmen işlenmemiş orijinal verinin kullanılması ağı daha uygulanabilir yapmaktadır. Örneğin bir grup piksel üzerinden hesaplanan tek bir 86 doku bilgisi kullanılabileceği gibi, bunun yerine bu bilginin çıkarıldığı orijinal piksel grubunun işlenmesi daha esneklik kazandıracaktır. Birçok istatistiksel sınıflandırma algoritmasında olduğu gibi en temel ve basit veri giriş kodlaması şekli, piksel örneklerinin tek tek kullanılmasıdır. İlgili örnek için özellik (spektral kanal) sayısı kadar giriş katmanı işlemci elemanın kullanılması en yaygın kullanılan veri giriş tekniğidir. Yapay sinir ağlarının eğitimi için kullanılacak verilerin ölçeklenmesi önemli bir husustur [Sarle, 2008]. Çok katmalı persptron yapılarında matematiksel bir zorunluluk olmamasına rağmen özellikle sigmoid veya tanjant hiperbolik (TANH) aktivasyon fonksiyonu kullanılarak verinin [0 1] veya [-1 1] aralığına çekilmesi işlemsel etkinliği arttırabilmektedir. Yapay sinir ağları ile yapılan sınıflandırmada, her bir öznitelik verisi (uzaktan algılamada her bir bant) [ 0 ,1 ] veya [ −1,+1 ] aralığında ölçeklenmektedir. Ölçekleme ile çok geniş sayısal aralıktaki veri daha dar bir sayısal aralıkta ifade edilebilmektedir. Bu şekilde eğitim sırasındaki işlemler kolay ve hızlı gerçekleştirilebilecektir. Sigmoid ve TANH fonksiyonlarının sıkıştırma etkisi olduğu için giriş verisinin bu şekilde ölçeklenmesi, ağ performansını ve yakınsama hızını olumlu yönde etkileyebilmektedir [Kavzoglu, 2001]. Ağ çıkışının kodlanmasında en doğal kodlanma şekli her bir sınıf için bir işlemci eleman kullanımıdır. Her bir sınıf için ayrı bir işlemci eleman kullanılmasıyla pikseller en yüksek çıkış değerini aldığı işlemci elemanın temsil ettiği sınıfa atanır. Yüksek değer, ilgili pikselin o sınıfa yüksek bir doğrulukla ait olduğunu ifade eder. Genellikle istenen çıkış değerlerine, örneğin ait olduğu sınıfı temsil eden işlemci eleman için yüksek, diğerleri için düşük değerler atanır [Kansu, 2006]. YSA yapılarında giriş ve çıkış katmanlarındaki işlemci eleman sayıları, veri boyutu ve istenen sınıf sayısı gibi dış etkenlere göre belirlenirken, saklı katmanlardaki elemanlar deneme yanılma yoluyla belirlenmektedir. Yapay sinir ağlarının teorik kapasitesi teorik olarak ara katman işlemci eleman sayısına bağlıdır [Kavzoglu and Mather, 2003]. MLP ağlarının eğitilmesi için kullanılan geri yayılım algoritmasında eğitim, ya örneklerin ağa bireysel girişlerinden elde edilen hataya göre ya da örneklerin ağa bütünüyle girildiklerinde elde edilen toplam hataya dayanarak gerçekleştirilmektedir. 87 Genel olarak YSA eğitimi, aşağıdaki aşamaları içermektedir: 1. Eğitim ve buna karşılık gelen çıkış verilerinin belirlenmesi. 2. Ağ topolojisinin belirlenmesi (giriş, ara ve çıkış katman sayıları). 3. Ağırlık başlangıç değerlerinin atanması. Bu değerler rastgele atanır. Aksi takdirde, ağın dağıtılmış bilgisini içeren farklı ağırlık değerlerine ulaşmak mümkün olamamaktadır. 4. Öğrenme ve momentum oranı gibi gereken ağ parametrelerinin belirlenmesi. Bu parametrelerin optimum değerlerinin deneme-yanılma yoluyla belirlenmesinin yanında adaptif yöntemlerde kullanılabilir. 5. Çıktı kodlamasının belirlenmesi. 3.4. Örnek Tabanlı Öğrenme ve K-Star Sınıflandırıcısı Örnek tabanlı öğrenme (ÖTÖ) algoritmaları literatürde en yaygın kullanımı olan öğrenme algoritmalarından birisidir [Okamoto and Yugami, 2003]. Örnek tabanlı öğreniciler test veri setindeki öznitelik bilgisi bilinmeyen bir örneğin sınıflandırılması işlemini veri tabanında saklanan ve önceden sınıflandırılmış eğitim veri setindeki örnekler ile karşılaştırarak gerçekleştirirler [Aha et al., 1991; Aha, 1992; Wilson and Martinez, 2000]. Bu karşılaştırma işleminde temel kabul benzer örneklerin benzer sınıflandırmalara sahip olacağıdır [Piramuthu and Sikora, 2009]. Burada esas olan benzer örnekler ve benzer sınıflandırmanın nasıl belirleneceğidir. Örnek tabanlı öğrenicinin karşılıklı bileşenleri, iki örneğin ne kadar benzer olduğunu belirleyen uzaklık fonksiyonu ve örnekler arasındaki benzerliklerden yeni bir örnek için sonuç sınıflandırıcının nasıl oluşturulacağını belirleyen sınıflandırma fonksiyonudur. Bu iki bileşene ek olarak ÖTÖ algoritmaları yeni örneklerin örnek veri tabanına eklenip eklenmeyeceğini ve veri tabanındaki hangi örneklerin sınıflandırmada kullanılacağını belirler. Basit bir ÖTÖ algoritmasında bir örnek sınıflandırıldıktan sonra her zaman örnek veri tabanında doğru sınıflandırılan örnekler arasına taşınır. Daha karmaşık algoritmalarda örnek veri tabanına eklenen örnekler, bellek gereksinimini azaltmak ve kirli (gürültülü) veri için toleransı arttırmak amacıyla filtrelenebilir. Örnek tabanlı öğreniciler iki örnek arasındaki benzerliğin belirlenmesinde bazı uzaklık veya benzerlik fonksiyonlarından 88 yararlanırlar. Bu uzaklık fonksiyonu hangi örneğin girdi vektörüne en yakın olduğuna karar verilmesinde kullanılmaktadır [Wilson and Martinez, 2000]. Örnek tabanlı öğrenmede yeni bir örnek ile çevresindeki örnekler arasındaki uzaklık ölçülür [Aha et al., 1991]. Literatürde bir çok uzaklık fonksiyonu geliştirilmiştir. Bu fonksiyonlara örnek olar Öklit, Mahalonobis, Quadratic ve Ki-Kare gibi uzaklık fonksiyonları gösterilebilir [Nadler and Smith, 1993; Michhalski et al., 1981; Diday, 1974]. Örnek tabanlı öğreniciler küçük bir ön işlemle eğitim verisini kaydettikten sonra test veri seti sisteme giriş yapıncaya dek beklerler. Bu nedenle bu algoritmalar eğitim işlemi için daha az zamana gereksinim duyarken test veri seti kullanarak öznitelik değerlerinin tahmin edilmesi işlemi için daha fazla zamana gereksinim duymaktadırlar [Aha, 1997; Hullermeier, 2003; Piramuthu and Sikora, 2009]. Literatürde en yakın komşuluk, IB1, IB2, IB3, IB4 ve IB5 algoritmaları gibi birçok ÖTÖ algoritmaları geliştirilmiş ve çeşitli uygulamalarda kullanılmıştır [Cover and Hart, 1967; Dasarathy, 1991; Aha et al., 1991; Aha, 1992]. En yakın komşuluk algoritmaları en basit örnek tabanlı öğrenme algoritmalarıdır [Cover and Hart, 1967]. Bu algoritmalar eğitim verisinden en çok bezeyen tek bir örneği bulmak için bir takım alan özellikli uzaklık fonksiyonları kullanırlar. Bulunan örnek yeni bir örneğin sınıflandırılması için kullanılır. En yakın komşuluk algoritması veri tabanında saklanacak ve sınıflandırmada kullanılacak örnekleri seçimsel yapacak şekilde düzenlenmiştir [Hart, 1968; Gates, 1972]. K en yakın komşuluk algoritmaları bu anlamda biraz daha karmaşık bir yapıya sahiptir. Bu algoritmalarda, yeni bir örneğin k- en yakın komşulukları ve bu örneğin sınıflandırılması için verilen sınıflar arasında hangi sınıfın daha baskın olduğu belirlenir. K en yakın komşuluk algoritması k=1 olduğunda standart en yakın komşuluk algoritmasında ile aynıdır. Aha et al. (1991) çok yönlülüğü artıran üç örnek tabanlı algoritma tanımlamışlardır. IB1 algoritması özel bir uzaklık fonksiyonuna sahip en yakın komşuluk algoritmasının bir uygulamasıdır. Bu algoritmada, gerçek değerli öznitelikler ortak bir ölçekte normalleştirilir ve böylece tüm öznitelikler eşit ağırlığa sahip olurlar. Bununla beraber kayıp değerlerin gerçek değerden maksimum olarak farklı olduğu kabulü söz konusudur. IB2 algoritması sadece yanlış sınıflandırılmış örneklerin kaydedildiği ve bellek gereksinimini azaltmak için IB1 algoritmasına çeşitli eklemelerin yapılmasıyla geliştirilen bir algoritmadır. IB3 ise gürültülü veriler için toleransı arttıran eklentiler içerir. Bu yöntemde yeterince kötü sınıflandırma geçmişi olan örnekler göz ardı 89 edilirken, iyi bir sınıflandırma geçmişine sahip olan örnekler sınıflandırmada kullanılırlar. Cleary and Trig (1995) iki örnek arasındaki uzaklığın belirlenmesinde kullanılacak uzaklık fonksiyonu olarak bilgi teorisine dayanan entropik uzaklık ölçüsünü kullanmışlardır. Bilgi teorisinde, entropi rastgele değişkenler ile ilgili belirsizliğin ölçüsü olarak tanımlanmıştır [Sahnnon, 1948]. İki özellik arasındaki uzaklığın hesaplanmasında kullanılan bu yöntem bilgi teorisinden yola çıkılarak ortaya atılmıştır. Örnekler arasındaki uzaklığa ilişkin bu öngörü bir örneğin başka bir örneğe dönüşümündeki karmaşıklık olarak tanımlanır. Bu karmaşıklığın hesaplanması iki adımda gerçekleştirilir. İlk olarak, özellikten özelliğe dönüşüm olarak tanımlanan sonlu sayıda dönüşümler kümesi belirlenir. Bir özelliğin (a) diğer bir özelliğe (b) dönüşümü, (a) dan başlayıp (b) de sonlanan sınırlı dönüşümler dizisi olarak tanımlanabilir [Cleary and Trig, 1995]. I’nın sınırlı sayıda örnekler kümesi ve T’nin I üzerinde sınırlı sayıdaki dönüşümler kümesi olduğu göz önüne alınsın. Her bir t ∈ T , t : I → I şeklinde örnekten örneğe dönüşüm yaptığı ve T σ gibi ayırt edilebilir bir üye içerdiği düşünülsün. Bu σ ile gösterilen eleman σ (a) = a şeklinde ifade edilir ve örneklerin kendilerine dönüşümündeki bütünlüğü göstermektedir. P’nin σ tarafından sonlandırılan T* nin tüm örnek kodlarını içeren altküme olduğu düşünüldüğünde, T* − nin elemanları I ile ilgili dönüşümü belirler. Bu t = t1 ,..., t n olmak üzere; − t (a) = t n (t n −1 (...t1 (a)...)) (3.48) şeklinde ifade edilir. p olasılık fonksiyonu T* dan belirlenir. Bu olasılık fonksiyonu aşağıdaki özellikleri sağlamaktadır: − 0≤ p (t u ) − p (t ) ≤1 (3.49) 90 − − ∑ p (t u ) = p ( t ) (3.50) p(Λ) = 1 (3.51) u Sonuç olarak p olasılık fonksiyonu Eşitlik 3.52’yi sağlamaktadır. − ∑ p(t ) (3.52) _ t ∈P Olasılık fonksiyonu P* , a örneğinden b örneğine kadar tüm yolların olasılıkları olarak belirlenir (Eşitlik 3.53). − P * (b a ) = − ∑ p (t ) (3.53) − t ∈P:t ( a ) =b Bunlarla beraber P* fonksiyonun aşağıdaki özellikleri sağlamaktadır. ∑ P (b a ) = 1 (3.54) 0 ≤ P * (b a ) ≤ 1 (3.55) * b Bu durumda K* fonksiyonu; K * (b a ) = − log 2 P * (b a ) (3.56) şeklinde belirlenir. K* fonksiyonu tam anlamıyla bir uzaklık fonksiyonu değildir. Örneğin, K * (a a ) genelde sıfırdan farklıdır ve fonksiyon simetrik değildir [Cleary and Trig, 1995]. 91 K* algoritması sayısal veya sembolik öznitelik değerine sahip veri setlerinin sınıflandırılmasında kullanılabilmektedir. Sayısal değere sahip öznitelik değerlerinin sınıflandırılmasında yoğunluk fonksiyonu, P (x ) = * 1 2 x0 −x e x0 (3.57) dx şeklinde hesaplanır. Bu eşitlikte kullanıcı tarafından belirlenen x0 parametresi; x ’in tüm P* dağılımları için beklenen ortalama değerini ifade eden bir ölçek uzunluğudur. Sembolik özniteliklerin olması durumunda 1 ≤ i ≤ n olmak üzere pi olasılığında n örneğe sahip bir veri seti olduğu düşünülür. Bir sembolün olasılığı; s olasılığı ve j sembolüne ait t dönüşümlerinin olasılığı ( 1 − s ) p j olduğunda aynı kalır. Özetle tüm olası dönüşlümler, ⎧ (1 − s ) p j ⎫ P* ( j i ) = ⎨ ⎬ ⎩s + (1 − s ) pi ⎭ if i ≠ j if i = j (3.58) şeklinde ifade edilir. Bu eşitliklerde s olasılığı göstermektedir ve kullanılacak veri setine göre kullanıcı tarafından belirlenmesi gerekir [Cleary and Trig, 1995]. Uzaklık ölçüsü olarak Entropi’yi kullanan örnek tabanlı bir sınıflandırıcının uygulanabilmesi için gerekli olan x0 ve s parametre değerlerinin seçiminde uygun bir yöntem kullanılmalıdır. Her bir boyut için x0 (sayısal değerli örneklerde) ve s (sembolik özniteliklerde) parametre değerlerinin belirlenmesi gerekir. Sembolik öznitelikler için olasılık fonksiyonu olan s parametresindeki değişimler göz önüne alınsın. s değeri 1’e yakın bir değerde olduğunda aynı sembol özniteliğine sahip örnekler yüksek dönüşüm olasılığına sahip olurken, söz konusu özniteliklerle farklı 92 bir sembol özniteliğine sahip olan örnek düşük dönüşüm olasılığına sahip olacaktır. s değeri 0 olduğunda, dönüşüm olasılığı direkt olarak sembollerin olasılık dağılımını gösterecektir. Gerçek değerli öznitelikler için uzaklık ölçümü aynı özellikleri sergiler. x0 değeri küçük olduğunda örneklerin olasılığı çok çabuk düşer. Diğer taraftan x0 değeri çok büyük olduğunda tüm örnekler aynı dönüşüme ve dolayısıyla eşit ağırlığa sahip olacaklardır. Her iki durumda da olasılık dağılımına dahil olan örnek sayısı, en yakın komşuluk dağılımı olan 1 değeri ile tüm örneklerin eşit ağırlığa sahip olduğu N değeri aralığında değişir. Herhangi bir P* fonksiyonu için etkili örnek sayısı, 2 ⎛ ⎞ ⎜ ∑ P * (b a ) ⎟ b ⎠ ≤N n0 ≤ ⎝ * 2 ∑ P (b a) (3.59) b şeklinde ifade edilebilir. Burada N eğitim örneklerinin tümünün sayısını, n0 ise eğitim örneklerinden a örneğine en kısa mesafedeki örneklerin sayısını gösterir. K* algoritması x0 ve s parametreleri için a değerini n0 ve N arasındaki bir değer seçilmesiyle belirler. Böylece seçilen n0 en yakın komşuluk algoritmasını ve seçilen N eşit ağırlıklı örneklerin sayısını verir. Belirlenen bu sayıların uygunluğu harmanlama parametresi (b) kullanılarak belirlenir. Harmanlama parametresi b = %0 (n0 için) ve b = %100 (N için) arasında değişmektedir. Ancak her bir öznitelik için eşit ağılık sağlayan harmanlama parametresi kullanılmasıyla x0 veya s parametreleri her bir boyut için bağımsız olarak belirlenir. 93 4. UYGULAMA 4.1. Çalışma Alanı Gebze, Marmara bölgesinde Kocaeli ilinin kuzeybatısında, İstanbul il sınırında yer alan Kocaeli iline bağlı bir ilçedir. Türkiye sanayisinin %15'ini, Kocaeli'nin endüstrisinin büyük bölümün barındıran Gebze, Marmara bölgesinin en büyük ikinci ilçesidir. Yaklaşık olarak yüz ölçümü 610 km² olan ilçe, coğrafi konumu itibariyle 40o 45’ 08’’ ile 41o 02’ 38’’ kuzey enlemleriyle 29o 19’ 56’’ ile 29o 45’ 14’’ doğu boylamları arasında yer almaktadır (Şekil 4.1). Doğusunda İzmit, batısında İstanbul, kuzeyinde Şile, güneyinde (İzmit Körfezi) ile sınırlanan Gebze, yayla görünümünde bir düzlüğün üzerinde kurulmuştur [URL–3]. Gebze ilçesinin 2008 yılında yapılan adrese dayalı nüfus kayıt sitemine göre toplam nüfusu 546.933’tür [URL–4]. Şekil 4.1. Çalışma Alanı Haritası. Gebze ilçesinin ekonomik yapısını bünyesinde barındırdığı büyük ve küçük ölçekteki birçok sanayi kuruluşu oluşturmaktadır. İlçenin İstanbul ilinin sınırında bulunması, çevre yolu ve diğer bağlantı yolları üzerinde olması nedeniyle ulaşım 94 kolaylığı ilçeyi bir sanayi kenti haline getirmiştir. Gebze’de boya, plastik, elektrik, metal, makine ve kimya sanayisinin önde gelen kuruluşları faaliyet göstermektedir. Bunun yanında TÜBİTAK Marmara Araştırma Merkezi (MAM), Gebze Yüksek teknoloji Enstitüsü (GYTE) ve Türk Standartları Enstitüsü (TSE) gibi önemli kurum ve kuruluşlar ilçede yer almaktadırlar. 4.2. Uygulama Konusu ve Amacı Arazi kullanım şekillerinin belirlenmesi, çevresel değişiklerin izlenmesi ve doğal kaynaklara ait envanterlerin çıkarılması gibi geniş ölçekli birçok çalışmada yeryüzüne ait bilgilere ihtiyaç duyulmaktadır. Uzaktan algılama teknolojileri farklı konumsal ve zamansal çözünürlüklerde yeryüzünü görüntüleyebilme kabiliyetine sahip olduğundan bu önemli bilgilerin elde edilmesinde önemli bir kaynak durumundadır. Bu nedenle uydu görüntüleri yardımıyla arazi örtüsünün ve arazi kullanımının sınıflandırılması uzaktan algılama uygulamalarının önemli bir parçası olmuştur. Günümüze kadar uzaktan algılanmış görüntülerin sınıflandırılmasında birçok yöntem geliştirilmiş ve kullanılmıştır. Bu çalışmada, Gebze ilçesindeki arazi örtüsünün sınıflandırılması için çalışma alanını kapsayan 1997 yılında kaydedilmiş Landsat ETM+ ile 2002 yılında kaydedilmiş Terra ASTER uydu görüntüleri kullanılmıştır. Söz konusu uydu görüntülerinin sınıflandırılmasında ileri sınıflandırma algoritmalarından destek vektör makineleri, karar ağaçları, çeşitli birleştirme algoritmaları, yapay sinir ağları ve K-star sınıflandırıcıları kullanılmıştır. Çalışmada, söz konusu algoritmaların sınıflandırma performansları birbirileriyle ve popüler sınıflandırma yöntemlerinden En Çok Benzerlik sınıflandırıcısıyla karşılaştırılarak elde edilen sınıflandırılma sonuçlarının detaylı bir şekilde analiz edilmesi amaçlanmıştır. Uygulanan metotların paremetrelerinin performanslarına olan etkisi de bu çalışmada araştırılmıştır. 4.3. Kullanılan Veri ve Yazılımlar Uygulamada, Gebze ilçesine ait arazi örtüsünün belirlenmesi amacıyla 18.07.1997 tarihinde görüntülenen Landsat ETM+’in termal bant haricindeki 6 bandı 95 ve 28.10.2002 tarihinde görüntülenen Terra ASTER uydu görüntüsünün ilk 9 bandı kullanılmıştır. Uydu görüntülerinin geometrik düzeltmesinde bölgeye ait 1/25.000 ölçekli haritalardan yararlanılmıştır. Ayrıca, uydu görüntülerinin sınıflandırılması amacıyla eğitim alanlarının belirlenmesinde farklı tarihlerde çekilmiş hava fotoğrafları (1996, 1999 ve 2003) ve Gebze orman bölge şefliğine ait meşcere haritalarından yararlanılmıştır. Bunların yanı sıra arazide görsel olarak da alanlara ait konumlar el GPS aletleriyle tespit edilmiştir. Uydu görüntülerinin geometrik olarak düzeltilmesi ve sınıflandırmaya esas olacak kontrol alanlarının belirlenmesinde ERDAS IMAGINE 8.7 yazılımı kullanılmıştır. Söz konusu görüntülerin sınıflandırılmasında YALE Üniversitesi tarafından geliştirilen Rapid-Miner 4.1, MATLAB 6.5, Stuttgart Üniversitesi tarafından geliştirilen Stuttgart Neural Network Simulator (SNNS) programı ve Gebze Yüksek Teknoloji Üniversite’sinde Doç. Dr. Taşkın Kavzoğlu’ nun C++ dilinde yazdığı programlar kullanılmıştır. 4.4. Uygulama Aşamaları 4.4.1. Uydu Görüntülerinin Geometrik Düzeltilmesi ve Yeniden Örneklenmesi Landsat ETM+ ve Terra ASTER uydu görüntülerinin geometrik düzeltmesinde bölgeye ait 1/25.000 ölçekli haritalar sayısallaştırılarak bilgisayar ortamına aktarılmış ve ERDAS/Imagine yazılımı ile UTM koordinat sisteminde tanımlanarak haritalar mozaik haline getirilmiştir. Uydu görüntülerinin farklı veri gruplarıyla beraber değerlendirilebilmesi için aynı koordinat sisteminde olmaları gerekmektedir [Mather, 1987]. Bu nedenle uydu görüntülerinin geometrik dönüşümü için, UTM projeksiyon sisteminde sayısal ortama aktarılmış topoğrafik haritalardan faydalanılmıştır. Koordinat dönüşümünde yer kontrol noktalarının tüm çalışma alanına homojen olarak dağılmasına dikkat edilmiştir. Uydu görüntülerine birinci derece Afin dönüşümü kullanılarak UTM projeksiyon sisteminde yaklaşık 0.5 piksel karesel ortalama hata ile geometrik 96 düzeltme getirilmiştir. Uydu görüntülerinin yeniden örneklenmesinde orijinal değerleri koruduğundan en yakın komşuluk yöntemi tercih edilmiştir. 4.4.2. Arazi Örtüsü Sınıfları ve Eğitim Alanlarının Belirlenmesi Görüntü sınıflandırma, görüntüyü oluşturan her bir pikselin tüm bantlardaki değerlerinin diğer pikseller ile karşılaştırılarak benzer piksellerin kullanıcının belirlediği bilgi kategorileri dahilinde sınıflara ayrılması işlemidir (Campbell, 1996). Objelerin, sınıf olarak adlandırılan kategorilerden birine atanmasına örüntü sınıflandırması denir. Özel bir örüntü sınıflandırma probleminde bir sınıflandırıcı sınıflandırılmak istenilen nesneleri belirli bir doğrulukla sınıflandıracak şekilde oluşturulur. Girdi ve çıktı çiftleri kullanılarak yapılan eğitim yardımıyla sınıflandırıcılar girdi verilerini verilen sınıflardan birine atamak için karar fonksiyonlarını oluşturur. Kontrollü sınıflandırma da, çalışma alanındaki yeryüzü özelliklerini tanımlayan yeteri sayıdaki kontrol alanı kullanılarak, piksel değerlerinin özellik dosyaları (eğitim verileri) oluşturulur. Seçilen sınıflara ait kontrol alanlarını ifade eden bu eğitim verilerinin görüntü verilerine uygulanması ile her bir görüntü elemanı (piksel), hesaplanan olasılık değerine göre en çok benzer olduğu sınıfa atanmaktadır. Eğitim alanlarına ait veriler, mümkün oldukça uydu görüntüsünün kaydedildiği tarihe yakın bir zaman diliminde araziden toplanmalıdır. Doğru bir sınıflandırmanın yapılabilmesi, eğitim alanlarının arazide homojen bir şekilde belirlenmesi ve yeterli büyüklükte tanımlanması ile mümkündür [Lillesand et al., 2007]. Kontrollü sınıflandırmada, ilk adım arazi örtüsünü temsil edecek sınıfların ve bu sınıflara ait kontrol alanlarının belirlenmesidir. Belirlenen sınıflara ait kontrol alanlarından her bir arazi örtüsü çeşidini temsil edecek örnekleme bölgeleri seçilir ve bu bölgelerin spektral özelliklerini açıklayacak sayısal değerler geliştirir. Her iki uydu görüntüsü üzerinden yapılan ön çalışmalar neticesinde çalışma alanında altı temel sınıfın mevcut olduğu belirlenmiştir. Belirlenen bu sınıflar su, yerleşim, toprak-taş, bozkır, iğne yapraklı orman ve geniş yapraklı orman sınıflarıdır. Çalışma alanını kapsayan görüntülerin sınıflandırılması işlemi için öncelikle her iki tarihte arazideki durumu en iyi yansıtacak şekilde belirlenen bu altı sınıfı kapsayan eğitim alanları tespit edilmiştir. Belirlenen eğitim alanlarını kapsayan görüntü katmanı yazılan bir MATLAB programı yardımıyla rastgele örnekleme prensibinden 97 hareketle örneklendirilerek eğitim ve test veri setleri oluşturuldu. Eğitim ve test veri setleri belirlenirken tüm sınıflar için eşit sayıda örnek seçilerek özellikle test verisi için hesaplanan doğruluk değerlerinde oluşabilecek “önyargı” giderildi. Sonuçta sınıflandırmada kullanılmak üzere, eğitim için Landsat ETM+ görüntüsü için toplam 3900 piksel (her sınıf için 650 piksel), test verisi olarak 2100 piksel ve Terra Aster görüntüsü için eğitim verisi olarak toplam 2400 piksel, test verisi olarak toplam 1350 piksel belirlenmiştir. 4.4.3. Uydu Görüntülerinin Sınıflandırılması Küresel ve çevresel değişimlerin belirlenmesi amacıyla yapılan çalışmalarda yeryüzüne ait bilgilerin elde edilmesi önemli bir aşamadır. Yersel çalışmaların aksine uydu görüntüleri ile çalışmak zaman ve maliyet açısından büyük avantajlar sağlamaktadır [Kavzoğlu ve Çetin, 2005]. Uzaktan algılama sistemlerinin farklı genişlikteki alanları farklı zamanlarda görüntüleyebilme özelliği, bu sistemleri yeryüzüne ait bilgilerin elde edilmesinde önemli bir kaynak haline getirmiştir. Bu nedenle arazi örtüsü veya kullanım şekillerinin belirlenmesi amacıyla yapılan çalışmalarda uydu görüntülerinin sınıflandırılması önemli bir aşamadır. Uzaktan algılanmış görüntüler ile arazi örtüsünün haritalanması, her bir pikselin yansıtma ve parlaklık değerlerini kullanarak bu pikselleri belirli arazi örtüsü sınıflarından birine atanması işlemini içermektedir [Huang et al., 2002]. Başka bir ifadeyle, görüntüdeki pikselleri arazide karşılık geldikleri sınıflar veya temalar içine atamak veya yerleştirmektir. Çeşitli arazi örtülerinin spektral yansıma karakteristikleri uydu sensörlerinin çeşitli dalga boylarında veri elde etmesi durumunda arazi örtüsü tipinin belirlenmesinin mümkün olabileceğini göstermiştir [Richards, 1993]. Görüntü sınıflandırma kullanıcının ilgi duyduğu objeler veya çeşitli sınıflar ile objelere ait spektral imzalar arasındaki ilişkiyi kurarak görüntüler üzerinden tematik bilgilerin çıkarıldığı bir görüntü işleme bileşenidir. 1970 yılların başında ilk Landsat uydu görüntüsünün elde edilmesinden itibaren birçok sınıflandırma algoritması geliştirilmiş ve sınıflandırmada kullanılmıştır [Townshend, 1992; Hall et al., 1995; Lu and Weng, 2007]. 98 Bu çalışmada, kontrollü sınıflandırma algoritmalarından destek vektör makineleri, karar ağaçları, karar ağaçlarının sınıflandırma performansının arttırılmasına yönelik olarak kullanılan çeşitli birleştirme algoritmaları, yapay sinir ağları ve nesne tabanlı sınıflandırma algoritmalarından K-star sınıflandırıcıları kullanılmıştır. 4.4.3.1. En Çok Benzerlik Yöntemi İle Sınıflandırma En çok benzerlik yöntemi istatistiksel bir sınıflandırıcı olup literatürde kullanımı yaygın olan bir sınıflandırma yöntemidir. En çok benzerlik (EÇB) yöntemiyle sınıflandırma işlemi MATLAB 6.5 yazılımında hazırlanan bir program ile gerçekleştirilmiştir. Sınıflandırma işleminde Landsat ETM+ ve Terra ASTER görüntüleri için oluşturulan eğitim setleri ile model oluşturulmuş ve test veri setleri kullanılarak doğruluk analizi gerçekleştirilmiştir. Sınıflandırma sırasında piksellerin belirlenen sınıflardan veya bu sınıfların dışında bir sınıftan olduğunun tespiti için eşik değeri %50 olarak belirlenmiştir. EÇB yöntemiyle yapılan sınıflandırma sonuçlarının genel doğruluğu Tablo 4.1’den de görüleceği üzere Landsat ETM+ görüntüsü için yaklaşık %87, Terra ASTER uydu görüntüsü için %88 olarak hesaplanmıştır. Tablo 4.1. En Çok Benzerlik (EÇB) Yöntemi ile elde edilen sınıflandırma doğrulukları. Landsat ETM+ Terra ASTER Genel Doğruluk (%) Kappa Değeri Genel Doğruluk (%) Kappa Değeri 86.95 0.84 88.00 0.86 Her iki uydu görüntüsünün en çok benzerlik yöntemi ile sınıflandırılması sonucunda oluşturulan tematik haritalar Şekil 4.2’de gösterilmiştir. 99 (a) (b) Şekil 4.2. En çok benzerlik yöntemiyle elde edilen tematik haritalar. (a) Landsat ETM+ görüntüsü , (b) Terra ASTER görüntüsü. 4.4.3.2. Destek Vektör Makineleri İle Sınıflandırma Destek vektör makineleri istatistiksel öğrenme prensibine dayalı parametrik olmayan bir sınıflandırma algoritmasıdır. Uzaktan algılama verilerinde olduğu gibi doğrusal olarak ayrılamayan verilerin sınıflandırılması probleminin çözümünde destek vektör makineleri kernel fonksiyonları olarak adlandırılan doğrusal olmayan fonksiyonlar kullanır. Sınıf sayısının ikiden fazla olması durumunda çoklu sınıflandırma yöntemlerinden yararlanılır. Çoklu sınıflandırma yöntemlerinden en önemlileri “bire karşı hepsi” ve “bire karşı bir” yöntemleridir [Mathur and Foody, 2008]. Debnath et al., (2004), kullanılan çoklu sınıflandırma yöntemleri arasında bire karşı bir yönteminin pratik uygulamalarda en uygun yöntem olduğunu ifade etmişlerdir. DVM’nin eğitimi için kullanılacak kernel fonksiyonun ve kernel fonksiyonuna ait parametrelerin belirlenmesi son derece önemlidir. DVM ile yapılan sınıflandırmada karşılaşılan en büyük problem, kullanılacak kernel fonksiyonları için 100 hangi parametre değerlerinin en iyi sonucu vereceğinin bilinmemesidir (Oommen et al., 2008). Seçilen kernel fonksiyonu ve kernel parametreleri ise sınıflandırılacak veri setine göre değişiklik göstermektedir (Huang, et al., 2002; Dixon and Candade, 2008). Bu çalışmada, doğrusal olmayan ve ikiden fazla sınıfı içeren uydu görüntülerinin sınıflandırılmasında “bire karşı bir” çoklu sınıflandırma yöntemi kullanılmıştır. DVM ile yapılan sınıflandırılmada polinom, radyal tabanlı ve Pearson VII kernel fonksiyonları kullanılmıştır. Bu fonksiyonlar için gerekli parametreler çapraz geçerlilik yöntemi ile eğitim sırasında belirlenmiş ve parametre değerlerindeki değişimlerin sınıflandırma doğruluğuna etkileri incelenmiştir. Belirlenen optimum parametrelerle uydu görüntüleri sınıflandırılmış ve elde edilen sınıflandırma sonuçları analiz edilerek tematik haritalar oluşturulmuştur. 4.4.3.2.1. Polinom Kernel Fonksiyonu ile Sınıflandırma Polinom kernel kullanımı için önceden belirlenmesi gereken parametreler polinomun derecesi (d) ve düzenleme parametresidir (C). Çapraz geçerlilik yöntemi ile bu parametreler Landsat ETM+ ve Terra ASTER görüntüleri için oluşturulan eğitim ve test verileri kullanılarak ayrı ayrı belirlenmiştir. Seçilecek düzenleme parametresine (C) göre sınıflandırma doğruluğunda meydana gelen değişimler Landsat ETM+ için Şekil 4.3’de ve Terra ASTER için Şekil 4.4’te gösterilmiştir. Şekil 4.3’den de görüleceği üzere düzenleme parametresinin (C), 850–1000 aralığında alacağı değerler için elde edilen sınıflandırma doğruluğunun yaklaşık olarak %90 seviyesinde olduğu görülmektedir. Landsat ETM+ görüntüsünün polinom kernel fonksiyonu kullanılarak sınıflandırılmasında düzenleme parametresi (C), test verisi için bu aralıkta en yüksek sınıflandırma doğruluğunun elde edildiği değer olan 890 olarak belirlenmiştir. Terra ASTER uydu görüntüsünün sınıflandırılmasında Şekil 4.4’den de görüleceği üzere test veri seti için en yüksek sınıflandırma doğruluğunun elde edildiği 1000 değeri düzenleme parametresi (C) olarak belirlenmiştir. 101 Sınıflandırma Doğruluğu (%) 91 90 90,05 89 88 87 86 85 10 50 100 250 500 750 850 890 1000 5000 Düzenleme Parametresi (C) Şekil 4.3. Landsat ETM+ uydu görüntüsü için düzenleme parametresi C’deki değişimlerin sınıflandırma doğruluğuna etkisi. Sınıflandırma Doğruluğu (%) 92 91,04 91 90 89 88 10 50 100 250 500 750 1000 5000 Düzenleme Parametresi (C) Şekil 4.4. Terra ASTER uydu görüntüsü için düzenleme parametresindeki (C) değişimlerin sınıflandırma doğruluğuna etkisi. Polinom kernel fonksiyonu ile yapılacak sınıflandırma öncesinde kullanıcı tarafından belirlenen diğer parametre ise polinomun derecesidir. Literatürde yapılan çalışmalarda polinom kernelin derecesi arttıkça hesaplama zorluğunun ve hesaplama zamanının arttığı ifade edilmektedir (Cortes and Vapnik, 1995; Huang et al., 2002). Her iki uydu görüntüsü için polinom derecesindeki değişimler ve buna karşılık test verisi için hesaplanan genel sınıflandırma doğrulukları Şekil 4.5 ve 4.6’da ayrı ayrı 102 gösterilmiştir. Şekil 4.5’den polinom derecesinin 1–5 aralığında alacağı değerler ile test verisi için yaklaşık %90 sınıflandırma doğruluğuna ulaşıldığı görülmektedir. Bu aralıkta 3. dereceden bir fonksiyon ile en yüksek sınıflandırma doğruluğuna ulaşılmış, dolayısıyla Landsat ETM+ görüntüsünün sınıflandırılmasında optimum Sınıflandırma Doğruluğu (%) polinom derecesi 3 olarak belirlenmiştir. 91 90,05 88 85 82 79 76 1 2 3 4 5 7 9 Polinom Derecesi (d) Şekil 4.5. Landsat ETM+ uydu görüntüsü için polinom derecesindeki (d) değişimlerin sınıflandırma doğruluğuna etkisi. Terra ASTER görüntüsü için bu parametredeki değişimlerin gösterildiği Şekil 4.6 incelendiğinde, 2. ve 3. dereceden bir polinom ile test verisi için yaklaşık %91 sınıflandırma doğruluğuna ulaşılmıştır. Özellikle 2. dereceden bir polinom ile en yüksek sınıflandırma doğruluğuna ulaşıldığından Terra ASTER uydu görüntüsünün sınıflandırılması için bu değer tercih edilmiştir. Sınıflandırma Doğruluğu (%) 92 91,04 91 90 89 88 87 1 2 3 4 5 7 9 Polinom Derecesi Şekil 4.6. Terra ASTER uydu görüntüsü için polinom derecesindeki (d) değişimlerin sınıflandırma doğruluğuna etkisi. 103 Her iki uydu görüntüsünün polinom kernel ile sınıflandırılması için gerekli parametrelerin belirlenmesinin ardından model oluşturulmuş ve sınıflandırma işlemi gerçekleştirilerek Şekil 4.7’de gösterilen tematik haritalar elde edilmiştir. Genel sınıflandırma sonuçları Tablo 4.2’den de görüleceği üzere Landsat ETM+ görüntüsü için %90.05 ve Terra ASTER uydu görüntüsü için %91.04 olarak hesaplanmıştır. Tablo 4.2. Polinom kernel fonksiyonu için belirlenen en uygun parametre değerleri ve elde edilen genel sınıflandırma doğrulukları Landsat ETM+ Terra ASTER C= 890; d= 3 C= 1000; d= 2 Genel Doğruluk (%) Kappa Değeri Genel Doğruluk (%) Kappa Değeri 90.05 0.88 91.04 0.89 (a) (b) Şekil 4.7. Polinom kernel fonksiyonu kullanılarak elde edilen tematik haritalar. (a) Landsat ETM+ görüntüsü, (b) Terra ASTER görüntüsü. 104 4.4.3.2.2. Radyal Tabanlı Kernel Fonksiyonu ile Sınıflandırma Radyal tabanlı fonksiyon kerneli kullanımında kullanıcı tarafından belirlenmesi gereken iki parametre söz konusudur. Bunlardan ilki düzenleme parametresi olarak ifade edilen C, diğeri ise gama γ parametresidir. Herhangi bir sınıflandırma probleminde hangi C ve γ değerinin en iyi sonuç vereceği bilinmemektedir. Bu nedenle en uygun parametrelerin belirlenmesi gerekmektedir. En uygun parametrelerin belirlenmesiyle amaç en iyi sınıflandırma sonucunu verecek parametre çiftini (C, γ ) belirlemektir. Radyal tabanlı fonksiyon için gerekli olan bu parametreler eğitim ve test verileri kullanılarak çapraz geçerlilik yöntemi ile belirlenmiştir. Landsat ETM+ uydu görüntüsünün RTF kernel ile sınıflandırılması için belirlenmesi gereken düzenleme parametresi C’deki değişimlerin sınıflandırma doğruluğuna etkisi Şekil 4.8’de gösterilmiştir. Şekilde C değerindeki artışlara karşılık sınıflandırmaya esas olacak test veri seti için elde edilen genel sınıflandırma doğruluğunun belirli bir parametreden sonra düşmeye başladığı görülmektedir. Bu parametre değerlerinden test veri seti için en yüksek genel sınıflandırma doğruluğuna ulaşılan 75 değeri düzenleme parametresi olarak belirlenmiştir. Sınıflandırma Doğruluğu (%) 92 91 90,81 90 89 88 1 50 75 100 200 450 1000 5000 Düzenleme Parametresi (C) Şekil 4.8. Landsat ETM+ uydu görüntüsü için düzenleme parametresi C’deki değişimlerin sınıflandırma doğruluğuna etkisi. 105 Terra ASTER uydu görüntüsü için düzenleme parametresindeki değişimler ve bu parametrelere karşılık gelen genel sınıflandırma doğrulukları Şekil 4.9’da gösterilmiştir. Şekilde düzenleme parametrelerinden 245 değerinde test verisi için en yüksek genel sınıflandırma doğruluğuna ulaşıldığı görülmektedir. Sınıflandırma Doğruluğu (%) 94 92,81 93 92 91 90 10 50 100 150 200 245 250 270 350 500 1000 5000 Düzenleme Parametresi (C) Şekil 4.9. Terra ASTER uydu görüntüsü için düzenleme parametresi C’deki değişimlerin sınıflandırma doğruluğuna etkisi. RTF kernel kullanımında düzenleme parametresinin yanında kernel genişliği olarak ifade edilen gama ( γ ) parametresinin de belirlenmesi gereklidir. Her iki uydu görüntüsü için oluşturulan eğitim ve test veri setleri kullanılarak çapraz geçerlilik yöntemi ile bu parametreler ve parametre değişimlerinin genel sınıflandırma doğruluğuna etkileri incelenmiştir. Landsat ETM+ görüntüsünün RTF kernel ile sınıflandırılmasında seçilecek gama ( γ ) parametreleri ve bu parametrelerin seçilmesi durumunda test veri seti için elde edilecek genel sınıflandırma doğrulukları Şekil 4.10’da gösterilmiştir. Şekilde gama parametresindeki artışın test seti için elde edilen sınıflandırma doğruluğunu %90 seviyelerinde değiştirdiği görülmektedir. Gama parametresi 3 değerini aldığında en yüksek genel sınıflandırma doğruluğuna ulaşıldığından, RTF kernel ile Landsat ETM+ görüntüsünün sınıflandırılmasında değer kullanılmıştır. 106 Sınıflandırma Doğruluğu (%) 91,5 91,0 90,81 90,5 90,0 89,5 1 2 3 4 5 7 9 Gamma Parametresi Şekil 4.10. Landsat ETM+ uydu görüntüsü için gama parametresindeki ( γ ) değişimlerin sınıflandırma doğruluğuna etkisi. RTF kernel ile sınıflandırılacak diğer uydu görüntüsü içinde bu parametrenin belirlenmesi gerekmektedir. Bu amaçla Terra ASTER görüntüsü için hazırlanan eğitim ve test verileri kullanılarak, RTF kernel için en uygun gama ( γ ) parametresi belirlenmiştir. Şekil 4.11’den görüleceği üzere özellikle gama parametresi 1 olduğunda test veri seti için en yüksek sınıflandırma doğruluğunun elde edildiği görülmektedir. Şekilde, gama parametresinin aldığı yüksek değerlerin genel sınıflandırma doğruluğunda düşüşlere neden olduğu görülmektedir. Sınıflandırma Doğruluğu (%) 94 93 92,81 92 91 90 89 0,5 1,0 1,5 2,0 3,0 5,0 7,0 9,0 Gamma Parametresi Şekil 4.11. Terra ASTER uydu görüntüsü için gama parametresindeki ( γ ) değişimlerin sınıflandırma doğruluğuna etkisi. 107 RTF kernel ile sınıflandırma işlemi için en uygun parametrelerin belirlenmesinin ardından her iki veri seti için modeller oluşturulmuş ve görüntülerin sınıflandırılması işlemi tamamlanmıştır. Her iki görüntü için belirlenen optimum RTF kernel parametreleri ve elde edilen genel sınıflandırma doğrulukları Tablo 4.3’de gösterilmiştir. Sınıflandırma sonucu oluşturulan her iki görüntüye ait tematik haritalar ise Şekil 4.12’de gösterilmiştir. Tablo 4.3. Radyal Tabanlı Fonksiyon Kerneli için belirlenen en uygun parametre değerleri ve elde edilen genel sınıflandırma doğrulukları. Landsat ETM+ Terra ASTER C= 75; γ = 3 C= 245; γ = 1 Genel Doğruluk (%) Kappa Değeri Genel Doğruluk (%) Kappa Değeri 90.81 0.89 92.81 0.91 (a) (b) Şekil 4.12. Radyal Tabanlı kernel fonksiyonu kullanılarak elde edilen tematik haritalar. (a) Landsat ETM+ görüntüsü, (b) Terra ASTER görüntüsü. 108 4.4.3.2.3. Pearson VII Fonksiyonu ile Sınıflandırma Karl Pearson (1985) tarafından geliştirilmiş olan Pearson VII fonksiyonu (PUK) ilk olarak X-ray ışınlarındaki dağılmaları belirlemek için kullanılmıştır. Üstün et al., (2006) bu fonksiyonu genelleştirerek kernel fonksiyonu olarak kullanımını ortaya koymuşlardır. Bu fonksyon ile yapılacak sınıflandırma öncesinde kullanıcı tarafından belirlenmesi gereken üç parametre vardır. Bu parametreler; düzenleme parametresi (C), Pearson genişliği olarak ifade edilen omega ( ω ) ve sigma ( σ ) parametreleridir. Bu parametrelerden omega ( ω ) parametresinin 0.25–0.75 değer aralığında doğrusal fonksiyon; 0.5 değeri için RTF kernel veya yüksek dereceli polinom kerneli gibi davranış sergilediğini, bunu yanında 1 değerini için Gauss ve Lorentzian tepe noktasına ulaştığı ifade edilmektedir. Üstün et al. (2006) yapılan çalışmada, sigma ( σ ) parametresindeki artışların omega parametresinde azalmaya neden olacağını dolayısıyla doğrusal fonksiyondan radyal tabanlı fonksiyona doğru bir geçiş söz konusu olacağını ifade etmişlerdir. Yine aynı çalışmada omega ( ω ) parametresinin sonuç model üzerindeki etkisinin daha az olduğu ifade edilmiştir. Çalışmada Pearson VII fonksiyonu (PUK) ile her iki görüntünün sınıflandırılmasından önce kullanıcı tarafından belirlenmesi gereken bu üç parametre ( C ,ω ,σ ) eğitim ve test verileri kullanılarak çapraz geçerlilik yöntemiyle belirlenmiştir. Landsat ETM+ görüntüsü için eğitim ve test verileri ile yapılan çapraz geçerlilik sonucundan omega ( ω ) ve sigma ( σ ) parametreleri için 1 değerinin en uygun sonuçları verdiği görülmüştür. Düzenleme parametreleri (C) ve bunlara karşılık genel sınıflandırma doğrulukları Şekil 4.13’da gösterilmiştir. Şekilde farklı parametre değerleri ile test verisi için %89–91 aralığında genel sınıflandırma doğruluğuna ulaşıldığı görülmektedir. Düzenleme parametrelerinden 245 değeri ile en yüksek genel sınıflandırma doğruluğuna ulaşıldığından model oluşumunda bu değer kullanılmıştır. 109 Sınıflandırma Doğruluğu (%) 92,0 91,0 90,90 90,0 89,0 10 100 200 245 400 600 1000 5000 Düzenleme Parametresi (C) Şekil 4.13. Landsat ETM+ uydu görüntüsü için düzenleme parametresindeki (C) değişimlerin sınıflandırma doğruluğuna etkisi. Terra ASTER görüntüsünün PUK fonksiyonu ile sınıflandırılması için gerekli parametrelerden sigma ( σ ) için 0.6 ve omega için ( ω ) 1 değerinin en uygun parametreler olduğu eğitim ve test verileriyle belirlenmiştir. Düzenleme parametresinin (C) alacağı farklı değerler için değişik genel sınıflandırma doğrulukları elde edilmiştir. Bu değişimlerin gösterildiği Şekil 4.14’de düzenleme parametresinin 35 değeri için en yüksek genel sınıflandırma doğruluğunun elde edildiği görülmektedir. Sınıflandırma Doğruluğu (%) 93 92 92,15 91 90 10 35 70 150 300 750 5000 Düzenleme Parametresi (C) Şekil 4.14. Terra ASTER uydu görüntüsü için düzenleme parametresindeki (C) değişimlerin sınıflandırma doğruluğuna etkisi. 110 Pearson VII fonksiyonu için en uygun parametreler ayrı ayrı belirlendikten sonra her iki uydu görüntüsü için modeller oluşturulmuş ve sınıflandırma işlemi gerçekleştirilmiştir. En uygun parametreler ve bu parametrelerin kullanımı ile elde edilen genel sınıflandırma doğrulukları Tablo 4.4’te gösterilmiştir. Tablo 4.4. Pearson VII fonksiyonu için belirlenen en uygun parametre değerleri ve elde edilen genel sınıflandırma doğrulukları. Landsat ETM+ Terra ASTER C= 245; ω = 1; σ = 1 C= 35; ω = 1; σ = 0.6 Genel Doğruluk (%) Kappa Değeri Genel Doğruluk (%) Kappa Değeri 90.90 0.89 92.15 0.90 Her iki görüntünün PUK fonksiyonu kullanılarak sınıflandırılmasında en uygun parametre değerleri ile oluşturulan modellerin tüm görüntüye uygulanması sonucunda elde edilen tematik haritalar Şekil 4.15’te gösterilmiştir. (a) (b) Şekil 4.15. PUK fonksiyonu kullanılarak elde edilen tematik haritalar. (a) Landsat ETM+ görüntüsü, (b) Terra ASTER görüntüsü. 111 4.4.3.3. Karar Ağaçları İle Sınıflandırma Ağaç yapılarının oluşturulmasında kullanılan kuralların anlaşılabilir ve sade olması, karar ağacı sınıflandırma yönteminin yaygın olarak kullanılmasını sağlamıştır. Yöntem çok karışık bir sınıflandırma problemini çok aşamalı bir hale getirerek basit bir karar verme işlemi gerçekleştirir [Safavian and Landgrebe, 1991]. 4.4.3.3.1. C4.5 Karar Ağacı Algoritması ile Sınıflandırma Ağaç oluşumunun her bir aşamasında kullanılan değişkenlerin sayısına bağlı olarak tek değişkenli veya çok değişkenli karar ağacı yapıları mevcuttur [Friedl and Brodley, 1997]. Tek değişkenli karar ağaçları genellikle arazi örtüsü sınıflandırmalarında kullanılan ağaç yapılarıdır [DeFries et al. 1998, Hansen et al. 2000]. Tek değişkenli karar ağaçlarından bölünme bilgisi kavramı ile bilgi kazancından yararlanarak hesaplanan kazanç oranı yaklaşımını kullanan C4.5 gelişmiş bir karar ağacı oluşturma algoritmasıdır [Quinlan, 1993]. C4.5 algoritması ile karar ağaçlarının oluşturulmasındaki en önemli adım ağaçtaki dallanmanın hangi kritere veya kıstasa göre yapılacağı ya da hangi öznitelik değerlerine göre ağaç yapısının oluşturulacağıdır. Karar ağacı oluşturulmasında diğer önemli bir husus oluşturulan ağacın budanması işlemidir [Özkan, 2008; Pal, 2002]. Budama ile karar ağacının sınıflandırma doğruluğunu etkilemeyen veya katkısı olmayan kısımlarının çıkarılması işlemi gerçekleştirilir. Böylece daha az karmaşık ve daha anlaşılabilir bir ağaç elde edilir. Daha basit bir ağaç oluşturulması için karar ağacı sınıflandırıcısının düzenlenmesinde kullanılan iki yöntem vardır [Breiman et al., 1984; Mingers, 1989]. Bunlardan ilki eğitim setinin daha ileriye bölünüp bölünmemesine karar verilen ön budama, diğeri ağaç yapısının budama yapılmaksızın oluşturulduğu daha sonra budamaların yapıldığı son budama yöntemleridir. C4.5 algoritmasının kullandığı ön budama yöntemi daha az hesaplama içermesi, veri setinin ayrılması için en iyi yolu araştırması gibi önemli avantajlara sahiptir [Breiman et al., 1984]. 112 Çalışmada, Landsat ETM+ ve Terra ASTER uydu görüntülerinin karar ağacı sınıflandırma yöntemi ile sınıflandırılması işlemi tek değişkenli karar ağacı algoritmalarından C4.5 ile gerçekleştirilmiştir. Karar ağacının oluşumunda dallanmaya esas olacak özniteliklerin seçiminde kazanç oranı kriteri hesaplamalarda kullanılmıştır. Karar ağaçları ilk önce budama işlemine tabi tutulmadan oluşturulmuş ve elde edilen modellerin genelleştirme kabiliyeti her iki görüntü için test edilmiştir. Her iki veri seti için oluşan ağaç yapılarına ait bilgiler ve elde edilen genel sınıflandırma doğrulukları Tablo 4.5’te gösterilmiştir. Tablodan da görüldüğü üzere budama yapılmadan oluşturulan 324 yaprak ve 627 daldan oluşan KA modeli ile birlikte Landsat ETM+ görüntüsü için genel sınıflandırma doğruluğu yaklaşık %87 olarak hesaplanmıştır. Aynı şekilde budama yapılmaksızın 289 yaprak ve 577 daldan oluşan KA modeli ile birlikte Terra ASTER görüntüsü için genel sınıflandırma doğruluğu yaklaşık %88 olarak hesaplanmıştır. Tablo 4.5. Landsat ETM+ ve Terra ASTER görüntülerin budama yapılmaksızın oluşturulan karar ağaçları ile sınıflandırılması ile elde edilen sonuçlar. Landsat ETM+ Terra ASTER Ağaçtaki Yaprak Sayısı 324 289 Ağaçtaki Dal Sayısı 627 577 Genel Sınıflandırma Doğruluğu (%) 87.14 87.55 Kappa 0.84 0.85 Budama yapılmaksızın oluşturulan karar ağacı modellerinin sadeleştirilmesi ve elde edilen genel sınıflandırma doğruluğunun arttırılması amacıyla ön budama yöntemi ve budama sırasındaki hataların tahmini için karamsar budama tekniğinden yararlanılmıştır. Ön budama yöntemi ile gerçekleştirilecek sınıflandırma öncesinde eşik değeri parametresinin belirlenmesi gerekmektedir. Eşik değeri, budama sırasında ulaşılan bir noktadan daha ileriye ayrım yapılıp yapılmayacağının değerlendirilmesi için kullanılır. Bu değerlendirmede ulaşılan noktada elde edilen hata bu eşik değerinin altına düştüğünde bölünme kabul edilmez ve ulaşılan bu noktanın veri için en uygun yaprak olduğuna karar verilir (Breiman et al., 1984). Landsat ETM+ görüntüsü için oluşturulan KA modelinde eşik değeri 0.10, Terra ASTER görüntüsü için oluşturulan KA modelinde eşik değeri 0.45 olarak 113 belirlenmiştir. Her iki veri seti için oluşturulan KA modellerine ait bilgiler ve elde edilen genel sınıflandırma doğrulukları Tablo 4.6’da gösterilmiştir. Budama sonucunda oluşan modeller ile yapılan sınıflandırma sonucunda Landsat ETM+ görüntüsü için genel sınıflandırma doğruluğu %87.62 ve Terra ASTER görüntüsü için %87.95 olarak hesaplanmıştır. Tablo 4.6. Landsat ETM+ ve Terra ASTER görüntülerin ön budama yöntemiyle oluşturulan karar ağaçları ile sınıflandırılması ile elde edilen sonuçlar. Landsat ETM+ Terra ASTER Ağaçtaki Yaprak Sayısı 138 257 Ağaçtaki Dal Sayısı 275 513 Genel Sınıflandırma Doğruluğu (%) 87.62 87.95 Kapa 0.84 0.85 Landsat ETM+ görüntüsü için budama öncesi ve sonrası oluşan ağaç modelleri Şekil 4.16’de görülmektedir. Bu iki ağaç modeli karşılaştırıldığında Tablo 4.5 ve 4.6’da görüldüğü üzere özellikle Landsat ETM+ görüntüsü için budama sonrasında oluşan KA modelindeki yaprak sayısında yaklaşık %58, dal sayısında ise %56’lık bir azalma görülmektedir. Buna karşılık genel sınıflandırma doğruluğunda yaklaşık %0.6’lık bir artış görülmektedir. Her iki tablo incelendiğinde Terra ASTER görüntüsü için budama yapılarak oluşturulan KA modelindeki yaprak ve dal sayısında yaklaşık olarak %11’lik bir azalma görülürken, genel sınıflandırma doğruluğunda %0.5’lik bir iyileşme olduğu görülmektedir. Şekil 4.16 (a)’da görüleceği üzere C4.5 algoritması ile oluşturulan ağaç yapısı, budama işlemi sonrasında Şekil 4.16(b)’de gösterilen daha basit ve sadeleşmiş bir ağaç yapısı halini almıştır. Budama sonucu elde edilen modelle yapılacak eğitim için gereken zaman azalırken, oluşturulan ağaç yapısının testi sonucunda elde edilen sınıflandırma doğruluğunda yaklaşık %1’lik bir iyileşme gözlemlenmiştir. Budanmış C4.5 algoritması ile elde edilen modeller kullanılarak Landsat ETM+ ve Terra ASTER uydu görüntüleri sınıflandırılarak Şekil 4.17’de gösterilen tematik haritalar oluşturulmuştur. 114 (a) (b) Şekil 4.16. Landsat ETM+ görüntüsünün sınıflandırılması için (a) budama öncesi, (b) budama sonrası oluşturulan modeller. (a) (b) Şekil 4.17. C4.5 algoritması ve ön budama yöntemiyle oluşturulan tematik haritalar. (a) Landsat ETM+ görüntüsü, (b) Terra ASTER görüntüsü. 115 4.4.3.3.2. Karar Ağacı İyileştirme Algoritmaları ile Sınıflandırma Karar ağacı oluşturulmasında kullanılan C4.5 algoritmasının performansını arttırmaya yönelik olarak hızlandırma, torbalama, çoklu hızlandırma, rastgele orman ve DECORATE iyileştirme algoritmaları kullanılmıştır. Her bir iyileştirme yönteminde C4.5 algoritması temel sınıflandırıcı olarak kullanılmış ve Landsat ETM+ ve Terra ASTER uydu görüntüleri için oluşturulan eğitim ve test verileri kullanılarak her bir algoritma için modeller oluşturulmuştur. 4.4.3.3.2.1. Hızlandırma Algoritması İle Sınıflandırma Literatürde hızlandırma algoritmalarından en çok kullanılanı Adaboost algoritmasıdır [Freund and Schapire, 1996]. Bu algoritma birleşmeye esas olan sınıflandırıcıların ağırlıklı örnekleri kullanabileceğini kabul etmektedir. Adaboost algoritması kullanımında önceden belirlenmesi gereken en önemli parametre gerçekleştirilecek iterasyon sayısıdır. Şekil 4.18 ve 4.19’te Landsat ETM+ ve Terra ASTER görüntüleri için oluşturulacak modellerde seçilecek farklı iterasyon sayıları ve test verisi için elde edilen genel sınıflandırma doğrulukları gösterilmiştir. Landsat ETM+ görüntüsü için eğitim ve test verileri kullanılarak en uygun iterasyon sayısı 60 olarak belirlenmiş ve oluşturulan modelin test verisine uygulanması ile yaklaşık %90 Sınıflandırma Doğruluğu (%) sınıflandırma doğruluğuna ulaşılmıştır. 90,0 89,5 89,6 89,0 88,5 88,0 10 20 30 40 50 60 65 70 80 90 100 İterasyon Sayısı Şekil 4.18. Landsat ETM+ için oluşturulacak modelde seçilecek iterasyon sayısı ve elde edilen sınıflandırma doğrulukları. 116 Şekil 4.19 incelendiğinde Terra ASTER uydu görüntüsü için iterasyon sayısının 70 seçilmesi ile elde edilen genel sınıflandırma doğruluğunun %92 olduğu görülmektedir. Optimum parametrelerle oluşturulan modeller kullanılarak uydu Sınıflandırma Doğruluğu (%) görüntüleri sınıflandırılmış ve tematik haritalar oluşturulmuştur (Şekil 4.20). 93 92 92 91 90 89 10 20 30 40 50 60 70 80 90 100 İterasyon Sayısı Şekil 4.19. Terra ASTER için oluşturulacak modelde seçilecek iterasyon sayısı ve elde edilen sınıflandırma doğrulukları. (a) (b) Şekil 4.20. Hızlandırma Algoritması ile elde edilen tematik haritalar. (a) Landsat ETM+ görüntüsü, (b) Terra ASTER görüntüsü. 117 4.4.3.3.2.2. Torbalama Algoritması İle Sınıflandırma İyileştirme algoritmalarından sınıflandırıcıların birleştirilmesi amacıyla geliştirilen diğer bir yöntem torbalama yöntemidir. Bu yöntem eğitim setinin rastgele bir şekilde yeniden oluşturulması ile ayrı ayrı her bir sınıflandırıcının eğitiminin gerçekleştirilmesi esasına dayanmaktadır. Torbalama algoritması ile oluşturulacak modelde kullanıcı tarafından belirlenen iki parametre vardır. Bunlar torba boyutu ve gerçekleştirilecek iterasyon sayısıdır. Bu parametrelerden torba boyutu her iki veri seti içinde 100 olarak belirlenmiştir. Kullanıcı tarafından belirlenen iterasyon sayısı her iki veri seti için farklı değerler almıştır. Landsat ETM+ görüntüsü için oluşturulacak modelde seçilecek iterasyon sayıları ve bu değerlere karşılık gelen sınıflandırma doğrulukları Şekil 4.21’te gösterilmiştir. Şekilde iterasyon sayısının 50–70 aralığında seçilmesi durumunda yaklaşık %89 genel sınıflandırma doğruluğuna ulaşıldığı görülmektedir. Landsat ETM+ görüntüsünün sınıflandırılması için oluşturulacak model için iterasyon sayısı olarak bu aralıkta en yüksek Sınıflandırma Doğruluğu (%) sınıflandırma doğruluğuna (%89.10) ulaşılan 65 değeri kullanılmıştır. 90,0 89,5 89,0 89,10 88,5 88,0 10 20 30 40 50 60 65 70 80 90 100 İterasyon Sayısı Şekil 4.21. Landsat ETM+ için oluşturulacak modelde seçilecek iterasyon sayısı ve elde edilen sınıflandırma doğrulukları. Aynı şekilde, Terra ASTER görüntüsü için iterasyon sayısı eğitim ve test verileri ile kullanılarak belirlenmiş ve iterasyon sayısındaki değişimlere karşılık elde edilen genel sınıflandırma doğrulukları Şekil 4.22’de gösterilmiştir. Şekil 118 incelendiğinde iterasyon sayısının 70 olarak seçilmesiyle en yüksek genel sınıflandırma doğruluğuna (%89.70) ulaşıldığı görülmektedir. Belirlenen optimum parametrelerle modeller oluşturularak her iki görüntü sınıflandırılmış ve Şekil Sınıflandırma Doğruluğu (%) 4.23’de gösterilen tematik haritalar elde edilmiştir. 90,0 89,5 89,7 89,0 88,5 88,0 10 20 30 40 50 60 70 80 90 100 İterasyon Sayısı Şekil 4.22. Terra ASTER için oluşturulacak modelde seçilecek iterasyon sayısı ve elde edilen sınıflandırma doğrulukları. (a) (b) Şekil 4.23. Torbalama yöntemiyle elde edilen tematik haritalar. (a) Landsat ETM+ görüntüsü, (b) Terra ASTER görüntüsü. 119 4.4.3.3.2.3. Çoklu Hızlandırma Algoritması İle Sınıflandırma Çoklu hızlandırma algoritması hızlandırma ve torbalama algoritmalarının belirli özelliklerinin bir algoritmada toplanarak daha güçlü bir iyileştirme yöntemi oluşturulması esasına dayanmaktadır. Bu nedenle çoklu hızlandırma algoritması hızlandırma ve torbalama algoritmalarının birleşimi gibi düşünülebilir. Bu algoritma ile oluşturulacak modelde kullanıcı tarafından belirlenen üç parametre mevcuttur. Bu parametreler ağırlıklı eşik değeri, alt komitelerin sayısı ve gerçekleştirilecek iterasyon sayısıdır. Bu parametrelerden ağırlıklı eşik değeri her iki veri seti içinde 100 olarak belirlenmiştir. Kullanıcı tarafından belirlenen iterasyon sayısı ve alt komite sayısı her iki veri seti için farklı değerler almıştır. Landsat ETM+ görüntüsünün çoklu hızlandırma algoritması ile sınıflandırılmasında kullanılacak model için alt komite sayısındaki değişimler ve bu parametre değerlerine karşılık gelen sınıflandırma doğrulukları Şekil 4.24’te gösterilmektedir. Bu parametre değerlerinden en yüksek sınıflandırma doğruluğuna ulaşılan 3 alt komite sayısı Sınıflandırma Doğruluğu (%) model oluşumunda kullanılmıştır. 91,0 90,5 90,0 89,5 89,9 89,0 88,5 88,0 1 2 3 4 5 6 7 8 9 10 20 50 Alt Komite Sayısı Şekil 4.24. Landsat ETM+ için alt komitelerin sayısı ve sınıflandırma doğrulukları. Çoklu hızlandırma algoritması ile oluşturulacak model için kullanıcı tarafından belirlenmesi gereken iterasyon sayısı Landsat ETM+ için oluşturulan eğitim ve test verileri kullanılarak belirlenmiştir. Şekil 4.25’de iterasyon sayısındaki değişimler ve bu değişimlere karşılık hesaplanan genel sınıflandırma doğrulukları görülmektedir. 120 Bu parametre değerleri arasında Landsat ETM+ görüntüsünün sınıflandırılması için çoklu hızlandırma yöntemi ile oluşturulacak modelde kullanılmak üzere en yüksek Sınıflandırma Doğruluğu (%) sınıflandırma doğruluğunun elde edildiği 36 değeri kullanılmıştır. 90,50 90,00 89,90 89,50 89,00 88,50 10 20 30 35 36 37 40 50 60 70 80 100 İterasyon Sayısı Şekil 4.25. Landsat ETM+ için iterasyon sayısı ve sınıflandırma doğrulukları. Sınıflandırma Doğruluğu (%) 93 92 92,07 91 90 89 1 2 3 4 5 6 7 8 9 10 20 50 Alt Komitelerin Sayısı Şekil 4.26. Terra ASTER için oluşturulacak modelde seçilecek alt komitelerin sayısı ve elde edilen sınıflandırma doğrulukları. Şekil 4.26’da Terra ASTER görüntüsü için oluşturulacak modelde kullanılmak üzere seçilecek alt komite sayısı ve bu değerlere karşılık gelen sınıflandırma doğrulukları gösterilmektedir. Şekilde 1–10 aralığında seçilecek parametre 121 değerleriyle yaklaşık %91’in üzerinde genel sınıflandırma doğruluğuna ulaşılacağı görülmektedir. Bu değerler arasında alt komite sayısı 9 değerini aldığında en yüksek sınıflandırma doğruluğuna (%92.07) ulaşılmıştır. Bunun yanında iterasyon sayısındaki ve bu değerlere karşılık elde edilen genel sınıflandırma doğruluğundaki değişimler Şekil 4.27’de gösterilmiştir. Şekilden de görüleceği üzere Terra ASTER görüntüsünün sınıflandırılması için oluşturulacak modelde iterasyon sayısı en yüksek sınıflandırma doğruluğuna ulaşılan değer olan 87 olarak belirlenmiştir. Sınıflandırma Doğruluğu (%) 93 92 92,07 91 90 89 88 10 20 30 40 50 60 70 80 87 90 100 İterasyon Sayısı Şekil 4.27. Terra ASTER için oluşturulacak modelde seçilecek iterasyon sayısı ve elde edilen sınıflandırma doğrulukları. Belirlenen en uygun parametrelerle kullanılarak modeller oluşturulmuş ve her iki görüntünün sınıflandırılması yapılarak Şekil 4.28’de gösterilen tematik haritalar elde edilmiştir. 122 (a) (b) Şekil 4.28. Çoklu hızlandırma algoritması ile elde edilen tematik haritalar. (a) Landsat ETM+ görüntüsü, (b) Terra ASTER görüntüsü. 4.4.3.3.2.4. Rastgele Orman Algoritması İle Sınıflandırma Rastgele orman algoritması birçok karar ağacından meydana gelen ve torbalama yöntemiyle rastgele özellik seçiminin birleşimi olarak ifade edilen bir sınıflandırma algoritmasıdır. Rastgele orman algoritmasında ağaç oluşumu için her bir düğümde kullanılan özelliklerin sayısı ve ağaç sayısı kullanıcı tarafından belirlenmesi gereken parametrelerdir. Her bir düğümde en iyi bölünme için yalnızca seçilen özellikler araştırılır. Bu nedenle rastgele orman sınıflandırıcısı kullanıcı tarafından belirlenen N sayıda ağaçtan oluşmaktadır. Rastgele orman sınıflandırıcısı için kullanıcı tarafından belirlenmesi gereken parametreler için eğitim ve test verileri kullanılarak denemeler gerçekleştirilmiştir. Landsat ETM+ görüntüsü için özelliklerin sayısına göre ve ağaç sayısına göre elde edilen genel sınıflandırma doğrulukları Şekil 4.29 ve 4.30’de gösterilmiştir. Her iki şekilden de görüleceği üzere Landsat ETM+ için rastgele orman algoritması ile oluşturulacak modelde her bir düğümdeki özellik sayısı 3 ve ağaç sayısı 58 olarak belirlenmiştir. Bu parametre 123 değerleri ile oluşturulan modelin test edilmesi sonucunda elde edilen genel sınıflandırma doğruluğu %89.10 olarak hesaplanmıştır. Sınıflandırma Doğruluğu (%) 89,50 89,29 88,95 89,04 89,00 89,00 88,76 88,70 88,89 88,82 88,80 88,85 88,50 88,00 1 2 3 4 5 6 7 8 9 10 Özellik Sayısı Şekil 4.29. Landsat ETM+ görüntüsü için çeşitli sayıdaki özellikler ile genel sınıflandırma doğruluğundaki değişimler. Sınıflandırma Doğruluğu (%) 90 89,3 88 86 84 82 1 5 20 40 55 60 80 100 500 Ağaç Sayısı Şekil 4.30. Landsat ETM+ görüntüsü için üç özellik kullanılarak oluşturulacak ağaç sayıları ile genel sınıflandırma doğruluğundaki değişimler. Rastgele orman algoritması kullanılarak Terra ASTER görüntüsünün sınıflandırılması için oluşturulacak model için de eğitim ve test verileri kullanılarak en uygun ağaç sayısı ve her bir düğümdeki özellik sayısı parametreleri belirlenmiştir. Şekil 4.31 Terra ASTER için oluşturulacak model için seçilecek özellik sayılarını ve 124 bunlara karşılık elde edilecek genel sınıflandırma doğruluklarını göstermektedir. Şekilden bu veri seti için her bir düğümde 2 özellik seçilmesi durumunda oluşturulacak modelin test verisine uygulanması ile en yüksek sınıflandırma Sınıflandırma Doğruluğu (%) doğruluğuna (%91.19) ulaşıldığı görülmektedir. 92 91 91,19 91,11 90,81 90,67 90,52 91 89,93 89,78 90 89,41 89,48 89,48 90 89 89 1 2 3 4 5 6 7 8 9 10 Özellik Sayıları Şekil 4.31. Terra ASTER görüntüsü için çeşitli sayıdaki özellikler ile genel sınıflandırma doğruluğundaki değişimler. Aynı şekilde her bir düğümde iki özellik olması durumunda ağaç sayısındaki değişimler ve buna karşılık elde edilen genel sınıflandırma doğrulukları Şekil 4.32’de gösterilmiştir. Şekilden Terra ASTER görüntüsü için oluşturulacak rastgele orman modelde ağaç sayısını ifade eden parametrenin 82 seçilmesi durumunda en yüksek sınıflandırma doğruluğu olan %91.2 değerine ulaşıldığı görülmektedir. Sınıflandırma Doğruluğu (%) 94 92 91,2 90 88 86 84 82 1 5 20 40 60 80 85 100 500 Ağaç Sayısı Şekil 4.32. Terra ASTER görüntüsü için her bir düğümde iki özellik ile oluşturulacak ağaç sayıları ve genel sınıflandırma doğruluğundaki değişimler. 125 Rastgele orman algoritması ile yapılacak sınıflandırma öncesinde her iki veri seti için en uygun parametre değerleri belirlenmesinin ardından modeller oluşturulmuş ve her iki görüntü bu modellerle sınıflandırılarak Şekil 4.33’te gösterilen tematik haritalar elde edilmiştir. (a) (b) Şekil 4.33. Rastgele orman algoritması ile elde edilen tematik haritalar. (a) Landsat ETM+ görüntüsü, (b) Terra ASTER görüntüsü. 4.4.3.3.2.5. DECORATE Algoritması İle Sınıflandırma DECORATE algoritmasında ilk önce sınıflandırıcının eğitim işlemi tamamlandığı ve sonra eğitim işlemi tamamlanan sınıflandırıcının birleştirmeye dahil edildiği iteratif bir yöntemdir. Her bir iterasyonda sınıflandırıcılar bir takım yapay verilerle birleştirilmiş orijinal eğitim verisi ile eğitilirler. Yapay olarak elde edilen eğitim örneklerine ait öznitelik bilgileri ya da etiketler birleştirilme tahminlerinden oluşturulur. Bu algoritma ile oluşturulacak model için kullanıcı tarafından belirlenmesi gereken üç parametre mevcuttur. Bunlardan ilki algoritma tarafından 126 gerçekleştirilecek iterasyon sayısıdır. Her bir iterasyonda bir sınıflandırıcı oluşturulur; ancak bu sınıflandırıcının birleşime dahil edilip edilmeyeceğine sonradan karar verilir. DECORATE algoritması gerekli birleşme boyutuna ulaştığında durur. Bu parametre aday sınıflandırıcıların sayısından büyük olmalıdır. İkinci parametre eğitim sırasında kullanılan yapay örneklerin sayısını gösteren yapay boyuttur. Bu parametre eğitim verilerinin bir oranı olarak belirlenir. Üçüncü parametre ise DECORATE birleştirme algoritmasına dahil edilecek aday sınıflandırıcıların sayısı olarak ifade edilen beklenen boyuttur. Algoritma önceden belirlenen bu aday sayısına ulaşmadan da iterasyon sayısına bağlı olarak eğitim işlemini tamamlayabilir. Melville and Money (2004), yaptıkları çalışmada aday sayısının artmasıyla doğruluğun artacağını bununla birlikte daha karmaşık bir model ortaya çıkacağından çözüm süresinin uzayacağını ifade etmişlerdir. Aynı çalışmada yapay boyut parametresinin 0.5–1 arasında ve beklenen boyut parametresin de 10–25 aralığında alacağı değerler ile anlamlı sonuçlara ulaşılacağı ifade edilmiştir. Bu bağlamda her iki veri seti için en uygun yapay boyut ve beklenen boyut parametre değerleri eğitim ve test veri setleri kullanılarak belirlenmiştir. Yapılan değerlendirme sonucunda her iki veri setinin sınıflandırılmasında kullanılacak DECORATE modelleri için en uygun yapay boyut parametresi Landsat ETM+ görüntüsü için 1, Terra ASTER için 0.5 olarak belirlenmiştir. Aynı şekilde eğitim ve test verileri kullanılarak en uygun beklenen boyut parametresi değeri her iki görüntü içinde 10 olarak belirlenmiştir. Gerekli modellerin oluşturulmasında kullanıcı tarafından belirlenmesi gereken son parametre olan iterasyon sayısı her iki görüntü için belirlenen en uygun yapay boyut ve beklenen boyut parametreleri kullanılarak belirlenmiştir. Yapılan değerlendirme sonucunda Landsat ETM+ görüntüsü için iterasyon sayısı 15 ve Terra ASTER görüntüsü için 30 olarak belirlenmiştir. Her iki görüntü için DECORATE algoritması ile oluşturulacak modelde kullanılmak üzere belirlenen en uygun parametre değerleri ve elde edilen genel sınıflandırma doğrulukları Tablo 4.7’de gösterilmiştir. Tablodan da görüleceği üzere en uygun parametre değerleri ile yapılan eğitim sonucu oluşturulan modeller ile her iki görüntü için yaklaşık %89 genel sınıflandırma doğruluğu elde edilmiştir. 127 Tablo 4.7. DECORATE algoritması için belirlenen en uygun parametre değerleri ve elde edilen genel sınıflandırma doğrulukları. Landsat ETM+ * Terra ASTER Y.Boyut= 1; B. Boyut=10; İ.Sayısı= 15 * Y.Boyut= 0.5; B.Boyut=10; İ.Sayısı= 30 Genel Doğruluk (%) Kappa Değeri Genel Doğruluk (%) Kappa Değeri 89.10 0.87 89.11 0.88 * Y.Boyut=Yapay Boyut; B.Boyut=Beklenen Boyut; İ.Sayısı=İterasyon sayısını göstermektedir. Oluşturulan ve geçerliliği test edilen modeller ile Landsat ETM+ ve Terra ASTER görüntüleri sınıflandırılarak Şekil 4.34’te gösterilen tematik haritalar oluşturulmuştur. (a) (b) Şekil 4.34. DECORATE algoritması kullanılarak elde edilen tematik haritalar (a) Landsat ETM+ görüntüsü (b) Terra ASTER görüntüsü 128 4.4.3.4. Yapay Sinir Ağları İle Sınıflandırma Yapay sinir ağları (YSA) ile uydu görüntülerinin sınıflandırılmasında çok katmanlı perseptron ağ yapılarından geriye yayılma öğrenme algoritması kullanılmıştır. Kullanılan YSA geri yayılım algoritmasında giriş katmanı, kullanılan her bir banda karşılık bir yapay nöron gelecek şekilde tasarlanmıştır. Bu yaklaşıma göre 6 banttan oluşan Landsat ETM+ görüntüsü için 6 nöron, 9 bant içeren Terra ASTER görüntüsü için 9 nöron tesis edilmiştir. Çıktı katmanı her iki görüntü içinde arazi örtüsü sınıflarını temsil eden 6 sınıfın (su, yerleşim, toprak-taş, bozkır, iğne yapraklı orman ve geniş yapraklı orman) her birine bir nöron gelecek şekilde tesis edilmiştir. Çok katmanlı persptron ağ yapısında oluşturulacak ağdaki saklı katmanlar ve bu katmanlardaki işlemci düğüm sayısı ağın genelleştirme kabiliyeti açısından önemlidir ve girdi çıktı katmanları arasındaki saklı katman sayısı optimum olmalıdır [Kavzoglu and Mather, 2001]. En uygun saklı katman sayısının belirlenmesinde kesin bir yöntem olmamasına karşın, literatürde kullanılan bir takım yaklaşımlar mevcuttur. Bu tez kapsamında Kanellopoulos and Wilkinson (1997) tarafından önerilen, saklı katmanlardaki düğüm sayısının, sınıflandırılacak verideki bant sayısının iki katı olarak belirlendiği yaklaşım kullanılmıştır. Bu yaklaşımla 6 bantlı Landsat ETM+ görüntüsü için saklı katmanda 12 düğüm, 9 bantlı Terra ASTER görüntüsü için 18 düğüm olarak belirlenmiştir. Sonuç olarak YSA ile eğitimde Landsat ETM+ görüntüsü için 6–12–6; Terra ASTER görüntüsü için 9–18–6 katmanlı yapay sinir ağ yapısı kullanılmıştır. Kullanılacak ağ yapıları belirlenmesinin ardından ağın eğitiminde kullanılacak en uygun ilk ağırlık parametreleri, öğrenme parametreleri ve momentum oranları deneme yanılma yöntemiyle belirlenmeye çalışılmıştır. Oluşturulan ağların eğitiminde ilk ağırlıklar –0.25 ile 0.25 arasında aralığında seçilirken, eğitimin başlangıcında öğrenme oranı 0.3 ve momentum 0.5 olarak belirlenmiştir. Farklı sayıda iterasyonlar sonucunda en uygun parametre değerleri belirlenmiş ve bu parametre değerleriyle oluşturulan yapay sinir ağ modelleri kullanılarak Landsat ETM+ ve Terra ASTER uydu görüntüleri sınıflandırılmıştır. Sınıflandırma sonucu elde edilen tematik haritalar Şekil 4.35’de gösterilmiştir. 129 (a) (b) Şekil 4.35. Yapay sinir ağları kullanılarak elde edilen tematik haritalar. (a) Landsat ETM+ görüntüsü, (b) Terra ASTER görüntüsü 4.4.3.5. K-Star Algoritması İle Sınıflandırma Örnek tabanlı öğrenme algoritmalarından K-star algoritması pikseller arasındaki benzerliğin belirlenmesi için entropik uzaklık fonksiyonu kullanılır. Bu algoritma ile oluşturulacak model için kullanıcı tarafından belirlenmesi gereken tek bir parametre vardır. Bu parametre harmanlama parametresi (b) olarak ifade edilir ve 0 ile 100 arasında değerler almaktadır. Cleary and Trig (1995), bu harmanlama parametresinin 0 değeri alması durumunda en yakın komşuluk algoritması, 100 değerini aldığında ise örneklerin eşit ağırlıklı olduğu bir özellik gösterdiğini ifade etmişlerdir. Landsat ETM+ ve Terra ASTER uydu görüntülerinin K-star algoritması ile sınıflandırılması için oluşturulacak modelde en uygun harmanlama parametresinin belirlenmesi amacıyla her iki veri seti için oluşturulan eğitim ve test veri setleri kullanılmıştır. 130 Şekil 4.36’da Landsat ETM+ görüntüsü için oluşturulacak modelde harmanlama parametresindeki değişimler ve bu parametre değerlerine karşılık gelen genel sınıflandırma doğrulukları gösterilmektedir. Şekilden de görüleceği üzere harmanlama parametresi için 1–30 aralığındaki değerler ile %88’ın üzerinde genel sınıflandırma doğruluğu elde edilirken, bu aralıkta parametre değerinin 10 olduğunda Sınıflandırma Doğruluğu (%) oluşturulan model ile en yüksek sınıflandırma doğruluğuna (%89) ulaşılmıştır. 94 90 89,00 86 82 78 74 1 5 10 40 70 100 Harmanlama Parametresi (b) Şekil 4.36. Landsat ETM+ görüntüsü için harmanlama parametresi ve genel sınıflandırma doğruluğundaki değişimler. Terra ASTER görüntüsü için harmanlama parametresindeki değişimler ve bu değerlere karşılık gelen genel sınıflandırma doğrulukları Şekil 4.37’de gösterilmiştir. Bu veri setinin sınıflandırılması için oluşturulacak K-star modelinde en yüksek Sınıflandırma Doğruluğu (%) sınıflandırma doğruluğunun (%91.41) elde edildiği parametre değeri 9 kullanılmıştır. 96 92 91,41 88 84 80 76 1 5 9 20 40 60 80 100 Harmanlama Parametresi (b) Şekil 4.37. Terra ASTER görüntüsü için harmanlama parametresi ve genel sınıflandırma doğruluğundaki değişimler. 131 K-star algoritması ile yapılacak sınıflandırma öncesi gerekli olan en uygun parametrelerin belirlenmesinin ardından her iki görüntü için modeller oluşturulmuş ve görüntüler sınıflandırılmıştır. Sınıflandırma sonucu çalışma alanını kapsayan 6 arazi örtüsünü gösteren Landsat ETM+ ve Terra ASTER uydu görüntülerine ait tematik haritalar Şekil 4.38’de gösterilmiştir. (a) (b) Şekil 4.38. K-star algoritması kullanılarak elde edilen tematik haritalar. (a) Landsat ETM+ görüntüsü, (b) Terra ASTER görüntüsü. 132 5. SONUÇLAR Uzaktan algılama teknolojileri geniş alanları görüntüleyebilme kabiliyetine sahip olduğundan yeryüzü üzerindeki bilgilerin elde edilmesi amacıyla yapılan uygulamalar için önemli bir veri kaynağıdır. Sınıflandırma sonucu elde edilen tematik haritaların ve sınıflara ait bilgilerin güvenirliği sınıflandırmada kullanılacak yöntem ve elde edilecek sınıflandırma doğruluğu ile ilişkilidir. Bu çalışmada Landsat ETM+ ve Terra ASTER uydu görüntüleri tez kapsamında ayrıntılı olarak incelenen ileri sınıflandırma teknikleri ile sınıflandırılmış ve çalışma alanını temsil eden 6 arazi örtüsü sınıfını gösteren tematik haritalar elde edilmiştir. Bu sınıflandırma yöntemlerinin yanında uygulamada yaygın kullanıma sahip en çok benzerlik yöntemi ile görüntüler sınıflandırılmıştır. Şekil 5.1’de her iki uydu görüntüsünün sınıflandırılmasında kullanılan yöntemler ve elde edilen genel sınıflandırma doğrulukları gösterilmiştir. Sınıflandırma Doğruluğu (% ) 94 93 92 91 90 89 88 87 86 1 2 3 4 5 6 7 8 9 10 11 12 13 Landsat ETM+ 86,95 90,05 90,81 90,90 87,14 87,62 89,60 89,10 89,90 89,29 89,10 90,14 89,00 Terra ASTER 88,00 91,04 92,81 92,15 87,55 87,95 92,00 89,70 92,07 91,19 89,11 90,82 91,41 Sınıflandırma Yöntemleri Şekil 5.1. Landsat ETM+ ve Terra ASTER görüntüsünün sınıflandırılmasında kullanılan yöntemler ve elde edilen genel sınıflandırma doğrulukları. 1: En Çok Benzerlik, 2: Polinom Kernel, 3: Radyal Tabanlı Kernel, 4: PUK, 5: C4.5, 6: C4.5 (Budanmış), 7: Hızlandırma, 8: Torbalama, 9: Çoklu Hızlandırma, 10. Rastgele Orman, 11: DECORATE, 12: Yapay Sinir Ağları, 13: K-star. 133 En çok benzerlik sınıflandırıcısı literatürde geçerliliği kabul gören ve günümüzde uzaktan algılama yazılımlarının içerisinde temel sınıflandırıcı olarak yer alan bir kontrollü sınıflandırma yöntemidir. Matematiksel ifadesinin basit oluşu ve sınıflandırma işlemini gerçekleştirmedeki hızı yöntemin uzaktan algılama alanındaki araştırmacılar tarafından yaygın kullanımını ortaya çıkarmıştır. Ancak yöntemin bir takım istatistiki kabuller gerektirmesi ve işlem sonucunda sınıflandırılamayan piksellerin ortaya çıkması yöntemin sınıflandırma performansını etkilemektedir. Şekil 5.1’den görüleceği üzere her iki uydu görüntüsünün sınıflandırılması sonucunda ile elde edile en düşük genel sınıflandırma doğrulukları en çok benzerlik yöntemiyle elde edilmiştir. Kullanılan metotların veri setleri için aynı trendi göstermeleri yapılan uygulamadaki sistematiğin doğruluğunun bir göstergesi olarak düşünülebilir. Metotların birbirinden farklı veri setleri için yaklaşık olarak aynı performansı gösterdiğinden, söz konusu yöntemlerin veriden bağımsız oldukları söylenebilir. Her iki uydu görüntüsü için elde edilen genel sınıflandırma sonuçlarının gösterildiği şekil incelendiğinde kullanılan yöntemler arasında destek vektör makinelerinin sınıflandırma performansının diğerlerine göre daha yüksek olduğu görülmektedir. Destek vektör makineleri sınıflar arasında en uygun hiper düzlemin belirlenmesi prensibine dayalı bir öğrenme algoritmasıdır. Uzaktan algılanmış görüntülerde olduğu gibi doğrusal olmayan ve ikiden fazla sınıfa ait verilerin sınıflandırılması probleminin çözümünde kernel fonksiyonlarından yararlanmaktadır. Bu nedenle kernel fonksiyonun seçimi ve seçilen kernel fonksiyonuna ait en uygun parametre değerlerinin belirlenmesi yöntemin sınıflandırma performansı açısından önemlidir. Tez kapsamında kullanılan kernel fonksiyonları (polinom, radyal tabanlı kernel ve Pearson VII) Bölüm 4’te ayrı ayrı değerlendirilmiş ve sınıflandırma performansları analiz edilmiştir. Kullanılan üç fonksiyon bir arada değerlendirildiğinde birkaç önemli husus göze çarpmaktadır. Bunlardan ilki radyal tabanlı kernel ve Pearson VII (PUK) fonksiyonları ile polinomal fonksiyona göre Landsat ETM+ görüntüsü için yaklaşık %0.5 ve Terra ASTER görüntüsü için yaklaşık %2 daha iyi sınıflandırma doğruluğuna ulaşılmıştır. İkinci olarak söz konusu kernel fonksiyonları için sınıflandırma öncesinde kullanıcı tarafından belirlenmesi gereken parametrelerle ilgili analizlerdir. Pearson VII fonksiyonu, radyal tabanlı kernel fonksiyonu ile yakın sınıflandırma sonuçları üretmesine karşın sınıflandırma öncesinde üç farklı 134 parametrenin belirlenmesini gerektirmektedir. Bu parametrelerin sınıflandırma doğruluğuna direkt etkileri olduğu düşünülürse en uygun parametre değerlerinin belirlenmesi için gerekli süre artacaktır. Radyal tabanlı kernel ve polinom kernel fonksiyonları kullanıcı tarafından belirlenmesi gereken iki parametre değerine sahiptirler. Radyal tabanlı kernelin gamma ve polinom kernel kullanılacak polinomun derecesi iki önemli parametredir. Gama parametresinin sınıflandırma doğruluğu üzerindeki etkisinin polinomun derecesine göre daha az olduğu gözlemlenmiştir. Polinom derecesi arttıkça matematiksel olarak daha karmaşık bir fonksiyon elde edileceğinden hesaplama zorluğu dolayısıyla çözüm için gerekli süre artmaktadır. Kernel fonksiyonları ile ilgili elde edilen bu sonuçlar kernel fonksiyonu ve fonksiyona ait parametre seçimlerinin DVM ile yapılacak sınıflandırma öncesinde dikkate alınması gereken bir durum olduğunu göstermektedir. Kernel parametre değerleri sınıflandırmaya esas olan veri setine göre değişiklik gösterdiğinden en yüksek performansın hangi parametre çiftleri ile elde edileceği önceden bilinmemektedir. Bu nedenle kernel fonksiyonu seçiminde, seçilecek fonksiyona ait parametrelerin sınıflandırma performansına etkisi dikkate alınmalıdır. Buna ek olarak en uygun parametrelerin belirlenmesi için kullanılacak yöntem diğer önemli bir husustur. Tez kapsamında incelenen kernel fonksiyonları ile ilgili yapılan analizler ışığında destek vektör makineleri ile yapılacak sınıflandırmada öncesinde kernel fonksiyonu seçiminde öncelikli olarak radyal tabanlı kernelin tercih edilebileceği sonucuna ulaşılmaktadır. Karar ağaçları iş akışı şemalarına benzer yapılarıyla ifade edilmesi ve anlaşılması kolay bir sınıflandırma yöntemidir. Karar ağacı oluşumunda en önemli hususlardan biriside ağacın budanması işlemidir. Tez kapsamında kullanılan uydu görüntüleri için C4.5 algoritması ile oluşturulan karar ağacının ön budama yöntemiyle budanması ile ağaç yapısındaki yaparak ve dal sayısında Landsat ETM+ görüntüsü için yaklaşık %57 ve Terra ASTER görüntüsü için %11’lik bir sadeleşme olmuştur. Budama ile elde edilen sadeleşmiş ve basitleşmiş bu modeller ile sınıflandırma için gerekli süre azalmıştır. Bunun yanında budama ile elde edilen 135 modeller ile yapılan sınıflandırma sonuçlarında yaklaşık %1’lik bir iyileşme olduğu görülmüştür. Son yıllarda literatürde karar ağaçlarının sınıflandırma performansını arttırmaya yönelik geliştirilen çeşitli iyileştirme algoritmaları mevcuttur. Tez çalışmasında söz konusu iyileştirme algoritmalarından hızlandırma, torbalama, çoklu hızlandırma, rastgele orman ve DECORATE algoritmaları kullanılarak C4.5 karar ağacı algoritması ile elde edilen sınıflandırma performansındaki değişimler naliz edilmiştir. Şekil 5.1’den de görüleceği üzere karar ağaçlarının tekil kullanımından ziyade bir iyileştirme algoritması ile kullanımı sonucunda sınıflandırma performansında Landsat ETM+ görüntüsü için ortalama %2 ve Terra ASTER görüntüsü için ortalama %3’lük iyileşmeler olmuştur. Kullanılan iyileştirme algoritmaları da sınıflandırma öncesinde birtakım parametrelerin belirlenmesini gerektirmektedir. Kullanılan algoritmalar arasında üç farklı parametreye sahip DECORATE algoritması ile karar ağacı sınıflandırma performansında en düşük iyileşme (yaklaşık %1) elde edilmiştir. Diğer algoritmalar kullanıcı tarafından belirlenecek iki parametreye sahip olmakla beraber özellikle hızlandırma ve çoklu hızlandırma algoritmaları ile sınıflandırma doğruluğunda yaklaşık %3’lük iyileşme elde edilmiştir. Elde edilen sonuçlar budama yöntemleri kullanılarak sadeleştirilmiş karar ağaçlarının bir sınıflandırma probleminin çözümünde tekil olarak kullanılmalarından ziyade bir iyileştirme algoritması kullanılmasının beklenen sınıflandırma doğruluğunu olumlu yönde etkileyeceği söylenebilir. Yapay sinir ağları (çok katmanlı perseptron) literatürde uzaktan algılanmış görüntülerin sınıflandırılmasında kullanılan parametrik olmayan bir yapıya sahip, güçlü ve etkili bir sınıflandırıcıdır. YSA yapıları itibariyle karmaşık ve matematiksel olarak ifadesi zor olan bir algoritma kullanmakta, bu özellikleriyle kara-kutu algoritmalar olarak da adlandırılmaktadırlar. Uygun ağ yapısının belirlenmesi, ağın başlangıç ağırlık değerleri, öğrenme oranı, iterasyon sayısı, momentum gibi sınıflandırma doğruluğunu direkt olarak etkileyen parametrelere sahiptir. Ağın eğitimi ve sınıflandırmada kullanılacak YSA modelinin oluşturulmasında en uygun parametre değerlerinin belirlenmesinde kullanılan bir yöntem olmaması yaşanan en büyük problemdir. Bu parametreler eğitim ve test verileri kullanılarak deneme yoluyla belirlenebildiğinden, bu konuda deneyim sahibi olmak önemlidir. 136 Öğrenme tabanlı sınıflandırıcılardan K-Star algoritması örnekler arasındaki benzerliğin belirlenmesinde bilgi teorisine dayanan entropik uzaklık fonksiyonunu kullanmaktadır. Literatürde bu konu üzerine yapılan çalışmalar incelendiğinde söz konusu K-star algoritmasının farklı sınıflandırma problemlerinde kullanılmakta iken tez kapsamında uzaktan algılanmış görüntülerin sınıflandırılması probleminde kullanımı incelenmiştir. Bu açıdan algoritmanın uzaktan algılamada kullanımı açısından elde edilen sonuçlar önemlidir. K-star algoritmasının kullanımında kullanıcı tarafından belirlenmesi gereken tek parametre harmanlama parametresidir. Harmanlama parametresi 1 ile 100 aralığında değerler almaktadır. 1 değeri için en yakın komşuluk algoritması 100 değeri içinse örneklerin eşit ağırlığa sahip olduğu durumlar elde edilmektedir. Tek bir parametre değerine sahip oluşu ve söz konusu parametrenin dar bir aralıkta değerler alması K-star algoritmasının kullanımındaki en önemli avantajlardır. Bununla birlikte en uygun harmanlama parametresi kullanılarak modelin eğitimi için gerekli süre, modelin test edilmesi için gerekli süreden çok daha uzun olduğu gözlemlenmiştir. Bu durum tüm uydu görüntüsünün sınıflandırılması sırasında da yaşanmıştır. Sınıflandırma için gerekli olan sürenin diğer yöntemlere göre uzun olması K-star algoritmasının olumsuz yönüdür. K-star ile elde edilen sınıflandırma sonuçları incelendiğinde başta en çok benzerlik sınıflandırıcısı olmak üzere tez kapsamında kullanılan bir çok sınıflandırıcıdan daha yüksek sınıflandırma doğruluğu elde edilmiştir. Bu çalışmada kullanılan uydu görüntüleri farklı tarihlerde (1997 ve 2002) algılanmış olduğundan zamansal bir çözünürlüğe sahiptir. Çalışma alanı olarak belirlenen Gebze ilçesinin yoğun sanayi alanlarını içerisinde barındırması, İstanbul iline yakınlığı ve taşımacılık açısından önemli yollar üzerinde bulunması bölgenin yoğun bir nüfus ve yapılaşma baskısı altında olmasına neden olmuştur. Bu açıdan 1997 ve 2002 yılları arasındaki 5 yıllık bir süre içerisinde çalışma alanındaki arazi kullanımında meydana gelen değişimler belirlenmiş ve analiz edilmiştir. Arazi kullanımındaki değişimlerin belirlenmesi amacıyla en yüksek sınıflandırma doğruluğunun elde edildiği radyal tabanlı kernel fonksiyonu ile elde edilen sınıflandırma sonuçları kullanılmıştır. Tablo 5.1’de Landsat ETM+ ve Terra ASTER görüntüleri üzerinden belirlenen altı arazi örtüsü sınıfının çalışma alanında kapladıkları alanlar ve 1997–2002 yılları arasında çalışma alanındaki arazi kullanımında meydana gelen değişimler gösterilmektedir. Tablodan görüleceği üzere 137 beş yıllık süreç içerisinde çalışma alanında yaklaşık %30’luk bir şehirleşme artışı yaşanmıştır. Yerleşim sınıfındaki pikseller 1997 yılında 71.72 km2 iken 2002 yılında bu piksellerin kapladığı alan 92.34 km2 olmuştur. Şehirleşmenin özellikle iğne yapraklı ağaçların ve bozkırların kapsadığı alanlar üzerinde yaşandığı görülmüştür. Tablo 5.1 incelendiğinde çalışma bölgesindeki geniş yapraklı ağaçların kapsadığı alanların beş yıl gibi kısa bir süreç içerisinde yaklaşık %15 azaldığı görülmektedir. Bu durum bölgenin sürdürülebilir çevresel yapısı açısından önemli olan arazi bozulmalarını ve çevresel problemlerin seviyesini göstermektedir. Tabloda 1997 ve 2002 yılları arasında su alanlarında %2’lik bir artış yaşandığı görülmektedir. Uygulama öncesinde sınıflandırmaya esas olacak arazi örtüsü sınıfları belirlenirken su olarak genelleştirilen sınıf içerisinde denizler, göller, akarsular ve barajlar gibi yaklaşık olarak aynı spektral özelliklere sahip alanlar tek bir sınıf altında toplanmıştır. Su alanlarındaki söz konusu değişimin çalışma alanında 5 yıllık süreç içerisinde tamamlanan baraj alanlarının içerdiği su kütleleri ve akarsu yataklarındaki su miktarlarındaki değişimden kaynaklanabileceği düşünülmektedir. Tablo 5.1. 1997 ve 2002 yıllarında arazi kullanımında meydana gelen değişimlerin analizi. Arazi Kullanım Sınıfları 1997 2002 Kapladığı Alan Kapladığı Alan 2 2 1997–2002 Değişim 2 km % km % km % Su 44.85 9.97 45.95 10.21 1.10 2.46 Geniş Yapraklı 22.27 4.95 18.97 4.22 -3.30 -14.82 İğne Yapraklı 65.29 14.51 54.48 12.10 -10.82 -16.56 Bozkır 227.72 50.60 219.62 48.80 -8.10 -3.56 Toprak-Taş 18.18 4.04 18.68 4.15 0.50 2.72 Yerleşim 71.72 15.94 92.34 20.52 20.62 28.75 Uzaktan algılama görüntülerinin sınıflandırılması ile elde edilen tematik haritaların güncel ve doğru bir şekilde üretilmesi yapılacak yorum ve değerlendirmelerle alınacak kararlar açısından çok büyük önem taşımaktadır. Tez 138 kapsamında incelenen ileri sınıflandırma teknikleri bu amaç için geliştirilen ve literatürde bir çok araştırmacının üzerinde yoğunlaştığı alanlardan birisidir. Elde edilen sonuçlar ileri sınıflandırma teknikleri kullanılarak hesaplanan genel sınıflandırma doğruluklarının standart sınıflandırıcı olarak kabul gören en çok benzerlik sınıflandırıcısına göre yaklaşık %4 daha iyi olduğunu göstermektedir. Tez kapsamında kullanılan uydu görüntülerinin piksel bazında 500039, alansal olarak yaklaşık 450 km2’lik bir alanı kapsadığı düşünüldüğünde sınıflandırma doğruluğundaki %4’lük artışın yaklaşık 20.000 pikselin, dolayısıyla yaklaşık 18 km2’lik alanın doğru sınıflandırılan alanlara ilave olacağı söylenebilir. Genel sınıflandırma doğruluğundaki %4’lük iyileşmenin piksel bazında ve alansal olarak karşılığı kullanılan ileri sınıflandırma tekniklerinin sınıflandırmadaki önemini ve etkinliğini ortaya koymaktadır. Bununla birlikte tüm bu teknikler kullanıcı tarafından belirlenmesi gereken ve sınıflandırma doğruluğuna çeşitli derecede etki eden parametrelerin belirlenmesini gerektirmektedir. Bu durum söz konusu ileri sınıflandırma teknikleri kullanımında bir deneyim gerektirdiğini göstermektedir. Her iki uydu görüntüsünün sınıflandırılması sonucu elde edilen sınıflandırma sonuçları, özellikle yüksek genelleştirme kabiliyetine sahip destek vektör makinelerinin uzaktan algılanmış görüntülerinin sınıflandırmasında kullanılabilecek etkili ve alternatif bir yöntem olduğunu göstermektedir. 139 KAYNAKLAR 1. Aha, D.W., 1992. Tolerating noisy, irrelevant and novel attributes in instance-based learning algorithms. International Journal of Man-Machine Studies, 36, 267–287. 2. Aha, D.W., 1997. Lazy learning. Artificial Intelligence Review, 11, 7–10. 3. Aha, D.W., Kibler, D. and Albert, M.K., 1991. Instance-based learning algorithms. Machine Learning, 6, 37–66. 4. Altuntaş, C. ve Çorumluoğlu, Ö., 2002. Uzaktan algılama görüntülerinde digital görüntü işleme ve RSImage yazılımı, Selçuk Üniversitesi Jeodezi ve Fotogrametri Mühendisliği Öğretiminde 30. Yıl Sempozyumu, Konya, Bildiriler Kitabı, 434-442 5. Altun, H. and Curtis, K.M., 1998. Exploiting the statistical characteristic of the speech signals for an improved neural learning in a MLP neural network. Neural Networks for Signal Processing, 598, 547-556. 6. Atkinson, P. M. and Tatnall, A. R. L., 1997. Neural networks in remote sensing. International Journal of Remote Sensing, 18, 699–709. 7. Ayhan, E., 2003. KTÜ Uzaktan Algılama Ders Notları (yayınlanmamış), KTÜ, Lisans Programı, Trabzon. 8. Ayhan, E., Karslı, F. ve Tunç E., 2003. Uzaktan algılanmış görüntülerde sınıflandırma ve analiz, Harita Dergisi, 130, 32–46. 9. Bauer, E. and Kohavi, R., 1999. An empirical comparison of voting classification algorithms: bagging, boosting and variants. Machine Learning, 36, 105–139. 10. Blamire, P.A., 1994. An investigation into the identification and classification of urban areas from remotely sensed satellite data using neural Networks. MSc Thesis, Edinburgh University, UK. 140 11. Boser, B. E., Guyon, I. M. and Vapnik, V., 1992. A training algorithm for optimum margin classifiers. In Fifth Annual Workshop on Computational Learning Theory, Pittsburgh, ACM. 12. Breiman, L., 1996. Bagging predictors. Machine Learning, 24, 123–140. 13. Breiman, L., 2001. Random forests. Machine Learning, 45, 5-32. 14. Breiman, L., Friedman, J.H., Olshen, R.A. and Stone, C.J., 1984. Classification and regression trees, Monterey, CA: Wadsworth. 15. Brodley, C.E. and Utgoff, P.E., 1995. Multivariate decision trees. Machine Learning, 19, 45-77. 16. Burges, C.J.C., 1998. A tutorial on support vector machines for pattern recognition. Data Mining and Knowledge Discovery, Kluwer Academic Publishers, 2, 121-167. 17. Campbell, J.B., 1996. Introduction to remote sensing, Second Edition, The Guilford Press, New York, USA. 18. Cleary, J. G. and Trigg, L. E., 1995. K*: An instance-based learner using an entropic distance measure. Proceedings of the 12th International Conference on Machine Learning, 108–114. 19. Cortes, C. and Vapnik, V., 1995. Support-vector network. Machine Learning, 20, 273–297. 20. Cover, T. M. and Hart, P. E.,1967. Nearest neighbor pattern classification. IEEE Transactions on Information Theory, 21–27. 21. Crammer, K. and Singer, Y., 2001. On the algorithmic implementation of multiclass kernel-based vector machines. Journal of Machine Learning Research, 2, 265-292. 22. Dasarathy, B. V., 1991. Nearest neighbor (NN) norms: NN pattern classification techniques. Los Alamitos, CA: IEEE Computer Society Press. 141 23. Debnath, R., Takahide, N. and Takahashi, H., 2004. A decision based oneagainst-one method for multi-class support vector machine. Pattern Analysis & Applications, 7, 164–175. 24. DeFries, R. S., Hansen, M., Townshend, J. R. G. and Sohlberg, R., 1998. Global land cover classifications at 8km spatial resolution: the use of training data derived from Landsat imagery in decision tree classifiers. International Journal of Remote Sensing, 19, 3141–3168. 25. Demirci, D.A., 2007. Destek vektör makineleri ile karakter tanıma. Yüksek Lisans Tezi, Yıldız Teknik Üniversitesi Fen Bilimleri Enstitüsü, İstanbul. 26. Dickson, S., Thomas, B.T. and Goddard, P., 1997. Using neural networks to automatically detect brain tumours in MR images. International Journal of Neural Systems, 8, 91-99. 27. Diday, E., 1974. Recent progress in distance and similarity measures in pattern recognition. Second International Joint Conference on Pattern Recognition, 534–539. 28. Dietterich, T. G., 2000. An experimental comparison of three methods for constructing ensembles of decision trees: bagging, boosting, and randomization. Machine Learning, 40, 139 - 157. 29. Dietterich, T., 2002. The handbook of brain theory and neural networks. The MIT Press, Ch. Ensemble Learning, 405-408. 30. Dixon, B. and Candade, N., 2008. Multispectral landuse classification using neural networks and support vector machines: one or the other, or both? International Journal of Remote Sensing, 29,1185-1206. 31. Efron, B. and Tibshirani, R.J., 1993. An introduction to the bootstrap. London: Chapman and Hall. 32. Erdas, 2008. Erdas Imagine 9.2 Field Guide. 33. Fletcher, R., 2000. Practical methods of optimization. 2nd Edition, John Wiley & Sons, Chichester. 142 34. Foody, G.M., 1995. Using prior knowledge in artificial neural-network classification with a minimal training set. International Journal of Remote Sensing, 16, 301-312. 35. Foody, G.M. and Mathur A., 2004. A relative evaluation of multiclass image classification by support vector machines. IEEE Transactions on Geoscience and Remote Sensing, 42, 1335–1343. 36. Freund, Y. and Schapire, R. E., 1996. Experiments with a new boosting algorithm. In: Saitta, L. (Ed.), Proceedings of the Thirteenth International Conference on Machine Learning (ICML-96). Morgan Kaufmann, 148-156. 37. Friedl, M.A. and Brodley, C.E., 1997. Decision tree classification of land cover from remotely sensed data. Remote Sensing of Environment, 61, 399–409. 38. Gelfand, S.B., Ravishankar, C.S. and Delp, E.J., 1991. An iterative growing and pruning algorithm for classification tree design. IEEE Transactions on Pattern Analysis and Machine Intelligence, 13, 163-174. 39. Giacinto, G. and Roli, F., 1997. Ensembles of neural networks for soft classification of remote sensing images, Proceedings of the European Symposium on Intelligent Techniques, European Network for Fuzzy Logic and Uncertainty Modelling in Information Technology, Bari, Italy, 166170. 40. Gibson, P.J., 2000. Introductory remote sensing: Principles and concepts. Routledge publishers, London. 41. Giles, C.L., Lawrence, S. and Tsoi, A.C., 1997. Rule inference for financial prediction using recurrent neural networks. Proceedings of the IEEE/IAFE 1997 Computational Intelligence for Financial Engineering (CIFER), 307, 253-259. 42. Göksel, Ç., 1996. Elmalı ve Alibey su havzalarının uydu görüntü verileriyle izlenmesi ve bilgi sistemi oluşturma olanakları, Doktora Tezi, İstanbul. 143 43. Hall, F. G., Townshend, J. R. and Engman, E. T., 1995. Status of remote sensing algorithms for estimation of land surface state parameters. Remote Sensing of Environment, 51, 138–156. 44. Hansen, L. and Salamon, P., 1990. Neural network ensembles. IEEE Transactions on Pattern Analysis and Machine Intelligence, 12, 993–1001. 45. Hansen, M., Dubayah, R. and DeFries, R., 1996. Classification trees: an alternative to traditional land cover classifiers. International Journal of Remote Sensing, 17, 1075–1081. 46. Hansen, M., DeFries, R. S., Townshend, J. R. G. and Sohlberg, R., 2000. Global land cover classification at 1km spatial resulution using a classification tree approach. International Journal of Remote Sensing, 21, 1331–1364. 47. Hashem, S., 1997. Optimal linear combinations of neural networks. Neural Networks, 10, 599–614. 48. Hastie, T. J. and Tibshirani, R. J., 1998. Classification by pairwise coupling. Advances in Neural Information Processing Systems. (Jordan, M. I., Kearns, M. J., and Solla, S. A., eds.), 10, The MIT Press. 49. Heisele, B., Serre, T., Prentice, S. and Poggio, T., 2003. Hierarchical classification and feature reduction for fast face detection with support vector machines. Pattern Recognition, 36, 2007-2017. 50. Hewitson, B.C. and R.G. Crane, 1994. Neural computing: applications in geography. Kluwar Academic Publishers, Dordrecht. 51. Hong, J., Min, J., Cho, U. and Cho, S., 2008. Fingerprint classification using one-vs-all support vector machines dynamically ordered with naïve Bayes classifiers. Pattern Recognition, 41, 662-671. 52. Huang, C., Davis, L. S. and Townshed, JRG., 2002. An assessment of support vector machines for land cover classification. International Journal of Remote Sensing, 23, 725–749. 144 53. Hullermeier, E., 2003. Possibilistic instance-based learning. Artificial Intelligence, 335-383. 54. Hsu, C.W., Chang, C.C. and Lin, C.J., 2008. A practical guide to support vector classification. http://www.csie.ntu.edu.tw/~cjlin/papers/guide/guide.pdf. 55. Jehnsen, J.R., 1996. Introductory digital image processing: A remote sensing perspective, Prentice Hall, New Jersey. 56. Jensen, J.R., 2000. Remote sensing of the environment: An Earth resource perspective, Prentice Hall, New Jersey. 57. Joachims, T., 1998. Text categorization with support vector machines— learning with many relevant features. In Proceedings of European Conference on Machine Learning, 137-142. 58. Kanellopoulos, I. and Wilkinson, G.G., 1997. Strategies and best practice for neural network image classification. International Journal of Remote Sensing, 18, 711-725 59. Kansu, O., 2006. Uzaktan algılamada görüntü sınıflandırma yöntemleri analizi. Yüksek Lisans Tezi, KTÜ Fen Bilimleri Enstitüsü, Trabzon. 60. Kavzoglu, T. and Mather, P.M., 2003. The use of backpropagating artificial neural networks in land cover classification. International Journal of Remote Sensing, 24, 4907-4938. 61. Kavzoglu, T. and Reis, S., 2008. Performance analysis of maximum likelihood and artificial neural network classifiers for training sets with mixed pixels. GIScience & Remote Sensing, 45, 330-342. 62. Kavzoğlu, T. ve Çetin, M., 2005. Gebze bölgesindeki sanayileşmenin zamansal gelişiminin ve çevresel etkilerinin uydu görüntüleri ile incelenmesi. TMMOB Harita ve Kadastro Mühendisleri Odası, 10. Türkiye Harita Bilimsel ve Teknik Kurultayı, Ankara. 145 63. Kavzoglu, T., 2001. An investigation of the design and use of feed-forwad artificial neural Networks in the classification of remotely sensed images. PhD Thesis, Nottingham University, UK. 64. Kavzoğlu, T., 2008. Uzaktan algılama ve uygulamaları ders notları (yayınlanmamış), G.Y.T.E , Yüksek Lisans Programı, Gebze. 65. Kavzoglu, T., 2009, Increasing the accuracy of neural network classification using refined training data. Environmental Modelling & Software, 24, 850-858 66. Kechman, V., 2001. Learning and soft computing. MIT. 67. Keerthi, S. and Lin, C. J., 2003. Asymptotic behaviors of support vector machines with gaussian kernel. Neural Computation, 15, 1667–1689. 68. Kim, B. and Landgrebe, D. A., 1991. Hierarchical classifier design in highdimensional, numerous class cases. IEEE Transactions on Geoscience and Remote Sensing. 29, 518-528. 69. Knerr, S., Personnaz, L. and Dreyfus, G., 1990. Single-layer learning revisited: A stepwise procedure for building and training neural network. Neurocomputing: Algorithms, Architectures and Applications, NATO ASI, Berlin: Springer-Verlag. 70. Kononenko, I. and Hong, S.J., 1997. Attribute selection for modelling. Future Generation Computer Systems, 13, 181-195. 71. Krogh, A. and Vedelsby, J., 1995. Neural network ensembles, cross validation, and active learning. In Tesauro, G., Touretzky, D., & Leen, T. (Eds.), Advances in Neural Information Processing Systems, 7, 231–238 Cambridge, MA. MIT Press. 72. Landeweerd, G.H., Timmers, T., Gelsema, E.S., Bins, M. and Halie, M.R., 1983. Binary-Tree Versus Single Level Tree Classification of White BloodCells. Pattern Recognition, 16, 571-577. 146 73. Lee, Y., Lin, Y. and Wahba, G., 2001. Multicategory support vector machines. Tech.Rep. 1043, Department of Statistics, University of Wisconsin, Madison, WI. 74. Lillesand, T.M. and R.W. Kiefer. 1994. Remote sensing and photo interpretation. 3rd. Edition, John Wiley & Sons: New York. 75. Lillesand, T.M., Kiefer, R.W. and Chipman, J.W., 2007. Remote sensing and image interpretation. 6th Edition, John Wiley & Sons: New York. 76. Lin, K.M and Lin C.J., 2003. A study on reduced support vector machines. IEEE Transactions on Neural Networks, 6, 1449-1459. 77. Lippman, R. P., 1987. An introduction to computing with neural nets. IEEE ASSP Magazine, 4, 2–22. 78. Liu, C., Nakashima, K., Sako, H. and Fujisawa, H., 2003. Handwritten digit recognition: bench-marking of state-of-the-art techniques. Pattern Recognition, 36, 2271–2285. 79. Lu, D. and Weng, Q., 2007. A survey of image classification methods and techniques for improving classification performance. International Journal of Remote Sensing, 28, 823–870. 80. Maclin, R. and Opitz, D., 1997. An empirical evaluation of bagging and boosting. In: Proceedings of the Fourteenth National Conference on Artificial Intelligence. AAAI Press, Providence, RI, 546-551. 81. Maktav, D. ve Sunar, F., 1991. Uzaktan algılama: Kantitatif yaklaşım. Hürriyet Ofset A.Ş., İstanbul. 82. Mather, P.M., 1987. Computer processing of remote-sensed images. John Wiley and Sons Ltd. 83. Mathur, A. and Foody, G.M., 2008a. Multiclass and binary SVM classification: Implications for training and classification users. IEEE Geoscience and Remote Sensing Letters 5, 241-245. 147 84. Mathur A. and Foody, G.M.., 2008b. Crop classification by support vector machine with intelligently selected training data for an operational application. International Journal of Remote Sensing, 29, 2227–2240. 85. Melgani, F. and Bruzzone, L., 2004. Classification of hyperspectral remote sensing images with support vector machines. IEEE Transactıons on Geoscience and Remote Sensing, 42, 1778–1790. 86. Melville, P. and Mooney, R.J. 2004a. Creating diversity in ensembles using artificial, In: Information Fusion: Special Issue on Diversity in Multiclassifier Systems, 6, 99–111. 87. Melville, P., Shah, N., Mihalkova, L. and Mooney, R. J., 2004b. Experiments on ensembles with missing and noisy data. In: Proceedings of the Workshop on Multi Classifier Systems, 293-302, Italy. 88. Michalski, R. S., Stepp, R. E. and Diday, E., 1981. In L. N. Kanal and Azriel Rosenfeld (Eds.). A recent advance in data analysis: clustering objects into classes characterized by conjunctive concepts. Progress in Pattern Recognition, New York: North-Holland, 1, 33–56. 89. Milgram J, Cheriet M. and Sabourin, R., 2006. One against one or one against all: which one is better for handwriting recognition with SVMs? 10th International Workshop on Frontiers in Handwriting Recognition (IWFHR 2006). http://www.livia.etsmtl.ca/publications/ 90. Mingers, J., 1989. An empirical comparison of pruning methods for decision tree induction. Machine Learning, 4, 227–243. 91. Murthy, S. K., Kasif, S. and Salzberg, S., 1994. A system for induction of oblique decision trees. Journal of Artificial Intelligence Research, 2, 1-32. 92. Nadler, M. and Smith, E. P. 1993. Pattern recognition engineering. Wiley: New York. 148 93. Okamoto, S. and Yugami, N., 2003. Effects of domain characteristics on instance-based learning algorithms. Theoretical Computer Science, 207233. 94. Opitz, D. and Maclin R., 1999. Popular ensemble methods: An empirical study. Journal of Artificial Intelligence Research, 11, 169–198. 95. Opitz, D. and Shavlik, J., 1996. Actively searching for an effective neuralnetwork ensemble. Connection Science, 8, 337–353. 96. Oommen, T., Misra, D., Twarakavi, N.K.C., Prakash, A., Sahoo, B. and Bandopadhyay, S., 2008. An objective analysis of support vector machine based classification for remote sensing. Mathematical Geosiences 40, 409– 424. 97. Örmeci, C., 1987. Uzaktan algılama (Temel esaslar ve algılama sistemleri), İTÜ yayınları, cilt 1, no: 1345, İTÜ Matbaası, İstanbul. 98. Osuna, E. E., Freund, R. and Girosi, F., 1997. Support vector machines: training and applications, http://cbcl.mit.edu/cbcl/publications/ai- publications/1500-1999/AIM-1602.ps (10.05.2008). 99. Özkan, C., 1998. Uzaktan algılama verileriyle orman yangını analizi, Yüksek Lisans Tezi, İTÜ Fen Bilimleri Enstitüsü, İstanbul. 100. Özkan, C., 2001. Uydu görüntü verisinin yapay sinir ağları ile sınıflandırılması, Doktora tezi, İTÜ Fen Bilimleri Enstitüsü, İstanbul. 101. Özkan, Y., 2008. Veri madenciliği yöntemleri. Papatya yayıncılık eğitim, İstanbul, 216 s. 102. Pal, M., 2005a. Multiclass approaches for support vector machine based land cover classification. In Proceedings of Map India, 8th Annual International Conference and Exhibition in the Field of GIS, GPS, Arial Photography, and Remote Sensing, New Delhi. Available online at: www.mapindia.org/2005/papers/pdf/54.pdf (22.10.2008). 103. Pal, M., 2005b. Random forest classifier for remote sensing classification. International Journal of Remote Sensing, 26, 217-222. 149 104. Pal, M. and Mather, P.M., 2003. An assessment of the effectiveness of decision tree methods for land cover classification. Remote Sensing of Environment, 86, 554-565. 105. Pal, M. and Mather, P.M., 2005. Support vector machines for classification in remote sensing. International Journal of Remote Sensing, 26, 1007–1011. 106. Pal, M., 2002. Factors influencing the accuracy of remote sensing classifications: a comparative study. PhD thesis, University of Nottingham. 107. Paola, J. D., and Schowengerdt, R. A., 1995. A review and analysis of backpropagation neural networks for classification of remotely sensed multi-spectral imagery. International Journal of Remote Sensing, 16, 3033– 3058. 108. Pearson, K., 1895. Contributions to the mathematical theory of evolution, II: skew variation in homogeneous material, Philosophical Transactions of the Royal Society of London, 186, 343-414. 109. Piramuthu, S. and Sikora, R.T., 2009. Iterative feature construction for improving inductive learning algorithms. Expert Systems with Applications, 3401-3406. 110. Platt, J. C., Cristianini, N., and Shawe-Taylor, J., 2000. Large margin DAGs for multiclass classification. In S. A. Solla, T. K. Leen, and K. –R. Müller, eds., Advance in Neural Information Processing Systems, The MIT Press, 12, 547-553. 111. Quinlan, J. R., 1987. Simplifying decision trees. International Journal of Man-Machine Studies, 27, 221-234. 112. Quinlan, J. R., 1990. Decision tree and decision making. IEEE Transactions on Systems, Man, and Cybernetics, 20, 339-346. 113. Quinlan, J. R., 1993. C4.5: Programs for Machine Learning. Morgan Kaufmann Publishers, San Mateo, CA. 150 114. Quinlan, J. R., 1996. Bagging, boosting, and C4.5. In: Proceedings of the Thirteenth National Conference on Artificial Intelligence (AAAI-96). Portland, OR, 725-730. 115. Richards, J.A., 1993. Remote sensing digital image analysis: An introduction, Second Edition, Springer-Verlag, Berlin. 116. Roli, F., Giacinto, G. and Vernazza, G., 1997. Comparison and combination of statistical and neural networks algorithms for remote-sensing image classification. Neurocomputation in Remote Sensing Data Analysis, Austin, J., Kanellopoulos, I., Roli, F. and Wilkinson G. (Eds.), Berlin: SpringerVerlag, 117-124. 117. Sabins, F.F., 1987. Remote sensing: Principles and interpretation. Freeman, New York. 118. Safavian, S. R. and Landgrebe, D., 1991. A survey of decision tree classifier methodology. IEEE T ransactions on Systems, Man, and Cybernetics, 21, 660–674. 119. Sarle, W.S., 2008. Neural Network FAQ, (ftp://ftp.sas.com/pub/neural/ FAQ.html). 120. Schapire, R. E., 1999. Theoretical views of boosting and applications. In: Proceedings of the Tenth International Conference on Algorithmic Learning Theory, 13 – 25. 121. Schölkopf, B. and Smola, A. J., 2002. Learning with Kernels – Support Vector Machines, Regularization, Optimization and Beyond. Cambridge, MA: The MIT Press. 122. Sesören, A., 1999. Uzaktan algılamada temel kavramlar. Mart Matbaacılık Sanatları Ltd. Şti., İstanbul. 123. Shannon, C.E., 1948. A mathematical theory of communication. Bell System Technical Journal, 27, 379-423. 151 124. Sherrod, P. H., 2003. Classification and regression trees and support vector machines for predictive modeling and forecasting. http://www.dtreg.com/ (12.06.2008). 125. Su, L., Chopping M.J., Rango, A., Martonchik, J.V. and Peters, D.P.C., 2007. Support vector machines for recognition of semi-arid vegetation types using MISR multi-angle imagery. Remote Sensing of Environment, 107, 299–311. 126. Süslü, A., 2007. Şereflikoçhisar ilçesindeki tarım arazilerinde uzaktan algılama yöntemiyle ekili alanların tespiti ve rekolte tahmini. GYTE Fen Bilimleri Enstitüsü, Yüksek Lisans Tezi, Gebze. 127. Swain, P.H. and Hauska, H., 1977. Decision tree classifier - design and potential. IEEE Transactions on Geoscience and Remote Sensing, 15, 142147. 128. Tatar, Y. ve Tatar, O., 2006. Jeolojide uzaktan algılama, Cumhuriyet Üniversitesi Yayınları, No: 102, Esform Ofset Ltd. Şti., Sivas. 248 s. 129. Tseng, M.H., Chen, S.J., Hwang, G.H. and Shen, M.Y., 2008. A genetic algorithm rule-based approach for land-cover classification. ISPRS Journal of Photogrammetry and Remote Sensing, 63, 202-212. 130. Townshend, J. R. G., 1992. Land cover. International Journal of Remote Sensing, 1319–1328. 131. Ustun, B., Melssen, W.J. and Buydens, L.M.C. 2006. Facilitating the application of Support Vector Regression by using a universal Pearson VII function based kernel. Chemometrics and Intelligent Laboratory Systems, 81, 29-40. 132. Vapnik, V. N., 1995. The nature of statistical learning theory. SpringerVerlag, New York. 133. Vapnik, V.N. and Chervonenkis, A.Ja., 1968. In Russian: on the uniform convergence of relative frequencies of events to their probabilities. Doklady Akademii Nauk USR, 181(4). English translation: Uniform convergence of 152 frequencies of occurrence of events to their probabilities. Soviet Mathematics Doklady, 9, 915–918. 134. Vapnik, V.N. and Chervonenkis, A.Ja., 1971. On the uniform convergence of relative frequencies of events to their probabilities. Theory of Probability and its Applications, 16, 264–280. 135. Vapnik, V.N., 2000. The nature of statistical learning theory, Second Edition. Springer-Verlag, New York. 136. Wang, F., 1990, Fuzzy supervised classification of remote sensing images. IEEE Transactions on Geoscience and Remote Sensing, 28, 194–201. 137. Webb, G.I., 2000. MultiBoosting: A technique for combining boosting and wagging. Machine Learning, 40, 159-196. 138. Werbos, P. J., 1995. Backpropagation: Basic and new developments, in The handbook of brain behaviour and neural networks, ed. Michael A. Arbib, The MIT Press, Cambridge MA. 139. Weston, J. and Watkins, C., 1998. Multi-class Support Vector Machines. Royal Holloway, University of London, U. K., Technical Report CSD-TR98-04. 140. Wilson, D.R. and Martinez, T.R., 2000. Reduction techniques for instancebased learning algorithms. Machine Learning, 38:257-286. 141. Yang, J., Ling, X., Zhu, Y. and Zheng, Z., 2008. A face detection and recognition system in color image series. Mathematics and Computers in Simulation, 77, 531–539. 142. Yao, X., Tham, L.G. and Dai, F.C., 2008. Landslide susceptibility mapping based on support vector machine: a case study on natural slopes of Hong Kong, China. Geomorphology, 101, 572-582. 143. URL-1 : http://www.yildiz.edu.tr/~bayram/sgi/saygi.htm (06.04.2008) 144. URL- 2 : http://nik.com.tr/ (18.07.2008) 145. URL- 3 : http://www.gebze.bel.tr (22.03.2008) 146. URL-4 : http://www.tuik.gov.tr/ (19.03.2008) 153 ÖZGEÇMİŞ İsmail Çölkesen, 22 Ocak 1981 tarihinde Ankara’da doğdu. Lise eğitimini Yabancı Dil Ağırlıklı Seyranbağları Lisesinde tamamladıktan sonra, 1999 yılında Hacettepe Üniversitesi Ankara Meslek Yüksek Okulu Harita ve Kadastro bölümünü kazandı. 2001 yılında dikey geçiş sınavı ile Karadeniz Teknik Üniversitesi Jeodezi ve Fotogrametri Mühendisliği’nde lisans eğitimine başladı ve 2004 yılında mezun oldu. 2005 yılında KTÜ Fen Bilimleri Enstitüsü Jeodezi ve Fotogrametri Mühendisliği bölümünde yüksek lisans eğitimine başladı. 2006–2007 yılları arasında aynı bölümde araştırma görevlisi olarak görev yaptı. 2007 yılında Gebze Yüksek Teknoloji Enstitüsü’nde yüksek lisans eğitimine başladı. 2007 yılının Eylül ayı içerisinde GYTE Mühendislik Fakültesi Jeodezi ve Fotogrametri Mühendisliği Bölümü’nde araştırma görevlisi unvanı ile çalışmaya başladı. Halen bu görevi sürdürmektedir.