2. Uzaktan Algılama ve Coğrafi Bilgi Sistemleri Sempozyumu UZAL-CBS 2008, Kayseri. http://www.uzalcbs2008.org 35 DESTEK VEKTÖR MAKİNELERİ KULLANARAK ARAZİ ÖRTÜSÜNÜN SINIFLANDIRILMASI: GEBZE ÖRNEĞİ İ. Çölkesen1, T. Kavzoğlu2 Gebze Yüksek Teknoloji Enstitüsü, Jeodezi ve Fotogrametri Mühendisliği Bölümü, 1 [email protected], [email protected] ÖZET Arazi kullanım şekillerinin belirlenmesi, çevresel değişiklerin izlenmesi ve doğal kaynaklara ait envanterlerin çıkarılması gibi geniş ölçekli birçok çalışmada yeryüzüne ait bilgilere ihtiyaç duyulmaktadır. Uzaktan algılama teknolojileri farklı konumsal ve zamansal çözünürlüklerde yeryüzünü görüntüleyebilme kabiliyetine sahip olduğundan bu önemli bilgilerin elde edilmesinde önemli bir kaynak durumundadır. Bu nedenle uydu görüntüleri yardımıyla arazi örtüsünün ve arazi kullanımının sınıflandırılması uzaktan algılama uygulamalarının önemli bir parçası olmuştur. Günümüze kadar uzaktan algılanmış görüntülerin sınıflandırılmasında birçok yöntem geliştirilmiş ve kullanılmıştır. Destek vektör makineleri (DVM) istatistiksel öğrenme prensibine dayanan yeni nesil bir kontrollü öğrenme algoritmasıdır. Uzaktan algılanan görüntülerin sınıflandırılmasında son yıllarda kullanılmaya başlayan destek vektör makineleri birçok alanda başarıyla kullanılan bir sınıflandırma yöntemidir. DVM’nin sınıflandırma doğruluğu kernel fonksiyonu seçimi ve kernel parametrelerinin belirlenmesi gibi birkaç faktöre bağlı olarak değişmektedir. Bu çalışmada, destek vektör makineleri ile farklı tarihlerde algılanmış Landsat ETM+ ve Terra ASTER uydu görüntüleri kullanılarak Gebze ve çevresindeki arazi kullanımının tespiti hedeflenmiştir. Bu veri setinin DVM ile sınıflandırılmasında Polinom ve Radyal Tabanlı Kernel fonksiyonları kullanılmış ve bu fonksiyonlar için en uygun parametreler belirlenerek sonuçlar analiz edilmiştir. Son olarak yöntemin sınıflandırma performansı, popüler sınıflandırma yöntemlerinden olan Yapay Sinir Ağları ve En Çok Benzerlik sınıflandırma yöntemlerinin performanslarıyla karşılaştırılmıştır. Elde edilen sonuçlar, önemli avantajlara sahip destek vektör makinelerinin uzaktan algılanmış görüntülerin sınıflandırılmasında yüksek doğruluklu sonuçlar ürettiği ve bu yüzden diğer metotlara iyi bir alternatif olduğunu göstermiştir. Anahtar Sözcükler: Arazi Örtüsü, Sınıflandırma, Destek Vektör Makineleri, Yapay Sinir Ağları, En Çok Benzerlik. ABSTRACT LAND COVER CLASSIFICATION USING SUPPORT VECTOR MACHINES: GEBZE CASE Information about the Earth surface is required in many wide-scale applications, including the determination of land cover/land use, monitoring of environmental changes and inventory mapping of natural hazards. Having a capability of monitoring the Earth surface at various spatial and temporal scales, the remote sensing technology is an invaluable source providing such information. Therefore, land cover/land use classification using remotely sensed images is one of the most common applications in the remote sensing field. Many algorithms have been developed and applied in the literature for the classification of remotely sensed images. Support vector machines (SVMs) are supervised learning algorithms based on statistical learning theory. SVMs are a group of classification algorithms that have been recently used in the classification of remote sensing images and successfully applied to many other applications. The classification accuracy produced by SVMs varies depending on the choice of the Kernel function and its parameters. In this study, SVMs were used for land cover classification of Gebze district using Landsat ETM+ and Terra Aster satellite images acquired at different dates. Polynomial and radial basis kernel functions were used for the classification of the data sets. Optimum parameters of the kernel functions were determined and the results were analyzed. In conclusion, classification performance of SVMs was compared with two popular classification methods, namely artificial neural networks and maximum likelihood classifier. Results produced in this research show that support vector machines having important advantages over the other techniques can produce high classification accuracies; thus, they appear to be a good alternative to conventional techniques. Keywords: Land Cover, Classification, Support Vector Machines, Artificial Neural Networks, Maximum Likelihood. 35 2. Uzaktan Algılama ve Coğrafi Bilgi Sistemleri Sempozyumu UZAL-CBS 2008, Kayseri. http://www.uzalcbs2008.org 36 1. GİRİŞ Küresel ve çevresel değişimlerin belirlenmesi amacıyla yapılan çalışmalarda yeryüzüne ait bilgilerin elde edilmesi önemli bir aşamadır. Yersel çalışmaların aksine uydu görüntüleri ile çalışmak zaman ve maliyet açısından büyük avantajlar sağlamaktadır (Kavzoğlu ve Çetin, 2005). Uzaktan algılama sistemlerinin farklı genişlikteki alanları farklı zamanlarda görüntüleyebilme özelliği, bu sistemleri yeryüzüne ait bilgilerin elde edilmesinde önemli bir kaynak haline getirmiştir. Bu nedenle arazi örtüsü veya kullanım şekillerinin belirlenmesi amacıyla yapılan çalışmalarda uydu görüntülerinin sınıflandırılması önemli bir aşamadır. Uzaktan algılanmış görüntüler ile arazi örtüsünün haritalanması, her bir pikselin yansıtma ve parlaklık değerlerini kullanarak bu pikselleri belirli arazi örtüsü sınıflarından birine atanması işlemini içermektedir (Huang et al., 2001). Başka bir ifadeyle, görüntüdeki pikselleri arazide karşılık geldikleri sınıflar veya temalar içine atamak veya yerleştirmektir. Çeşitli arazi örtülerinin spektral yansıma karakteristikleri uydu sensörlerinin çeşitli dalga boylarında veri elde etmesi durumunda arazi örtüsü tipinin belirlenmesinin mümkün olabileceğini göstermiştir (Richards, 1993). Görüntü sınıflandırma kullanıcının ilgi duyduğu objeler veya çeşitli sınıflar ile objelere ait spektral imzalar arasındaki ilişkiyi kurarak görüntüler üzerinden tematik bilgilerin çıkarıldığı bir görüntü işleme bileşenidir. 1970 yılların başında ilk Landsat uydu görüntüsünün elde edilmesinden itibaren birçok sınıflandırma algoritmaları geliştirilmiş ve sınıflandırmada kullanılmıştır (Townshend, 1992; Hall et al., 1995; Lu and Weng, 2007). Bunlar arasında en çok kullanılanları en çok benzerlik sınıflandırıcısı ve yapay sinir ağları sınıflandırıcılarıdır. Destek vektör makineleri (DVM) istatistiksel öğrenme prensibine dayanan yeni nesil bir kontrollü öğrenme algoritmasıdır. Uzaktan algılanan görüntülerin sınıflandırılmasında son yıllarda kullanılmaya başlayan destek vektör makineleri birçok alanda başarıyla kullanılan bir sınıflandırma yöntemidir (Melgani and Bruzzone, 2004; Mathur and Foody, 2008; Waske and Linden, 2008; Gautam et al., 2008). Bu çalışmada, destek vektör makineleri ile farklı zamanlı Landsat ETM+ ve Terra ASTER uydu görüntüleri kullanılarak Gebze ve çevresindeki arazi kullanımının tespiti amaçlanmıştır. DVM’nin sınıflandırma performansı, en popüler yapay sinir ağı modeli olan çok katmanlı perceptron ve en çok benzerlik gibi diğer popüler sınıflandırma yöntemleri ile karşılaştırılarak analiz edilmiştir. 2. ÇALIŞMA ALANI Gebze, Marmara bölgesinde Kocaeli ilinin kuzeybatısında, İstanbul'un 45 kilometre doğusunda yer alan bir ilçedir. Türkiye sanayisinin %15'ini, Kocaeli'nin endüstrisinin büyük bölümün barındıran Gebze, Marmara bölgesinin en büyük ikinci ilçesidir. Yaklaşık olarak yüz ölçümü 772 km² olan ilçe, coğrafi konumu itibariyle 40 o 45’ 08’’ ile 41o 02’ 38’’ kuzey enlemleriyle 29o 19’ 56’’ ile 29o 45’ 14’’ doğu boylamları arasında yer almaktadır (Şekil 1). Doğusunda İzmit, batısında İstanbul, kuzeyinde Şile, güneyinde (İzmit Körfezi) ile sınırlanan Gebze, yayla görünümünde bir düzlüğün üzerinde kurulmuştur (URL–1, 2008). 36 2. Uzaktan Algılama ve Coğrafi Bilgi Sistemleri Sempozyumu UZAL-CBS 2008, Kayseri. http://www.uzalcbs2008.org 37 Şekil1. Gebze ilçe sınırları 3. MATERYAL VE YÖNTEM Bu çalışmada, arazi örtüsünün sınıflandırılması için çalışma alanını kapsayan 1997 yılında kaydedilmiş Landsat ETM+ ile 2002 yılında kaydedilmiş Terra ASTER görüntüleri kullanılmıştır. Uydu görüntülerinin geometrik düzeltmesinde bölgeye ait 1/25.000 ölçekli haritalardan yararlanılmıştır. Sayısal olarak bilgisayar ortamına aktarılan 1/25.000 ölçekli haritalar ERDAS/Imagine yazılımı ile UTM koordinat sisteminde tanımlanarak haritalar mozaik haline getirilmiştir. Ayrıca, uydu görüntülerinin sınıflandırılması amacıyla eğitim alanlarının belirlenmesinde farklı tarihlerde çekilmiş hava fotoğrafları (1996, 1999 ve 2003) ve Gebze orman bölge şefliğine ait meşcere haritalarından yararlanılmıştır. Bunların yanı sıra arazide görsel olarak da alanlara ait konumlar el GPS aletleriyle tespit edilmiştir. Uydu görüntülerinin farklı veri gruplarıyla beraber değerlendirilebilmesi için aynı koordinat sisteminde olmaları gerekmektedir (Mather, 1987). Uydu görüntülerinin geometrik dönüşümü için, UTM projeksiyon sisteminde sayısal ortama aktarılmış topoğrafik haritalardan faydalanılmıştır. Koordinat dönüşümünde yer kontrol noktalarının tüm çalışma alanına homojen olarak dağılmasına dikkat edilmiştir. Uydu görüntülerine birinci derece Afin dönüşümü kullanılarak UTM projeksiyon sisteminde yaklaşık 0.5 piksel karesel ortalama hata ile geometrik düzeltme getirilmiştir. Uydu görüntülerinin yeniden örneklenmesinde orijinal değerleri koruduğundan en yakın komşu yöntemi tercih edilmiştir. Yapılan ön çalışmalar neticesinde çalışma alanında altı temel sınıfın mevcut olduğu belirlenmiştir. Belirlenen bu sınıflar deniz, yerleşim, toprak-taş, bozkır, iğne yapraklı orman ve geniş yapraklı orman sınıflarıdır. 4. SINIFLANDIRILMA YÖNTEMLERİ Ham halde elde edilen uydu görüntülerinden yeryüzüne ait bilgilerin elde edilmesi için çeşitli istatistiksel analizler ve istatistiksel yorumlama teknikleri kullanılmaktadır. Verileri bilgiye dönüştürebilmek için en yaygın yöntem görüntü sınıflandırmadır. Uzaktan algılamada sınıflandırma, cisimlerin farklı spektral yansıtma değerleri esasına dayanarak orijinal görüntüdeki her görüntü elemanını ait olduğu özellik grubuna ayırma işlemidir. Sınıflandırmada amaç, yeryüzü üzerinde aynı spektral özellikleri taşıyan nesnelerin gruplandırılmasıdır. Sınıflandırma sonucu elde edilen görüntü tematik harita olarak adlandırılmaktadır. Sınıflandırma işleminde genel olarak kontrollü ve kontrolsüz sınıflandırma olarak adlandırılan iki yaklaşım vardır. Bu çalışmada, belirlenen altı sınıfın uydu görüntüleri üzerinde sınıflandırılması işleminde kontrollü sınıflandırma teknikleri olan destek vektör makineleri, yapay sinir ağları (çok katmanlı perceptron) ve en çok benzerlik yöntemleri kullanılmıştır. 4.1. En Çok Benzerlik Sınıflandırma Yöntemi En çok benzerlik yöntemi literatürde en yaygın olarak kullanılan etkili bir sınıflandırma yöntemidir. Bu yöntemde ortalama değer, varyans ve kovaryans gibi istatistiki değerlerin tümü dikkate alınır. Kontrol alanlarını oluşturan sınıflar için olasılık fonksiyonları hesaplanmakta ve buna göre her bir pikselin hangi sınıfa daha yakın olduğuna karar verilmektedir. Bir pikselin hangi sınıfa ait olduğu her bir sınıfa ait olma olasılıklarının hesabından sonra en yüksek olasılıklı grubu atama şeklinde yapılır. Bu noktada kullanıcı tarafından tespit edilecek bir eşik değer sınıflandırılacak pikselin belirlenen sınıflardan veya bu sınıfların dışında bir sınıftan olduğunun tespitinde kullanılır. Bu yöntemde, sınıf kontrol verilerini oluşturan noktalar kümesindeki dağılımın, Normal dağılım olduğu kabul edilir. Sınıfların ilk olasılıkları hakkında bilgi mevcut değilse, hepsi eşit olasılıklı olarak kabul edilir. Yöntem, pikselleri sadece parlaklık değerlerine göre değil, her sınıf için ayrım oluşturacak varyans-kovaryans matris değerine göre oluşturur. Böylece örnek piksellerin özellik uzayındaki dağılımları da dikkate alınmış olur. En çok benzerlik yönteminde kullanılan formül (1) eşitliği ile ifade edilebilir. D ln ac 0.5 * ln Covc 0.5 * X M c T * Covc 1 * X M C (1) Bu eşitlikte; D, uzaklık ağırlıklı olasılık değerini; C, örnek bir sınıfı; X, aday pikselin ölçüm vektörünü; M c , C örnek sınıfının ortalama vektörünü; a c , aday pikselin C sınıfına ait olma yüzdesini, Cov c , C örnek sınıfındaki piksellerin varyans-kovaryans matrisini göstermektedir. 4.2. Yapay Sinir Ağları 37 2. Uzaktan Algılama ve Coğrafi Bilgi Sistemleri Sempozyumu UZAL-CBS 2008, Kayseri. http://www.uzalcbs2008.org 38 Yapay sinir ağları (YSA) son yıllarda görüntü sınıflandırma uygulamalarında kullanılan sınıflandırma metotları arasında teorik olarak daha gelişmiş ve güçlü bir sınıflandırma yöntemidir (Paola and Schowengerdt, 1995; Atkinson and Tatnall, 1997; Kavzoğlu, 2001). YSA, eğitim verileri aracılıyla problemi öğrenme ve daha sonra yeni bir verinin tanımlanmasını yapabilme özelliğine sahip olduğundan sezgisel bir algoritmadır. Bu sistemler basit bir biçimde insan beyninde bulunan nöron ağlarına benzer bir şekilde tasarlanmışlardır. Blamire (1996) ve Foody (1995), YSA’nın sınıf karakteristiklerinin belirlenmesinde daha az eğitim verisi kullanarak geleneksel metotlara göre daha iyi sonuçlar verdiğini bildirmişlerdir. Belirtilen avantajlarına karşın YSA’nın kullanımında bazı parametrelerin belirlenmesi gerekir. Dış ve iç parametreler olarak ele alınabilecek bu parametrelerden; dış parametreler, giriş verisinin karakteristikleri ve çalışma ölçeğini, iç parametreler ise, uygun ağ yapısının seçimi, ağ parametrelerinin başlangıç değerlerinin belirlenmesi, iterasyon sayısı, aktivasyon fonksiyon tipi ve öğrenme oranının belirlenmesi gibi sınırlamaları içermektedir (Kavzoglu and Mather, 1999). Bu sınırlamaların sonucu olarak YSA davranışını yorumlamak güçleşmektedir. Bu nedenle YSA modelleri genellikle kara-kutu metotlar olarak adlandırılırlar. Eğitim veri kümesindeki örnekleri kullanarak karar sınırlarının belirlenmesi işlemi öğrenme veya eğitim olarak adlandırılır. İstatistiksel sınıflandırma algoritmalarında karar fonksiyonlarının temelini oluşturan istatistiksel varsayımlara ait parametrelerin belirlenmesi gerekir. Bu parametreler eğitim veri kümesi kullanılarak belirlenir. YSA tabanlı sınıflandırma algoritmalarının en belirgin özellikleri herhangi bir istatistiksel kabule dayanmamalarıdır. Ayrıca farklı formattaki verileri de kullanabilmeleri önemli bir avantajlarıdır. YSA’nda temel eleman insan beynindeki nöronlar gibi çalışan işlem düğümüdür. Her bir işlem düğümü girdi değerlerini toplar ve bu değerleri düğümlerin çıkış değerlerini oluşturan bir aktivasyon fonksiyonundan geçirir. Bir çok katmanlı perceptronun yapısı Şekil 2’de gösterildiği gibi bir girdi katmanı, bir veya birden fazla saklı katman ve bir çıktı katmanından oluşur. Girdi verilerini temsil eden girdi tabakası her bir sınıfa ait değerlerin ağdaki dağılımını tanımlar. Saklı katmanlar hesaplamalar için kullanılırlar ve her bir düğüme ilişkin değerler girdi düğümü ile bu düğüme gelen bağlantılara ait ağırlıklarının çarpımının toplamından elde edilir. Çıktı katmanı tanımlanacak sınıfları göstermek için bir grup koda sahip son işlem katmanıdır. Tüm ara düğüm bağlantıları ağırlıklarla birleştirilir. Bir değer ara bağlantılarından geçerken ara düğüm bağlantılarıyla birleştirilen ağırlıklarla çarpılır (Kavzoglu and Reis, 2008). Saklı Katmanlar Girdi Katmanı Çıktı Katmanı Arazi Örtüsü Sınıfları Şekil 2. Dört tabakalı ileri beslemeli basit bir yapay sinir ağı yapısı Bir veri setinin karakteristiklerinin belirlenmesi için öğrenme algoritmaları kullanılır. Bu öğrenme algoritması ağırlıkların eğitim döngüleri veya evreleri arasında nasıl ayarlanacağını belirler. YSA uygulamalarında, ağ yapısının tasarlanması ve seçilen algoritmaya ait parametrelerin kullanıcı tarafından belirlenmesi en önemli iki adımı oluşturmaktadır. Saklı katmanın boyutu ve düğüm sayısı ile ilgili özellikler eğitim veri setinin özeliklerinin öğrenilmesi ve ağ için yeni olan piksellerin tanımlanmasında ağın kapasitesi açısından önemlidir. Buna ağın genelleştirme kabiliyeti denir. Saklı tabakadaki düğümlerin sayısı yapay ağın gücünü ve karmaşıklığını direkt olarak belirler (Kavzoglu and Mather, 2003). Ağın eğitim parametrelerinin ayarlanması (öğrenme oranı, momentum, ağırlıklar için başlangıç değerleri, vb.) öğrenme algoritmasının çalışmasını ve eğitilen ağın performansını etkileyen ana unsurdur. 4.3. Destek Vektör Makineleri Destek vektör makineleri (DVM), Vladimir N. Vapnik tarafından ortaya konulan istatistiksel öğrenme teorisine dayalı bir kontrollü öğrenme algoritmasıdır (Vapnik, 1995). DVM’nin temel amacı iki sınıf arasında en uygun ayrımı yapabilen hiper-düzlemi tanımlamaktır (Vapnik, 2000). DVM optik karakterlerin tanımlanması, el yazısı tanımlamaları ve metin sınıflandırmaları gibi birçok uygulamada kullanılmıştır (Vapnik, 1995; Joachims,1998). Son yıllarda DVM’nin uzaktan 38 2. Uzaktan Algılama ve Coğrafi Bilgi Sistemleri Sempozyumu UZAL-CBS 2008, Kayseri. http://www.uzalcbs2008.org 39 algılanmış görüntülerin sınıflandırılması konusunda başarıyla kullanımı literatürde bir çok yayında mevcuttur (Huang, et al., 2002; Foody and Mathur, 2004; Pal and Mather, 2005; Su, et al., 2007; Yao et al., 2008). DVM öznitelik bilgileri verilen bir test veri setine ait sınıf etiketlerini öğrenebilen veya tahmin edebilen bir model oluşturmayı amaçlamaktadır. Bu doğrultuda sınıflandırma işleminde, DVM ile eğitim seti içindeki veriler kullanılarak bir hiper-düzlem belirlenir ve bu oluşturulan düzlemin geçerliliği (genelleme yeteneği) test veri seti olarak adlandırılan bağımsız veri setleri kullanılarak doğrulanır. K boyutlu bir verinin sınıflandırılmasında DVM ile (K–1) boyutlu bir hiperdüzlem geliştirilir. İkili sınıflandırma probleminde doğrusal olarak ayrılabilen bir veri setinin olduğu düşünülürse, bu veri setini ayırabilen sonsuz sayıda hiper-düzlem vardır. Ancak, bu düzlemler arasında maksimum sınıra sahip sadece bir hiper-düzlem bulunmaktadır (Sherrod, 2003). Bu hiper-düzleme en uygun hiper-düzlem ve sınır genişliğini sınırlandıran noktalara ise destek vektörleri adı verilir. DVM temelde doğrusal olarak ayırt edilebilen iki sınıflı problemlerin çözümünden yola çıkılarak doğrusal olarak ayırt edilemeyen veya çoklu sınıf problemlerinin çözümü için genelleştirilebilir (Cortes and Vapnik, 1995). Doğrusal olarak ayrılabilen iki sınıflı bir sınıflandırma probleminde DVM’nin eğitimini ele alalım ve k sayıda örnekten oluşan eğitim verisinin { x i , y i }, i = 1, …, k, olduğunu kabul edelim. Burada x RN olup N-boyutlu bir uzayı, y {-1, +1} ise sınıf etiketlerini göstermektedir. Eğer hiper-düzlemin normali (w) ve eğilim değeri (b) belirlenebilirse Şekil 3a’da görüleceği üzere eğitim örnekleri doğrusal olarak ayrılabilir. Destek Vektörleri Sınır Destek Vektörleri Sınır w x b 1 w x b 1 w w Orijin Optimum Hiper-Düzlem Orijin w x b 0 Optimum Hiper-Düzlem w x b 0 (a) (b) Şekil 3. (a) Doğrusal olarak ayrılabilen veri setleri için hiper-düzlemin belirlenmesi, (b) Doğrusal olarak ayrılamayan veri setleri için hiper-düzlemin belirlenmesi. Şekilde en uygun hiper-düzleme paralel olan iki hiper-düzlem görülmektedir. Bu hiper-düzlemler w xi b 1, şeklinde bir fonksiyon ile tanımlanır. Dolayısıyla bu düzlemler arasındaki sınır 2 / w kadar olur (Foody and Mathur, 2004). Bu durumda en uygun hiper-düzlemin belirlenmesi aşağıdaki sınırlı optimizasyon probleminin çözümünü gerektirir. 1 2 min w (2) 2 Buna bağlı sınırlamalar ise yi (w xi b) 1 0 ve yi {1,1} (3) şeklinde olur. Seçilen örnek piksellerle uydu görüntülerinin sınıflandırılmasında olduğu gibi birçok sınıflandırma probleminde verilerin doğrusal olarak ayrılamaması durumu söz konusudur. Böyle bir problem için Cortes ve Vapnik (1995) sınıf etiketi ile verilen eğitim verilerin en uygun hiper-düzlem ile aynı tarafta bulunması ile ilgili kısıtlamanın pozitif bir “arttıran yapay değişken” ( i ) tanımlanması ile yumuşatıldığını ifade etmişlerdir (Şekil 3b). Bu durumu çözmek için Şekil 4’de görüleceği üzere girdi uzayında doğrusal olarak ayrılamayan veri daha yüksek boyutlu bir uzayda görüntülenir. Bu uzay özellik uzayı olarak adlandırılır. 39 2. Uzaktan Algılama ve Coğrafi Bilgi Sistemleri Sempozyumu UZAL-CBS 2008, Kayseri. http://www.uzalcbs2008.org 40 Kernel Fonksiyonu Hiper-Düzlem Girdi Uzayı Özellik Uzayı Şekil 4. Kernel fonksiyonu ile verinin daha yüksek bir boyuta dönüşümü Destek vektör makineleri K ( xi , x j ) ( x) ( x j ) gibi bir kernel fonksiyonu yardımıyla doğrusal olmayan dönüşümler yapılabilmekte ve bu şekilde verilerin yüksek boyutta doğrusal olarak ayrılabilmesine imkan sağlamaktadır (Vapnik, 1995; Gunn, 1998; Cristianini and Shawe-Taylor, 2000). Sonuç olarak; doğrusal olarak ayrılamayan iki sınıflı bir problemde iki sınıfın birbirinden ayrılması ile ilgili karar kuralı (4) eşitliği şeklinde yazılabilir (Osuna et al., 1997). f ( x) sign i yi ( x) ( xi ) b (4) DVM modelleri Tablo 1’de sunulduğu üzere, lineer, polinom, radyal tabanlı fonksiyon ve sigmoid kernel olmak üzere dört temel grup altında toplanabilir. Lineer kernel, radyal tabanlı kernelin özel bir hali gibi düşünülebilir. Ayrıca, Keerthi and Lin (2003) belirli parametreler için sigmoid kernelin radyal tabanlı kernel gibi bir davranış gösterdiğini ifade etmişlerdir. Literatürde uzaktan algılama uygulamaları için radyal tabanlı kernelin en iyi sonuçları verdiği (Keerthi and Lin 2003; Melgani and Bruzzone 2004; Foody and Mathur 2004; Pal and Mather 2005) ifade edilmektedir. KERNEL FONKSİYONU Lineer Kernel FORMÜL K ( x, y) x y Polinom Kernel K ( x, y) (( x y) 1) d Raydal Tabanlı Kernel K ( x y) e Sigmoid Kernel K ( x y) tanh(b( x y) r ) ( x xi ) AÇIKLAMA d, polinom derecesi 2 , Gauss Kernelinin boyutu b, r Kernel parametreleri Tablo 1. DVM için kullanılan Kernel fonksiyonları 5. UYDU GÖRÜNTÜLERİNİN SINIFLANDIRILMASI VE ANALİZİ Görüntü sınıflandırma, görüntüyü oluşturan her bir pikselin tüm bantlardaki değerlerinin diğer pikseller ile karşılaştırılarak benzer piksellerin kullanıcının belirlediği bilgi kategorileri dahilinde sınıflara ayrılması işlemidir (Campbell, 1996). Objelerin, sınıf olarak adlandırılan kategorilerden birine atanmasına örüntü sınıflandırması denir. Özel bir örüntü sınıflandırma probleminde bir sınıflandırıcı sınıflandırılmak istenilen nesneleri makul düzeyde bir doğrulukla sınıflandıracak şekilde oluşturulur. Girdi ve çıktı çiftleri kullanılarak yapılan eğitim yardımıyla sınıflandırıcılar girdi verilerini verilen sınıflardan birine atamak için karar fonksiyonlarını oluşturur Günümüze kadar uydu görüntülerinin sınıflandırılmasında birçok yöntem geliştirilmiş ve kullanılmıştır. Çalışma alanını kapsayan görüntülerin sınıflandırılması işlemi için öncelikle her iki tarihte arazideki durumu en iyi yansıtacak şekilde belirlenen altı sınıfı kapsayan eğitim alanlarının tespit edildi. Belirlenen eğitim alanlarını kapsayan görüntü katmanı yazılan bir MATLAB programı yardımıyla rastgele örnekleme prensibinden hareketle örneklendirilerek eğitim ve test veri setleri oluşturuldu. Eğitim ve test veri setleri belirlenirken tüm sınıflar için eşit sayıda örnek seçilerek özellikle test verisi için hesaplanan doğruluk değerlerinde oluşabilecek “önyargı” giderildi. Sonuç olarak sınıflandırmada kullanılmak üzere, Landsat ETM+ görüntüsü için eğitim verisi olarak toplam 3900 piksel, test verisi 40 2. Uzaktan Algılama ve Coğrafi Bilgi Sistemleri Sempozyumu UZAL-CBS 2008, Kayseri. http://www.uzalcbs2008.org 41 olarak 2100 piksel ve Terra Aster görüntüsü için eğitim verisi olarak toplam 2400 piksel, eğitim verisi olarak toplam 1350 piksel belirlenmiştir. En çok benzerlik (EÇB) yöntemiyle sınıflandırma işlemi Matlab yazılımında hazırlanan bir program ile gerçekleştirilmiştir. Sınıflandırma işleminde Landsat ve Aster görüntüleri için test veri seti kullanılarak doğruluk analizi gerçekleştirilmiştir. Sınıflandırma sırasında piksellerin belirlenen sınıflardan veya bu sınıfların dışında bir sınıftan olduğunun tespiti için eşik değeri %50 olarak belirlenmiştir. EÇB yöntemiyle yapılan sınıflandırma sonuçlarının genel doğruluğu Tablo 2’den de görüleceği üzere Landsat ETM+ görüntüsü için yaklaşık %87, Aster uydu görüntüsü için yaklaşık %88 olarak hesaplanmıştır. Yapay sinir ağları ile yapılacak sınıflandırma işleminde en önemli adım saklı katmanların ve bu katmanlardaki düğümlerin sayısının belirlenmesidir (Kavzoglu, 2008). Saklı katmanlardaki düğüm noktalarının sayısı yapay ağ modelinin gücünü ve karmaşıklığını belirler. Bu çalışmada saklı tabaka düğümleri Garson (1998) tarafından ifade edilen (5) eşitliği ile belirlenmiştir. N H N P /r ( N i N 0 ) (5) Burada Ni, N0 ve NH sırasıyla girdi sayısını (spektral bantlar, çıktı sayısını (sınıflar) ve saklı düğüm sayısını gösterirken, NP ise eğitim örnekleri sayısını göstermektedir. Aynı formülde r ise kullanıcı tarafından belirlenen bir parametredir ve verideki gürültü seviyesini göstermektedir. Bu bağlamda Landsat ETM+ ve Terra Aster görüntüleri için ağ tasarımları yapılmış ve ağlara ait öğrenme oranı, momentum, ağırlıklar için başlangıç değerleri gibi eğitim parametreler ayrı ayrı belirlenmiştir. Gerek ağ yapısının belirlenmesi gerekse ağın eğitimi için en uygun parametrelerin tespiti uzun bir değerlendirme ve analiz gerektirdiğinden görüntülerin sınıflandırılması yaklaşık bir gün sürmüştür. YSA sınıflandırılması elde edilen sınıflandırma doğrulukları Tablo 2’ de gösterildiği üzere Landsat görüntüsü için yaklaşık %90 iken, Aster uydusu için yaklaşık %91 olarak hesaplanmıştır. LANDSAT ETM+ TERRA ASTER Genel Doğruluk Kappa Değeri Genel Doğruluk Kappa Değeri EÇB 86.95 0.84 88.00 0.86 YSA 90.14 0.88 90.82 0.89 * DVM–1 90.81 0.89 92.81 0.91 * DVM–2 90.05 0.88 91.04 0.89 *DVM–1, Radyal tabanlı kernel fonksyonu kullanılarak, DVM–2, polinom kernel fonksiyonu kullanılarak elde edilen sınıflandırma sonuçlarını göstermektedir. YÖNTEMLER Tablo 2. Üç sınıflandırma yöntemi kullanılarak elde edilen sonuçlar 1997 ve 2002 uydu görüntülerinin DVM ile sınıflandırılmasında çoklu sınıflandırma (bire karşı bir) yöntemi kullanılmıştır. Çoklu sınıflandırmada polinom ve RTF kernel fonksiyonları ile sınıflandırma ayrı ayrı yapılmıştır. DVM ile yapılan sınıflandırmada karşılaşılan en büyük problem, kullanılacak kernel fonksiyonları için hangi parametre değerlerinin en iyi sonucu vereceğinin bilinmemesidir (Oommen et al., 2008). Seçilen kernel fonksiyonu ve kernel parametreleri ise sınıflandırılacak veri setine göre değişiklik göstermektedir (Huang, et al., 2002; Dixon and Candade, 2008). Bu nedenle polinom kernel ( d ve C ) ve RTF kernel ( ve C ) için en uygun parametreler Landsat ETM+ ve Terra Aster görüntüleri için ayrı ayrı belirlenmiştir. Tablo 2’de DVM ile elde edilen sınıflandırma sonuçları her iki kernel içinde verilmiştir. Sınıflandırma sonuçlarına göre; Landsat görüntüsün DVM ile sınıflandırılmasında RTF kernel kullanımı ile yaklaşık %91 ve polinom kernelin kullanımı ile yaklaşık %90 sınıflandırma doğruluğu elde edilmiştir. Aster görüntüsü için RTF kernel kullanılarak elde edilen sınıflandırma doğruluğu yaklaşık %93 olarak hesaplanırken polinom kernel ile yaklaşık %91 olarak hesaplanmıştır. Sınıflandırma sonucunda elde edilen tematik haritalara örnek olarak Şekil 5’ de Aster uydu görüntüsünün DVM (RTF kernel) kullanılarak sınıflandırılması sonucu elde edilen tematik harita gösterilmiştir. Bu harita incelendiğinde çalışma alanının kuzey-doğusunda özellikle yoğun orman alanlarının olduğu, şehirleşmenin ise denize yakın ve çalışma alanının orta kısmında yoğunlaştığı açıkça görülmektedir. 41 2. Uzaktan Algılama ve Coğrafi Bilgi Sistemleri Sempozyumu UZAL-CBS 2008, Kayseri. http://www.uzalcbs2008.org 42 Şekil 5. Aster görüntüsünün DVM (RTF Kernel) ile sınıflandırılması sonucu elde edilen tematik harita 6. SONUÇLAR Uzaktan algılama teknolojileri geniş alanları görüntüleyebilme kabiliyetine sahip olduğundan yeryüzü üzerindeki bilgilerin elde edilmesi amacıyla yapılan uygulamalar için önemli bir veri kaynağıdır. Uydu görüntülerinden yeryüzüne ait bilgilerin elde edilmesinde kullanılan en önemli yöntem sınıflandırmadır. Bu çalışmada DVM’nin uydu görüntülerinin sınıflandırılmasındaki performansı diğer popüler sınıflandırma yöntemleri olan en çok benzerlik ve YSA’nın sınıflandırma performansları ile karşılaştırılmıştır. Bu çalışmada kullanılan sınıflandırma yöntemlerinden en çok benzerlik yöntemi (EÇB) literatürde yaygın kullanımı olan güçlü bir sınıflandırma yöntemidir. Yapay sinir ağlarının ayrım yapma gücü nedeniyle bu konuda birçok araştırma yapılmış ve sonuçta çeşitli yapay sinir ağları modelleri geliştirilmiştir. Bunlar arasında çok katmanlı perceptron uzaktan algılanan görüntülerin sınıflandırılmasında en yaygın olarak kullanılan yapay sinir ağı sınıflandırma yöntemidir. Son yıllarda uzaktan algılanmış görüntülerin sınıflandırılmasında başarıyla kullanılan destek vektör makineleri (DVM) parametrik olmayan ve istatistiksel öğrenme teorisine dayalı bir makine öğrenme algoritmasıdır. DVM kernel fonksiyonları kullanarak doğrusal olarak ayrım yapılamayan verileri daha yüksek boyutlu bir uzayda eşleştirerek doğrusal ayrımın yapılabilmesine olanak sağlamaktadır. Landsat ETM+ uydu görüntüsünün üç yöntemle sınıflandırılması sonucunda YSA ve DVM ile elde edilen sınıflandırma doğrululukları yaklaşık %91 düzeyinde belirlenirken EÇB yöntemi kullanımı ile elde edilen sınıflandırma doğruluğu yaklaşık %87 seviyelerinde hesaplanmıştır. Terra Aster uydusu için bu sonuçlar DVM ile yaklaşık olarak %93, YSA ile yaklaşık %91 iken EÇB yöntemi ile %88 olarak hesaplanmıştır. DVM ile yapılan sınıflandırmada seçilen kernel fonksiyonları dikkate alındığında, Landsat görüntüsü için RTF ve polinom kernel kullanımı ile elde edilen sınıflandırma doğruluklarının bir birine çok yakın olduğu, Aster görüntüsü için RTF kernelin polinom kernele göre yaklaşık olarak %2 daha doğru sonuç verdiği görülmüştür. Üç yöntemin uydu görüntülerinin sınıflandırmasındaki performansı dikkate alındığında Landsat görüntüsü için DVM ile YSA’nın %91 doğruluk seviyesinde sonuçlar verdiği belirlenmiştir. Buna karşın, Aster görüntüsü için sınıflandırma doğruluğun DVM ile özellikle RTF kernel kullanımıyla YSA’na göre yaklaşık olarak %2 daha iyi olduğu gözlemlenmiştir. Her iki uydu görüntüsünün EÇB yöntemi ile sınıflandırılması sonucunda diğer iki yönteme göre sınıflandırma doğruluğunun yaklaşık %4 düzeyinde düşük olduğu görülmüştür. YSA ve DVM sınıflandırıcılarının her ikisi de parametrik olmayan yaklaşımlardır. Buna karşın YSA yapısı itibariyle daha karmaşık ve daha fazla parametrenin dikkate alınmasını gerektiren bir yaklaşımdır. YSA ile yapılan sınıflandırma 42 2. Uzaktan Algılama ve Coğrafi Bilgi Sistemleri Sempozyumu UZAL-CBS 2008, Kayseri. http://www.uzalcbs2008.org 43 doğruluğu saklı düğümlerin sayısına ve seçilen algoritmanın parametrelere duyarlıyken, DVM seçilecek Kernel fonksiyonuna ve Kernel parametrelerine karşı duyarlıdır. YSA ile yapılan eğitimde parametre değişimleri sınıflandırma doğruluğunu önemli ölçüde değiştirirken, buna karşın DVM ile yapılan eğitimde seçilen kernel fonksiyonu ve kernel parametrelerindeki değişimlerin sınıflandırma doğruluğu üzerinde daha az etkili olduğu gözlemlenmiştir. Bu nedenle DVM ile sınıflandırma YSA’ya göre çok daha kısa sürede tamamlanmıştır. Diğer taraftan EÇB yönteminin diğer iki yönteme göre daha basit ve işlem süresi açısından daha hızlı olduğu görülmüştür. Elde edilen sonuçlar; destek vektör makinelerinin uzaktan algılanmış görüntülerin sınıflandırılmasında etkili ve alternatif bir yöntem olduğunu ortaya koymuştur. KAYNAKLAR ATKINSON, P. M., TATNALL, A. R. L., (1997), “Neural Networks in Remote Sensing”, International Journal of Remote Sensing, Vol. 18, (699–709). BLAMIRE, P. A., (1996), “The Influence of Relative Sample Size in Training Artificial Neural Networks”, International Journal of Remote Sensing, Vol. 17, (223–230). CAMPBELL, J.B., (1996). Introduction to Remote Sensing, Second Edition, The Guilford Press, New York, USA. CORTES, C., VAPNIK, V., (1995), “Support-Vector Network”, Machine Learning, Vol. 20, (273–297). CRISTIANINI, N., SHAWE-TAYLOR, J., (2000), An Introduction to Support Vector Machines and Other KernelBased Learning Methods, Cambridge University Press, England. DIXON, B., CANDADE, N., (2008), “Multispectral Land Use Classification Using Neural Networks and Support Vector Machines: One or the Other, or Both?”, International Journal of Remote Sensing, Vol. 29, (1185–1206). FOODY, G.M., (1995), “Using Prior Konowledge in Artificial Neural Network Classification with a Minimal Training Set”, International Journal of Remote Sensing, Vol. 16, (301–312). FOODY, GM., MATHUR A., (2004), “A Relative Evaluation of Multiclass Image Classification by Support Vector Machines”, IEEE Transactıons on Geoscience and Remote Sensing, Vol. 42, (1335–1343). GARSON, G. D., (1998), Neural Networks : An Introductory Guide for Social Scientists, London, U.K. GAUTAM, R.S., SINGH, D., MITTAL, A., SAJIN, P., (2008), “Application of SVM on Satellite Images to Detect Hotspots in Jharia Coal Field Region of India”, Advances in Space Research, Vol. 41, (1784–1792). GUNN, SR., (1998), “Support Vector Machines for Classification and Regression”, Technical Report, University of Southampton. GÜZEL, C., (2004), “Uzaktan Algılanmış Görüntüler Kullanılarak Gebze İlçesinin Sınıflandırılmış Haritalarının Elde Edilmesi”, Yüksek Lisans Tezi, GYTE Mühendislik ve Fen Bilimleri Enstitüsü, Gebze. HALL, F. G., TOWNSHEND, J. R., ENGMAN, E. T., (1995), “Status of Remote Sensing Algorithms for Estimation of Land Surface State Parameters”, Remote Sensing of Environment, Vol. 51, (138–156). HUANG, C., DAVIS, L. S., TOWNSHED, JRG., (2002), “An assessment of support vector machines for land cover classification”, International Journal of Remote Sensing , Vol. 23, (725–749). HUANG, C., TOWNSHEND, J.R.G., LIANG, S., KALLURI, S.N.V., DEFRIES, R.S., (2001), “Impact of Sensor’s Point Spread Function on Land Cover Characterization: Assessment and Deconvolution”, Remote Sensing of Environment,Vol. 80, (203–212). JOACHIMS, T., (1998), “Text Categorization with Support Vector Machines—Learning with Many Relevant Features”, In Proceedings of European Conference on Machine Learning, (137-142). 43 2. Uzaktan Algılama ve Coğrafi Bilgi Sistemleri Sempozyumu UZAL-CBS 2008, Kayseri. http://www.uzalcbs2008.org 44 KAVZOGLU, T., (2001), "An Investigation of the Design and Use of Feed-Forward Artificial Neural Networks in the Classification of Remotely Sensed Images", PHD Thesis, Nottingham University. KAVZOGLU, T., (2008), “Determination of Environmental Degradation Due to Urbanization and Industrialization in Gebze, Turkey”, Enviromental Engineering Science, Vol. 25, (429–438). KAVZOGLU, T., MATHER, P.M, (2003), “The Use of Backpropagating Artificial Neural Networks in Land Cover Classification”, International Journal of Remote Sensing, Vol. 24, 4907–4938. KAVZOGLU, T., MATHER, P.M., (1999), “Pruning Artificial Neural Networks: An Example Using Land Cover Classification of Multi-sensor Images”, International Journal of Remote Sensing, Vol. 20, (2787–2803). KAVZOGLU, T., REIS, S., (2008), “Performance Analysis of Maximum Likelihood and Artificial Neural Network Classifiers for Training Sets with Mixed Pixels”, GIScience and Remote Sensing, Vol. 45, (330–342). KAVZOĞLU, T., ÇETİN, M., (2005), "Gebze Bölgesindeki Sanayileşmenin Zamansal Gelişiminin ve Çevresel Etkilerinin Uydu Görüntüleri İle İncelenmesi", TMMOB Harita ve Kadastro Mühendisleri Odasi, 10. Türkiye Harita Bilimsel ve Teknik Kurultayı, Ankara. KEERTHI, S., LIN, C. J., (2003), “Asymptotic Behaviors of Support Vector Machines with Gaussian Kernel”, Neural Computation, Vol.. 15, (1667–1689). LU, D., WENG, Q., (2007), “A Survey of Image Classification Methods and Techniques for Improving Classification Performance”, International Journal of Remote Sensing, Vol. 28, (823–870). MATHER, P.M., (1987), Computer Processing of Remote-Sensed Images, John Wiley and Sons Inc., New York. MATHUR A., FOODY, GM., (2008), “Crop Classification by Support Vector Machine With Intelligently Selected Training Data for An Operational Application”, International Journal of Remote Sensing, Vol. 29, (2227–2240). MELGANI, F., BRUZZONE, L., (2004), “Classification of Hyperspectral Remote Sensing Images with Support Vector Machines”, IEEE Transactıons on Geoscience and Remote Sensing, Vol. 42, (1778–1790). OOMMEN, T., MISRA,D., TWARAKAVI, N. K.C., PRAKASH, A., SAHOO, B., BANDOPADHYAY, S., (2008), “An Objective Analysis of Support Vector Machine Based Classification for Remote Sensing”, Mathematical Geosiences, Vol. 40, (409–424). OSUNA, E. E., FREUND, R., GIROSI, F., (1997), “Support Vector Machines: Training and Applications”, http://cbcl.mit.edu/cbcl/publications/ai-publications/1500-1999/AIM-1602.ps (10.05.2008). PAL, M., MATHER, PM., (2005), ”Support Vector Machines for Classification in Remote Sensing”, International Journal of Remote Sensing, Vol. 26, (1007–1011). PAOLA, J. D., SCHOWENGERDT, R. A., (1995), “A Detailed Comparison of Back Propagation Neural Network and Maximum Likelihood Classifiers for Urban Land Use Classification”, IEEE Transactions on Geoscience and Remote Sensing, Vol. 33, (981–996). RICHARDS, J.A., (1993), Remote Sensing Digital Image Analysis: An Introduction, Second Edition, Springer-Verlag, Berlin. SHERROD, P. H., (2003), “Classification and Regression Trees and Support Vector Machines for Predictive Modeling and Forecasting”, http://www.dtreg.com/DTREG.pdf (12.06.2008). SU, L., CHOPPING M.J., RANGO, A., MARTONCHIK, J.V., PETERS, D.P.C., (2007), “Support Vector Machines for Recognition of Semi-Arid Vegetation Types Using MISR Multi-Angle Imagery”, Remote Sensing of Environment, Vol. 107, (299–311). TOWNSHEND, J. R. G., (1992), “Land cover”, International Journal of Remote Sensing, Vol. 13, (1319–1328). 44 2. Uzaktan Algılama ve Coğrafi Bilgi Sistemleri Sempozyumu UZAL-CBS 2008, Kayseri. http://www.uzalcbs2008.org 45 VAPNIK, V. N., (1995), The Nature of Statistical Learning Theory, Springer-Verlag, New York. VAPNIK, V.N., (2000), The Nature of Statistical Learning Theory, Second Edition, Springer-Verlag, New York. WASKE, B., LINDER, S.V.D., (2008), “Classifying Multilevel Imagery from SAR Andoptical Sensors By Decision Fusion”, IEEE Transactıons on Geoscience and Remote Sensing, Vol. 46, (1457–1466). YAO, X., THAM, LG., DAI, F.C., (2008), “Landslide Susceptibility Mapping Based on Support Vector Machine: A Case Study on Natural Slopes of Hong Kong, China”, Geomorphology, (In Press). URL-1, (2008), http://www.gebze.bel.tr. 45