yapay sinir ağları ve uygulamaları

advertisement
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
YAPAY SİNİR AĞLARI
VE UYGULAMALARI
974
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
Tekstil Fabrikası Maketinin Nem ve Sıcaklığının Yapay Sinir Ağı
İle Kontrolü
Osman Doğmuş 1, Şaban Yılmaz 1, Fatih Keçecioğlu 1, Alev YILMAZ 1,Zafer Özer1
Kahramanmaraş Sütçü İmam Üniversitesi, Avşar Yerleşkesi, Kahramanmaraş
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
ve fiyatta üretimi yapabilmesine bağlıdır. Üretim
kalitesinin artırılması, organizasyon etkinliğinin yanı
sıra çalışma koşullarının iyileştirilmesi, çalışanların
motivasyonu ve eğitimlerinin artırılmasına bağlıdır.
Üretim maliyeti ise işletme ve yatırım maliyetlerinden
oluşur. İşletme maliyeti enerji ve işçilik kalemlerinden
meydana gelir. İşçilik maliyetinin ülkemizde, birçok
ülkeye göre daha düşük olması bu sektörün
sürdürülebilirliğinde önemli bir faktördür. [3]
Özetçe
Tekstil Fabrikalarında klima, üretimin her
aşamasında çok önemlidir. İplik veya dokuma üretimi
olsun, bu ürünlerin kalitesini ortamın nemi ve sıcaklığı
büyük oranda etkilemektedir. Bu nedenle, Tekstil
Fabrikalarındaki klima kontrolünün, hassas bir şekilde
yapılması, üretimin kalitesi açısından çok önemlidir. Bu
çalışmada, Tekstil Fabrikalarındaki klima sistemlerinin
Yapay Sinir Ağı metodu ile kontrolü araştırılmıştır.
Deneysel çalışmalarda, tekstil fabrikası maketi
kullanılmıştır. Bu set DAQ kartı yardımı ile bilgisayara
bağlana bilmektedir. Yazılan Yapay Sinir Ağı metotlu
bilgisayar programı ile bu set kontrol edilmiştir.
1. Giriş
İklimlendirme odaları, parametreleri zamana ve
bir diğerine göre değişen doğrusal olmayan sistemlerdir.
İklimlendirme odasının imal edildiği malzemelerin ısı
yalıtım-transfer özellikleri farklılık göstermekte ve
matematiksel modelleri ancak birçok ihmal ve kabul
sonucunda yapılabilmektedir. Bu süreç oldukça zor ve
zaman alıcıdır. Geleneksel kontrol mühendisliğinde, bir
sistemin kontrol edilebilmesi için bazı durumlarda
sistemin matematiksel modeline ihtiyaç duyulmaktadır.
İklimlendirme odaları gibi çok parametreli doğrusal
olmayan sistemlerin matematiksel modelleri her ne
kadar bir takım varsayımlarla basite indirgenseler de
fazla sayıda diferansiyel denklemle ifade edilmeleri söz
konusu olup analitik olarak çözülmeleri de oldukça
zordur. Nümerik olarak bilgisayarda çözülmeleri ise
bazı durumlarda içerdikleri fazla sayıda iterasyon ve
tekrarlar nedeniyle zaman almaktadır. [1]
İklimlendirme bugün büyük ölçüde tekstil
sanayiinde uygulanmakta ve üretilen maddelerin kalitesi
üzerinde büyük etken olmaktadır. Bir pamuklu dokuma
fabrikasında nem %75-85 arası olmalıdır. Aksi halde
çözgü ve atkı kopuşları fazla olur ve dokuma
tezgâhlarının durmasına neden olur ve netice itibarı ile
üretimin düşmesine sebep olur.[2]
Ülkemizde ise tekstil sektörü hem istihdam
hem de ihracat yönünden basılıca sektörlerden biridir.
Bu sektörün ülke ekonomisindeki lokomotif görevini
sürdürebilmesi, dış pazarlarla rekabet edebilecek kalite
Şekil 1: Tekstil Fabrikası İklimlendirmesi[4]
İklimlendirme şartları yalnızca üretimi
etkilemez aynı zamanda üretilen maddenin kalitesini de
etkiler. Örneğin dokuma fabrikasında nem %85 in
üzerinde
olursa,
çözgü
üzerindeki
haşılların
gevşemesine neden olur ve dolayısı ile çözgü iplerinin
mukavemeti azalır ve aynı zamanda çözgü ipleri kopar
ve randımanın düşmesine neden olur. Eğer nem %75 in
altında olursa, çözgü ipleri üzerindeki haşıl maddeleri
kurur ve iplik üzerinden tozarak kopar ve yine iplik
mukavemetinin azalmasına ve randımanın düşmesine
neden olur. Sonuç olarak nemin istenen değerden düşük
veya yüksek olması üretilen bezin kalitesini bozar,
mukavemetini düşürür, bez üzerinde uçlar, düğümler ve
istenmeyen artıklar meydana getirir. İplik üreten bir
tekstil fabrikasında nemin %45-55 olması gerekir.
Üretilen iplik kıvrımsız, yumuşak ve aynı derecede
elastiki olmalıdır. Bu ise ancak hava şartlarının istenen
975
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
Sıcaklık Algılayıcıları: Pt 100 sıcaklık
algılayıcıları kullanılmıştır. Sıcaklığa göre direnci lineer
olarak değişmektedir. –100 ile +100 oC arasında sıcaklık
ölçümü yapmaktadır.
Pt/RTD Giriş Modülü : Pt 100 ile ölçülen
sıcaklığı dijital bilgiye çevirmek için besleme voltajı
+10 - +30 V, örnekleme hızı : 10 Hz., doğruluk: ±%0.05
ve giriş direnci 2 Mohm olan Pt/RTD Giriş Modülü
olarak ADAM 4013 kullanılmıştır.
RS-422/485 den RS-232 ye Çevirici Modül:
Bu 4000 serisinin ana modülüdür. Bu modüle, seri
olarak 255 tane ölçüm modülü bağlanabilmektedir.
Kendisine bağlı modüllerden aldığı bilgileri, seri port
vasıtası ile bilgisayara aktarma işini yapar. Haberleşme
hızı ise bps olarak; 1200, 2400, 4800, 9600, 19200,
38400, 57600, 115200 olabilmektedir. RS-422/485 den
RS-232 ye Çevirici Modül olarak ADAM 4520
kullanılmıştır.
Bir Fazlı Asenkron Motor: LEYBOLD Marka
tek fazlı asenkron motor kullanılmıştır. 220 Volt, 50 Hz
şebekede çalışabilen ve senkron devir sayısı 3000 d/dak
olan kondansatörlü asenkron motorun devir sayısı
denetlenmiştir. Nominal devir sayısı 2850 d/dak ve
nominal çıkış gücü 300 wattır.
Frekans invertörü: DC uyartımla lineer olarak
V/f oranını sabit tutacak şekilde gerilim ve frekansı
birlikte artırıp azaltan gelişmiş bir frekans çeviricidir.
Giriş değerleri 220 Volt, 50 Hz ve 3 faz olup, çıkış
değerleri ise 0-220 Volt ve 0-50 Hz.’dır.
DAQ Kartı: DAQ (Data Acquisition=Veri
toplama) kartı bilgisayarın PCI veri yoluna takılmış
olup, bu kart yardımıyla dışardan bilgi almak ve
dışarıya bilgi vermek mümkündür. Bu kart yardımıyla
analog devir sayısı bilgisi, bilgisayara analog D.C.
Gerilim bilgisi İnvertöre gönderilmiştir. Kullanmış
olduğumuz DE LORENZO setinin DAQ kartı 8 bit veri
yoluna sahip olup, 8255 kontrol kartına sahiptir. Kart ile
Dijital veya analog bilgi alış verişi mümkündür.
Güç Kaynağı: Frekans invertörünün girişine
tek fazlı, 220 Volt verebilecek bir güç kaynağı
kullanıldı. Ayrıca opampları +12,-12 V DC besleyecek
ayarlı iki tane güç kaynağı kullanıldı. Mikroişlemci ve
yarı iletken teknolojisindeki gelişmeler invertörlerin
geniş sınırlar içerisinde devir sayısı ayarı yapmalarına
imkân vermiştir. Bir frekans invertöründe; motora
uygulanacak olan gerilim ilk önce bir doğrultucudan
geçirilerek DC gerilime çevrilir. DC gerilimin dengeli
bir şekilde yükselmesini ve sınır değerini geçmemesini
sağlamak amacıyla invertörde ara devre bobinleri, DC
gerilimin filtrelenmesi için ara devre kondansatörü
bulunmaktadır. DC gerilimden frekansı ve gerilimi
ayarlanabilen bir AC gerilim evirici sayesi ile elde
edilir. Evirici kontrolü kullanımı ile invertörün çıkış
gerilimi ve frekansı istenildiği oranda değiştirilir.
Fabrika maketi: Bir fazlı asenkron motor ile
tahrik edilen pompa yardımıyla su deposundan alınan
su, nemlendirme odasına basınçlı olarak, pülverize
değerde sabit tutulması ile mümkündür. Üretim kuru bir
havada yapıldığı zaman, ipliği teşkil eden lifler üzerinde
statik bir yük meydana gelir ve iplik pürüzleşmeye ve
kıvrılmaya müsait olur. Kopmalar sıklaşır ve randıman
düşer.[2]
2.Materyal ve Metot
Yapılan
bu
çalışmada
maket
tekstil
fabrikasındaki nem miktarı tek fazlı asenkron motor
tarafından tahrik edilerek su pompasıyla kontrol
edilmektedir. Karar mekanizması PC bilgisayar
içerisinde Visual Basic programı ile oluşturulan ve
yapay sinir ağı algoritmasını içeren bilgisayar programı
ile oluşturulmuştur. Bilgisayarda elde edilen bilgi, DAQ
kartı yardımıyla inverter gönderilerek su pompasının
devir sayısı kontrol edilerek, sisteme istenilen değerde
nem verilmiştir. Nemlendirme odasındaki bağıl nem
miktarı; yaş ve kuru termometre sıcaklık sensörleri
tarafından algılanarak adams seti yardımıyla seri porttan
bilgisayar ortamına alınır. Program olması gereken bağıl
nem değeri ile ölçülen bağıl nem değerini karşılaştırarak
nemlendirme ihtiyacını belirler. Yapay Sinir Ağı
algoritması yardımıyla ihtiyaç olduğu kadar nem
uygulanır. Deney için kullanılan tekstil fabrikası maket
planı Şekil 2’de gösterilmektedir.
Şekil 2: Tekstil Fabrikası Maket Planı
Şekil 3: Tekstil Fabrikası Maket Fotoğrafı
976
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
çarpılarak
nemlendirme
kontrol
ünitesine
gönderilmektedir. Kontrol edilen bölgedeki sensörler
yardımıyla sistemin çıkışı bulunmaktadır. Şekil 7.de
Kullanılan YSA görülmektedir.
edici özel fıskiye ile gönderilir. Suyun fazlası tahliye
kanalından tekrar depoya alınır. Ortamdaki su
zerreciklerinin kontrol edilen bölgeye doğrudan
ulaşmamaları için, nemli hava özel bir davlumbazdan
geçirilerek filtre edilmektedir. Fan yardımıyla nemli
havanın kanal içerisinde akışı sağlanmaktadır. Kontrol
bölgesindeki kirlenmiş nemli hava fan yardımıyla hava
çıkış kanallarına gönderilmektedir. Kontrol edilen
bölgedeki sıcaklık sensörleri yardımıyla ölçülen yaş ve
kuru sıcaklık bilgileri Bilgisayar yardımıyla nem olarak
hesaplanmaktadır
Yapılan bu çalışmada Dinvertör marka invertör
kullanılmıştır. Üç fazlı asenkron motor devir sayısı ayarı
için üretilen invertör 4 kW’a kadar olan motorlar için
kullanılabilir. Şekil 4’de Maketin Kontrol Şeması, Şekil
5’de ise nemlendirme ünitesinin blok şeması
gösterilmektedir.
Şekil 6: Blok diyagramı
Şekil 4: Maketin Kontrol Şeması
Şekil 7: Kullanılan YSA
Yapay Sinir Ağı yardımı ile su pompasının
sisteme gönderdiği su miktarı, tek fazlı kondansatörlü
asenkron motorun devir sayısı kontrol edilerek deneysel
çalışma yapılmıştır. Bilgisayar programı Visual Basic
ile gerçekleştirildi. Portlar ile haberleşmek için,
assembly program dili ile alt program oluşturuldu.
İstenen nem değeri ile YSA’nın çıkışı arasındaki hata
DAQ (veri toplama kartı) yardımı ile İnvertöre bilgi
olarak gönderildi ve motorun hızı bu değere göre
ayarlandı. Değişik nem değerleri ve ortam koşulları ile
sonuçlar alınarak kayıt edildi.
.
4.Bulgular ve Tartışma
Şekil 4: Maketin Kontrol Şeması
%100 dış hava çalışılırken, değişik set değerleri
için elde edilen grafik şekil 8’ de gösterilmiştir. Bu
uygulamadaki hata grafiği ise şekil 9’ de gösterilmiştir.
Görüldüğü gibi sistem %57 den %70 nem değerine 2
dakikada ulaşılmıştır. Motorun devir sayısı, nemin set
değerine %1 kadar yaklaştıktan sonra yavaşlamaya
başlamaktadır. İstenen nem değerini %0,6 geçince
motor durmaktadır. Sistemin nem değeri %69,6-70,3
3. Kullanılan Yapay Sinir Ağları
Sistemin gerçek çalışma blok diyagramı şekil
6. de verilmiştir. Sistemin çıkışı ve bir önceki değeri
YSA 'ına girilmekte, YSA 'ın çıkışı öğretici değerle
karşılaştırılmakta
ve ağın ağırlıkları
yeniden
belirlenmektedir. Oluşan hata ön bilgi bloğu ile
977
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
Sistemin %100 dış hava ile bozucu etkiler
uygulandığındaki grafiği şekil 10 da ve Sistemin %100
dış hava ile bozucu etkiler uygulandığındaki hata grafiği
şekil 11 de verilmiştir.
arası bir salınım ile devam etmektedir. Buradaki hata
%0,7 civarındadır. İstenen nem değiştirilince sistem
kendisini bu değere yaklaşmaya zorlamaktadır. %65
istenen değere 2 dakikada gelebilmiştir. Sistemin nem
değeri %64,9-65,9 arası bir salınım ile devam
etmektedir. Buradaki hata %1 civarındadır. Tekrar hedef
değiştirilmiş ve %75 nem olması istenmiştir. Yaklaşık 4
dakika sonra hedefe ulaşılmıştır. Sistemin nem değeri
%74.4-74.9 arası bir salınım ile devam etmektedir.
Buradaki hata %0,6 civarındadır.
Şekil 10: Sistemin %100 dış hava ile bozucu etkiler
uygulandığındaki grafiği
Şekil 8: Sistemin %100 dış hava ile değişik set değerlerinde
elde edilen grafiği
Şekil 11: Sistemin %100 dış hava ile bozucu etkiler
uygulandığındaki hata grafiği
Sisteme bozucu etki olarak bu kez ısıtıcı (75
W) uygulanmıştır. 13 üncü dakikada ısıtıcı açılmıştır.
Isıtıcının tam olarak ısınması 1 dakika kadar sürmüştür.
11 inci dakikada ısıtıcının etkisi ile nem düşme eğilimi
göstermiştir. Ama sistemin nemi istenen değerin
üzerinde gittiği için YSA bunu yükseltmemiştir. Hata
biraz daha az olarak %1,5 devam etmiştir. 17 inci
dakikada ısıtıcı kapatılmıştır. Isıtıcının soğuması
yaklaşık 1 dakika almıştır. Bunun etkisi sistemin nemi
yüksek olduğu için tam olarak görülememiştir.
İç hava çalışmada nemin artışı dış havanınkine
oranla hızlı olduğu için %70 in altındaki nem
değerlerine tam olarak yaklaşamamaktadır, %2 gibi bir
hata olmaktadır. Ama istenen nem değerleri %70 in
üzerine çıkarsa, be değerlere yaklaşma daha iyi
olmaktadır, hata %2 nin altına inmektedir.
Bozucu etki uygulamaları, sistemi ani olarak
etkilemediği için, sistemin nem eğrisinde fazla bir
sapma oluşturmamaktadır.
Şekil 9:Sistemin %100 dış hava ile değişik set değerlerinde
elde edilen hata grafiği
Sistemin hatasının %1,8 olduğu görülmektedir.
7 inci dakikada sisteme bozucu etki olarak pencere
açılmıştır. Bunun sonucu olarak nem düşme eğilimi
göstermiş ve hata biraz daha az olarak devam etmiş.
Fakat YSA nın etkisi ile tekrar yükseltilerek %70-71.8
civarında tutulmuştur. 11 inci dakikada pencere tekrar
kapatılmıştır. Bunun sonucu olarak nem artma eğilimi
göstermiş ve hata %2 ye yükselmiş Fakat YSA nın
etkisi ile biraz düşürülerek %70-71,8 civarında
tutulmuştur.
978
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
Şekil 15 de Sistemin %100 dış hava ile değişik
set değerlerindeki görüntüsü, Şekil 16 da Sistemin dış
hava ile bozucu etki uygulandığı zamanki görüntüsü ve
Şekil 17 de Sistemin %100 iç hava ile değişik set
değerlerindeki görüntüsü görülmektedir.
Şekil 12 de Sistemin %100 iç hava ile değişik
set değerlerinde elde edilen grafiği, Şekil 13 de
Sistemin %100 iç hava ile değişik set değerlerinde elde
edilen hata grafiği ve şekil 14 Sistemin %100 iç hava ile
bozucu etkiler uygulandığındaki grafiği görülmektedir.
Şekil 12: Sistemin %100 iç hava ile değişik set değerlerinde
elde edilen grafiği
Şekil 15: Sistemin %100 dış hava ile değişik set
değerlerindeki görüntüsü.
Şekil 13: Sistemin %100 iç hava ile değişik set değerlerinde
elde edilen hata grafiği
Şekil 16: Sistemin dış hava ile bozucu etki uygulandığı
zamanki görüntüsü.
Şekil 17: Sistemin %100 iç hava ile değişik set değerlerindeki
görüntüsü.
Şekil 14: Sistemin %100 iç hava ile bozucu etkiler
uygulandığındaki grafiği
979
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
bölge kontrol edilebilir. Fabrika otomasyonu ile entegre
çalışabilir.
6.Sonuç
Yapay Sinir Ağları ile Tekstil fabrikalarının
nem kontrolü başarı ile yapılabilmektedir. Fabrika
modeli üzerinde yapılan çalışmalarda istenilen nem
değerlerine sistemin elverdiği en kısa zamanda
ulaşılmaktadır. Ortamın nemi %56 iken istenilen nem
değeri %70 olarak seçildiği zaman, 125 saniye gibi kısa
bir zamanda kontrol edilen bölgenin nem oranı istenilen
değere ulaşmaktadır. Nem oranındaki değişme %0.5
sınırının altında kalmaktadır.
Çalışma esnasında istenilen nem değeri
değiştirilebilmektedir. İstenilen nem değerinin %65
olarak değiştirilmesi halinde sistem bu bilgiyi
değerlendirerek 110 saniye içerisinde nem oranını yeni
set değerine indirmektedir. Çalışma esnasında dış
ortamdaki sıcaklık değişiklikleri veya nemlendirme
odasındaki iç sıcaklığın değişimi istenilen nem değerini
etkilememektedir. Yapılan deneyler esnasında iç
sıcaklığı değiştirmek için, ısıtıcı kullanılmıştır. Nem
oranı %70 olarak kararlı hale geldikten sonra 75 W’lık
bir ısıtıcı çalıştırıldığı takdirde ortamın ısınmasıyla
birlikte nem değeri düşmeye eğilim göstermektedir.
Yapay Sinir Ağın etkisiyle nem tekrar kararlı hale
gelmektedir. Bozucu etki olarak pencere açık bırakılmış
ve yine başarı ile nemin sabit kaldığı gözlenmiştir.
Pompanın çalışması on/off olmadığı için ihtiyaç miktarı
kadar çalışmaktadır. Böylece hem enerji tasarrufu
olmakta hem de daha az hatalı sonuç elde edilmektedir.
Yapılan deneysel çalışmalarda kararlı bölge
için hatanın %0,5’in altında olduğu gözlenmiştir. Yapay
sinir ağını oluşturan PC bilgisayar yardımıyla nem
değerleri sürekli kaydedilebildiğinden geçmişe yönelik
istatistiksel bilgiler alınabilir. Farklı zamanlar için farklı
nem oranları önceden programlanabilir. Üretimin
değişik adımlarında farklı nem oranları uygulanabilir.
Yukarıda yapılan deneysel çalışmalar iç hava
içinde denenmiş ve başarılı sonuçlar alınmıştır. %57
nem oranı ile çalışmaya başlayan sistemde %70 nem
oranı istenmiş olup, yapılan %100 iç hava
çalışmalarında 80 saniye gibi kısa bir sürede istenilen
değere ulaştığı görülmüştür. Dolayısıyla iç hava
deneylerinde istenilen nem oranına daha çabuk
ulaşıldığı tespit edilmiştir. İç hava deneylerinde sistem
hızlı tepki verdiği için, karalı hale, dış hava ile
çalışmalara göre daha yavaş geldiği gözlenmiştir.
Yapılan deneysel çalışmalarda kullanılan
maketin nemlendirme odasının boyutları 60x60x110
cm’dir. Sistemin kullanılabilirliği hakkında fikir
vermesine rağmen, hacim olarak küçük olduğu için hızlı
tepki vermekte ve kontrolü güçleştirmektedir. Buna
rağmen birçok çalışma bölgesinde %0,5’lik nem
hatasıyla başarılı sonuçlar alınmıştır.
Sistemin maliyeti, diğer kontrol sistemlerine
göre yüksek görünmesine rağmen, bir tekstil
fabrikasındaki verimi artırıcı rolünden dolayı
ekonomiktir. Ayrıca bir Yapay Sinir Ağı ile birden fazla
7.Kaynakça
[1] Y. İzgi, “Eğitim Amaçlı Bir İklimlendirme Odasının
Yapay Zeka Teknikleri İle Modellenmesi ve Kontrolü”
Marmara Üniversitesi, Fen Bilimleri Enstitüsü Doktora
Tezi, 2007, İstanbul.
[2] O. Doğmuş, A. Onat, Ş. Yılmaz, Ş. Ergün, “Tekstil
Fabrikalarındaki Bağıl Nemin Yapay Sinir Ağları
Yöntemi ile Kontrolü”, KSÜ Fen ve Mühendislik Dergisi
8(1)-2005
[3]
M. Z. Yılmazoğlu, “Bir Tekstil Fabrikasında Güneş
Destekli Çift Etkili Bir Absorpsiyonlu Soğutma Sisteminin
Uygulamasının Teknik ve Ekonomik Analizi”, Gazi
Üniversitesi, Fen Bilimleri Enstitüsü, Yüksek Lisans
Tezi, 2006, Ankara.
[4]
http://www.detaymekanik.com/vrv-sistemleri.html
[5]
G. Mustafaraja, G. Lowryb, J. Chena, “ Prediction of
room temperature and relative humidity by
autoregressive linear and nonlinear neural network
models for an open Office”, School of Engineering and
Design, Brunel University, UK, Engineering, Science and
the Built Environment, London South Bank University,
UK.
[6]
Ning Li, Liang Xia, Xiangguo Xu, Ming-Yin Chan,
“Deng Shiming Dynamic modeling and control of a
direct expansion air conditioning system using artificial
neural network”, Department of Building Services
Engineering, The Hong Kong Polytechnic University,
Hong Kong SAR, 2012, China.
[7]
F. Tekinşen, “Farklı Nem İçeriklerine Sahip
Pamuklarda, Çırçırlamanın, Kısa Lif Oranı, Tohum
Kabuğu Parçacığı, Nep ve Mote Sayısı Üzerine Etkisi”,
Yüksek Lisans Tezi, Kahramanmaraş Sütçü İmam
Üniversitesi,
Fen
Bilimleri
Enstitüsü,2005,
Kahramanmaraş.
[8] M. Sinecen, “Klima Sistem Kontrolünün Bulanık mantık
İle Modellenmesi”, Yüksek Lisans Tezi, Pamukkale
Üniversitesi, Fen Bilimleri Enstitüsü,2002, Denizli
[9] E. Kaçmaz, “ PIC Mikro denetleyici Kullanarak Ağ
Bağlantılı Gömülü Sistem Tasarımı İklimlendirme Cihaz
Kontrol Ünitesi Uygulaması”, Yüksek Lisans Tezi,
Anadolu Üniversitesi, Fen Bilimleri Enstitüsü, Bilgisayar
Mühendisliği Anabilim Dalı, 2007, Eskişehir.
[10] E. Yıldız, “PLC İle Isıtma Havalandırma Ve Soğutma
Sistemlerinin
Optimum
Denetlenmesi”,
Fırat
Üniversitesi, Yüksek Lisans Tezi, Fen Bilimleri
Enstitüsü, 2006, Elazığ.
[11] U. Akyol, “İplik Bobininin Kurutulmasının Teorik
İncelenmesi”, Trakya Üniversitesi, Doktora Tezi, Fen
Bilimleri Enstitüsü, 2007, Edirne.
980
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
Fotovoltaik Paneller için Radyal Tabanlı Yapay Sinir Ağları
Kullanan Etkin Bir Modelleme Yöntemi Önerisi
Hasan Rıza ÖZÇALIK1, Osman DOĞMUŞ2, Şaban YILMAZ2, Ahmet GANİ1
Elektrik-Elektronik Mühendisliği Bölümü
Kahramanmaraş Sütçü İmam Üniversitesi, Avşar Yerleşkesi, Kahramanmaraş
1
[email protected]
[email protected]
Kahramanmaraş Meslek Yüksekokulu
Kahramanmaraş Sütçü İmam Üniversitesi, Karacasu Yerleşkesi, Kahramanmaraş
2
[email protected]
[email protected]
kullanılabilmeleri ve çalışma süreleri boyunca doğaya
hiç bir kirletici atık bırakmamalarıdır. Bu nedenle güneş
pilleri ile ilgili birçok çalışma yapılmaktadır [2].
Fotovoltaik sistemler, güneş pilleri, bağlantı
elemanları, koruma elemanları, depolama elemanları ve
beslediği yükün karakteristiğine bağlı olarak bazı ilave
elemanlar içeren bir yapıya sahiptirler. Bu sistemlerin
en önemli elemanı olan güneş pilleri, ilk yatırım
maliyeti ve kullanılacak diğer elemanların nitelik ve
miktarlarını da belirleyici özelliğe sahiptir. Bu nedenle
ilk kurulum aşamasında güneş pillerinin en iyi şartlarda
ve en yüksek verimle çalışabilecekleri bir sistem
tasarlamak çok önemlidir [3].
Şekil 1’de radyal tabanlı yapay sinir ağının
temel mimarisi örneği görülmektedir.
Özetçe
Fotovoltaik Sistemlerinin veriminin artması,
maliyetinin düşmesi ve çevreci olmaları nedeniyle
kullanımı gün geçtikçe artmaktadır. Fotovoltaik
sistemlerin optimum tarzda tasarlanabilmesi için güneş
pillerinin modellenmesi gerekmektedir. Güneş pillerinin
modellenmesinde diyot içeren eşdeğer devrelerin
kullanılması oldukça yaygın bir yöntemdir. Bu
çalışmada ise, fotovoltaik panellerin Radyal Tabanlı
Yapay Sinir Ağları (RBF) yardımıyla etkin bir tarzda
modellenmesini sağlayan bir yöntem önerilmektedir.
Kullanılan kesin uyarlamalı RBF yapısı gelişmiş bir eğri
uydurma aracı olarak çalışmaktadır. Modelleme, esas
olarak panelin üretici tarafından verilen gerçek akımgerilim
karakteristiğinin
öğrenilmesi
tarzında
gelişmektedir. Modelleme işlemi panelle ilgili tüm
karakteristiklere uygulanabilir. Bu çalışmada Sharp
marka NT-S5E1U model güneş pili modellenmiştir.
Giriş Katmanı
1. Giriş
Bilindiği gibi enerji, hayat kalitesini iyileştiren,
ekonomik ve sosyal ilerlemeyi sağlayan en önemli
faktördür. Ancak, artan enerji fiyatları, küresel ısınma
ve iklim değişikliği, dünya enerji talebindeki artış, hızla
tükenmekte olan fosil yakıtlara bağımlılığın yakın
gelecekte devam edecek olması gerçeği, yeni enerji
teknolojileri alanındaki gelişmeler gibi faktörler ülkeleri
yeni arayışlara götürmektedir. Dünyanın enerji geleceği
ile ilgili raporlara bakıldığında; 2000-2100 yılları
arasında enerji ihtiyaçları ve kaynaklarındaki dağılıma
ait bilimsel ön görüler 2100 yılında petrolün iyice
azalacağı, kömürün nerdeyse hiç kalmayacağı, güneş
enerjisi kullanımının ise çok artacağı sonucuna
götürmektedir [1] .
Güneş pillerinin yaklaşık 60 yıllık gelişiminde,
özel ve kamu destekli araştırma ve geliştirme
çalışmaları esas olmuştur. Güneş pili hareketli parçaya
sahip olmamaları, sorunsuz olarak az bakımla 25- 30 yıl
Gizli
Katmanı
Çıktı Katmanı
Şekil 1: Radyal Tabanlı Yapay Sinir Ağının Temel
Mimarisi [4]
Radyal tabanlı fonksiyon ağlarının eğri
uydurma ve lineer olmayan problemleri sınıflandırma
başarısından dolayı son yıllarda popülerliği gittikçe
artmıştır. Böylece RBF ağları ile ilgili yapılan yazılım
çalışmaları bu tip ağlarla ilgili bilimsel gelişmelerle
paralellik arz etmektedir. Gauss fonksiyonu RBF
ağlarının gizli katmanında en yaygın olarak kullanılan
981
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
Radyal temelli fonksiyonlar, sayısal analizde
çok değişkenli problemlerin çözümünde kullanılmış ve
YSA’ nın gelişmesi ile birlikte bu fonksiyonlardan YSA
tasarımında yararlanılmıştır. RBF, ileri beslemeli YSA
yapılarına benzer şekilde giriş, saklı ve çıkış
katmanından oluşur ancak, giriş katmanından saklı
katmana dönüşüm, radyal tabanlı aktivasyon
fonksiyonları ile doğrusal olmayan sabit bir
dönüşümdür. Saklı katmandan çıkış katmanına ise
doğrusal bir dönüşüm gerçekleştirilir. RBF de
uyarlanabilecek serbest parametreler; merkez vektörleri,
radyal fonksiyonların genişliği ve çıkış katman
ağırlıklarıdır. Burada verilen öğrenme yöntemi, sadece
ağırlıkların iteratif olmayan doğrudan matrisel çözüme
dayanan (off-line) bir yöntemle elde edilmesi esasına
dayanmaktadır. Bu yüzden bu ağ yapısına Kesin
Uyarlamalı Radyal Tabanlı Yapay Sinir Ağı olarak
bakılmaktadır. Bu tip ağ yapısı, statik karakterli grafik
ve desenlerin tanınması işleminde oldukça başarılıdır.
Öğrenmede kullanılan temel bağıntı,
radyal tabanlı aktivasyon fonksiyonudur. Literatürde
çeşitli alanlarda kullanılmak üzere tasarlanmış
birbirinden farklı Gauss fonksiyon üreteci devreleri
mevcuttur. Matematiksel fonksiyonların Taylor serisine
açılımından faydalanılarak elde edilen Gauss eğrisi
devreleri de literatürde yer almaktadır [5].
Denetimli bir sinir ağı dizaynı için çok çeşitli
yollar izlenebilir. Çok katmanlı algılayıcı(denetimli
olarak) dizaynı için geri yayılım algoritması istatistikte
“stokastik yaklaşım” olarak bilinen bir optimizasyon
metodu uygulaması olarak değerlendirilebilir. Bir sinir
ağı dizaynı çok boyutlu uzayda “eğri-uydurma
problemi” olarak değerlendirildiğinde öğrenme, çok
boyutlu uzayda taşınan dataya en iyi uyumu sağlayan
bir yüzey bulma olgusu ile eşdeğerdir. Radyal temelli
fonksiyonlar (RBF) ilk defa çok değişkenli gerçek bir
interpolasyon probleminin çözümünde tanıtılmıştır [6].
2. Radyal Tabanlı Yapay Sinir Ağları
Radyal Tabanlı Yapay Sinir Ağları (RTYSA),
biyolojik sinir hücrelerinde görülen etki tepki
davranışlarından esinlenilerek 1988 yılında geliştirilmiş
ve filtreleme problemine uygulanarak YSA tarihine
girmiştir[7]. RTYSA modellerinin eğitimini çok boyutlu
uzayda eğri uydurma yaklaşımı olarak görmek
mümkündür[3,8]. Bu nedenle RTYSA modelinin eğitim
performansı, çıktı vektör uzayındaki verilere en uygun
yüzeyi bulma ve dolayısıyla bir interpolasyon
problemine dönüşmektedir.
( )
Gizli
Katmanı
)
( )
Şeklinde yazılabilir[10]. Burada, wko bias giriş için
)
ağırlık katsayısıdır. Tüm p durumları için (
alınırsa (1) bağıntısı,
( )
( )
Giriş
Katmanı
(
∑
∑
∑
(
(‖
)
( )
‖ )
( )
Şeklinde düzenlenebilir. Burada, k=1,2,..,K;
çıkış
katmanı hücre sayısı; N gizli katmanda bulunan hücre
sayısı; M merkez sayısı (M=N);
ağın girdi
vektörünü;
()
radyal tabanlı aktivasyon
fonksiyonunu,
giriş vektör uzayının bir alt
setinden seçilen radyal tabanlı merkezleri, ‖ ‖ girdi
vektörünün merkezden ne kadar uzak olduğunun bir
ölçütü olan Öklidyen normunu,
çıkış katmanındaki
ağırlıkları göstermektedir. RTYSA modellerinde önem
arz eden elemanlar; hücre merkezleri, dikkatli bir
çalışma ile belirlenen varyans, çıktı katmanındaki
ağırlıklar ve kullanılan aktivasyon fonksiyonunun
yapısıdır.
RTYSA modellerinde aktivasyon fonksiyonu
olarak birçok fonksiyon tipi kullanılabilmektedir.
Doğrusal, kübik, Gauss, multi-kuadratik, ters multikuadratik fonksiyonlar bunlardan bazıları olup bu
çalışmada Gauss fonksiyonu tercih edilmiştir. Gauss
fonksiyonunun matematiksel yapısı 4 nolu bağıntıda
gösterilmektedir [11].
Çıktı
Katmanı
Şekil 2:Radyal Tabanlı Yapay Sinir Ağlarının Yapısı
RTYSA modelleri genel YSA mimarisine
benzer şekilde giriş katmanı, gizli katman ve çıktı
katmanı
olmak
üzere
üç
katman
halinde
tanımlanmaktadır (Şekil 2). Ancak, klasik YSA
yapılarından farklı olarak RTYSA’ larda, girdi
katmanından gizli katmanına geçişte radyal tabanlı
aktivasyon fonksiyonları ve doğrusal olmayan bir
kümeleme (cluster) analizi kullanılmaktadır. Gizli
katman ile çıktı katmanı arasındaki yapı ise ağırlıkların
atandığı ve hesaplanması için ilgili öğrenme
algoritmalarının kullanıldığı kısımdır [9].
982
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
∑
(
4. RBF ile Fotovoltaik Panelin Modellenmesi
)
( )
( )
Belirtilen fotovoltaik panelin modellenmesinde
kullanılan Radyal Tabanlı Yapay Sinir Ağının yapısı
esas olarak aşağıda gösterildiği gibidir.
Burada, i=1,2,..I giriş sayısı, xpi giriş vektörünü, cim
merkezleri,
standart sapma değerini simgelemekte
olup YSA terminolojisinde RTYSA modelinin
performansını önemli ölçüde etkileyen dağılma (spread)
parametresi olarak rol oynamaktadır [8]. RTYSA
modellerinin eğitimi, hücre merkezlerinin bulunması ve
çıktı katmanındaki ağırlıkların optimize edilmesi olmak
üzere iki aşamada gerçekleşmektedir. Literatürde hücre
merkezlerini ve çıkış ağırlıklarını bulabilmek için farklı
yöntemler kullanılmaktadır. Hücre merkezlerini
bulabilmek için en sık kullanılan yöntem K ortalamalar
(K-means) ve Kohonen kümeleme yöntemleridir. Çıkış
ağırlıklarını bulmakta kullanılan yöntemler ise En
Küçük Ortalamalı Kareler (LMS) ve Moore-Penrose
Sözde Ters (Pseudo-inverse) yöntemleridir. Dağılma
parametresi ise genellikle bütün hücreler için sabit
alınmaktadır.
RTYSA
modellerinde
dağılma
parametresi için yaklaşık denklikler olmakla birlikte, bu
parametre
deneme-yanılma
yöntemiyle
de
belirlenebilmektedir [11].
3.
Şekil 4:Kullanılan RBF Ağı
i : Giriş (X) sayısı (I = 1) [13-17]
m: merkez sayısı (M = 12)
K: Çıkış (Y) sayısı (K = 1)
Nöron sayısı=merkez sayısı
p: Pattern (X’lerin farklı değerleri) sayısı (p=20)
Modellenen Güneş Pili
( )
Sharp marka NT-S5E1U model güneş pilinin
etiket değerleri; Güç=185,0 W., Vmp=36,2 V., Imp=5,11
A., Voc=44,9 V., Isc=5,75 A., W=17,0 kg.,
1700x970x13(mm), mono-Si ‘dir. Şekil 3’ de Sharp
marka NT-S5E1U kodlu güneş pilinin kataloğunda
verilen farklı ışınım değerleri için elde edilmiş gerçek
akım-gerilim
ve
güç-gerilim
karakteristikleri
görülmektedir.
(
∑
(
)
( )
)
( )
(
∑
∑
)
(
( )
)
( )
( )
Akım [A]
Güç [W]
{
}
.
Bias giriş için
alındı [17-22].
[
]
[
]
W’yi bulabilmek için G’nin tersi alınması
gerekir. G kare matris olmadığı için tersi normal yoldan
alınamaz.
(
)
işlemi ile W ağırlık
matrisi bulunur. Merkez değerleri, şekil 3 deki
modellenen güneş pilinin 1000 W/m2, 25 °C çalışma
koşulları için katalog değerlerine ve eğrinin eğimine
göre seçilmiştir [23-30].
Gerilim [V]
Şekil 3: Modellenen Güneş Pilinin Karakteristikleri[12]
983
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
değerlerinin yüzde değişimi görülmektedir. Buna göre
gerçek değerlerden sapmanın +%0,441 ile -%0,358
arasında olduğu görülmektedir. Karakteristiğinin
düzgün olduğu ilk bölümde fark en yüksek -%0,104
olmuştur. Şekil 7 de fotovoltaik panelin gerçek akım
değerleri ile RBF esaslı modelden elde edilen akım
değerlerinin farkları olan hatanın değişim grafiği
görülmektedir. En büyük hata değeri kıvrılma
bölgesinde 0,023 amper olarak ortaya çıkmıştır.
C=[ 5 15 25 28 32 35 40 42 43 44 45 45,9]
Gauss fonksiyonu genişlik değerleri,
=[5 5 5 5 5 5 5 5 5 5 5] olarak seçildi.
Tablo 1: Ağı öğretmek için kullanılan x(gerilim), y (akım) ve
öğretim sonucu elde edilmiş ağırlık (W) vektörü değerleri
Şekil 6: Hatanın yüzde değişimi
6.Sonuç
Gerilim [V]
Şekil 7: Hatanın Değişimi
Şekil 5: RBF ile modellenen akım-gerilim karakteristiği
5. Sonuç
Tablo 1de Radyal Tabanlı Yapay Sinir Ağını
öğretmek için kullanılan x (Gerilim) ve y (Akım)
değerleri ve öğretim sonucu elde edilmiş W ağırlık
vektörü değerleri görülmektedir. Şekil 5 de RBF ile
modellenen fotovoltaik güneş pilinin akım-gerilim
karakteristiğinin model sonucuna göre çizimi
görülmektedir. Şekil 6 da gerçek akım-gerimim
karakteristiğinin değerleri ile RBF ile modellenen
fotovoltaik güneş pilinin akım-gerilim karakteristiğinin
değerlerinin farkının alınmasıyla elde edilen hata
Bu çalışmada, Radyal Tabanlı Yapay Sinir Ağı
ile Sharp Marka NT-S5E1U model güneş paneli
[1000 W/m2, 25 °C] değerleri ile verilen ortam
şartlarında modellenmiş ve panelin akım-gerilim
karakteristiğini sağlayan ağırlık matrisi elde edilmiştir.
Bu ağırlık değerleri dikkate alınarak ve öğrenmede
kullanılan verilerden çok daha fazla test değerleri
kullanılarak karakteristik yeniden çizdirilmiştir.
984
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
Simülasyon çalışmaları sonunda Radyal Tabanlı Yapay
Sinir Ağı ile oluşturulan modelin çok başarılı olduğu
görülmüştür. Gerçek karakteristik ile modelin sağladığı
karakteristik
karşılaştırıldığında
yüzde
olarak
maksimum hatanın 0,3-0,4 civarında
olduğu
görülmüştür. Bu sonuçlar oldukça küçük hata
değerlerini ifade etmektedir. Bu durumda, fotovoltaik
panellerin modellenmesi için önerilen Kesin Uyarlamalı
Radyal Tabanlı Yapay Sinir Ağları temelli algoritmanın
oldukça yeterli olduğu söylenebilir.
[15] D. S. Yeung , P.P.K. Chan, W. W.Y. Ng, “Radial Basis
Function network learning using localized generalization
[16] error bound”, a School of Computer Science and
Engineering, South China University of Technology,
Guangzhou 510006, China
[17] T. Andoa, S. Konishib, S. Imotoc, “Nonlinear regression
modeling via regularized radial basis function networks”,
Graduate School of Business Administration, Keio
University,
2-1-1
Hiyoshi-Honcho,
Kohoku-ku,
Yokohama 223-8523, Japan
[18] X.-Juan Wu , X.-Jian Zhu, G.-Yi Cao, H.-Yong Tu, “F
Modeling a SOFC stack based on GA-RBF neural
networks identification”, Institute of Fuel Cell, Shanghai
Jiao Tong University, Shanghai 200030, China
[19] F. Schwenker, H. A. Kestler, G. Palm, “Three learning
phases for radial-basis-function networks” , Department
of Neural Information Processing, University of Ulm, D89069 Ulm, Germany
[20] F. F.Navarro, C. H. Martínez, P.A. Gutiérrez , M. C.Ruz,
“Evolutionary q-Gaussian radial basis function neural
networks for multiclassification”, Department of
Computer Science and Numerical Analysis, University of
Córdoba, Campus de Rabanales, Albert Einstein
Building, 3rd floor, 14074 - Córdoba, Spain
[21] İ. H. Altaş, “Foto voltaj Güneş Pilleri: Eşdeğer Devre
Modelleri ve Günışığı ile Sıcaklığın Etkileri”, Karadeniz
Teknik Üniversitesi,1998
[22] D. Wangn, X.-JunZeng,J. Keane,” A clustering algorithm
for radial basis function neural network initialization”,
School of Computer Science, University of Manchester,
Manchester M601QD,UK
[23] R. V. Babu, S. Suresh , A. Makur , “Online adaptive
radial basis function networks for robust object tracking”,
Exawind, Bangalore, India
[24] S. Kitayama · J. Srirat · M. Arakawa ·K. Yamazaki,
“Sequential approximate multi-objective optimization
using radial basis function network”,Springer-Verlag
6. Kaynakça
[1] M. Çetin, N. Eğrican, “Güneş Enerjisi: Ekonomiye ve
İstihdama Katkısı”, Solar Future, 2010,İstanbul
[2] S. Rustemli, F. Dinçadam, M. Demirtaş, “Güneş Pilleri
İle Sıcak Su Elde Etme ve Sokak Aydınlatması”, V.
Yenilenebilir Enerji Kaynakları Sempozyum, 2009,
Diyarbakır
[3] N. Onat, S. Ersöz, “Fotovoltaik sistemlerde maksimum
güç noktası izleyici algoritmalarının karşılaştırılması”, V.
Yenilenebilir Enerji Kaynakları Sempozyum, 2009,
Diyarbakır
[4] http://origin-ars.els-cdn.com/content/image/1-s2.0S0957417409008264-gr3.jpg
[5] Z. Koca, “Üç Fazlı Asenkron Motorların Yapay Sinir
Ağları İle Vektör Esaslı Hız Kontrolü”, Kahramanmaraş
Sütçü İmam Üniversitesi, Fen Bilimleri Enstitüsü,
Elektrik-Elektronik Mühendisliği Anabilim Dalı, Yüksek
Lisans Tezi, Kahramanmaraş
[6] G. Yazıcı, “Genetik algoritmalar ile radyal temelli
Fonksiyon ağlarının optimizasyonu”, Yıldız Teknik
Üniversitesi, Fen Bilimleri Enstitüsü, Elektrik-Elektronik
Mühendisliği Anabilim Dalı, Yüksek Lisans Tezi, İstanbul
[7] Broomhead, D., Lowe, D., Multivariable Functional
Interpolation and Adaptive Networks, Complex Systems,
2, 6, 568-576, 1988.
[8] Ham, F., Kostanic, I., Principles of Neurocomputing for
Science and Engineering. Macgraw-Hill. USA, 2001
[9] U. Okkan, H.Y. Dalkılıç, “Radyal Tabanlı Yapay Sinir
Ağları ile Kemer Barajı Aylık Akımlarının
Modellenmesi”, İMO Teknik Dergi, 2012 5957-5966,
Yazı 379
[10] C. Şenol, T. Yıldırım, “ Standart Ve Hibrid Yapılar
Kullanarak Yapay Sinir Ağları İle İmza Tanıma”, Kadir
Has Üniversitesi, Elektronik Mühendisliği Bölümü,
34230, Cibali, Fatih-İstanbul
[11] Ham, F., Kostanic, I., Principles of Neurocomputing for
Science and Engineering, Macgraw-Hill. USA, 2001.
[12] http://www.solarpanelstore.com/pdf/sharp-185.pdf
[13] R. Neruda, P. Kudov, “Learning methods for radial basis
function networks”, Institute of Computer Science,
Academy of Sciences of the Czech Republic, P.O. Box 5,
18207 Prague, Czech Republic, Available online 28 July
2004
[14] F. P. Harter , H. Fraga , C. Velho, “New approach to
applying neural network in nonlinear dynamic
model”,Instituto Nacional de Pesquisas Espaciais,
Laborato´ rio Associado de Computac¸a˜o e Matema´ tica
Aplicada, Sa˜o Jose´ dos Campos, SP, Brazil
Berlin Heidelberg 2013
[25] F. F. Navarro. H.-Martı´nez, P. A. Gutierrez,“
Generalised Gaussian radial basis function neural
networks ”,Springer-Verlag Berlin Heidelberg 2013
[26] I.C.Yeh, C.C. Chen ,X. Zhang , C. Wu, K-C.Huang,
Adaptive radial basis function networks with kernel
shape Parameters”, Springer-Verlag London, 2010
[27] H. Nishikawa, S. Ozawa, “Radial Basis Function
Network for Multitask Pattern Recognition” Springer
Science Business Media, LLC. 2011
[28] H. Khosravi, “A Novel Structure for Radial Basis
Function Networks—WRBF”, Springer Science Business
Media, LLC. 2011
[29] A. Brandstetter, A. Artusi, “Radial Basis Function
Networks
GPU-Based
Implementation”,
IEEE
Transactions on Neural Networks, Vol. 19, NO. 12,
December, 2008
[30] B. Doğan, M. Korürek,”EKG Vurularını Sınıflamada
Radyal Tabanlı Fonksiyon Yapay Sinir Ağının
Performans
Degerlendirmesi,
İstanbul
Teknik
Üniversitesi, Elektrik – Elektronik Fakültesi
985
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
Bilyeli Rulmanlarda Zaman Uzayında İstatistiksel Öznitelik
Çıkarımı ve Yapay Sinir Ağları Metodu ile Hata Boyutunun
Kestirimi
Samet Bayram, Kaplan Kaplan, Melih Kuncan, H.Metin Ertunç
Mekatronik Mühendisliği Bölümü
Kocaeli Üniversitesi, Umuttepe Yerleşkesi, İzmit, Kocaeli
[email protected]
[email protected]
[email protected]
[email protected]
Düzgün bir şekilde üretilmiş bir makine bile çalışma esnasında
belli seviyede titreşim oluşturur. Bu durumun pratikte
önlenmesi çoğu zaman mümkün olmaz. Önemli olan bu
titreşim seviyesinin kabul edilebilir bir seviyede kalacak
şekilde kontrol altında tutulmasıdır. Uygun yöntemlerle
sistemden ve arızadan kaynaklanan titreşim bilgileri
belirlenerek arıza teşhisi yapılabilir.
Literatür araştırıldığında, bu konu ile ilgili yapılmış birçok
çalışma görülmektedir. Zhang vd.[2] rulmandan alınan
mekanik titreşimleri dalgacık (wavelet analysis) yöntemi ve
olasılıksal sinir ağları (PNN) ile hatanın boyutunu tespit
ettikten sonra hatasız bir rulmandan aldıkları titreşim
verileriyle karşılaştırmışlardır. Mendel vd.[3] pompalardaki
rulmanlarda meydana gelebilecek hataları kurdukları sistemle
frekans analizi yöntemiyle bulmaya çalışmışlardır. Lacey [4]
titreşim verilerini zarf analizi yöntemini kullanarak işledikten
sonra frekans bölgelerindeki değişimleri gözlemlemiştir.
Yadav [5] rulmanlardaki hataları belirlemek için titreşim
verilerinin zaman uzayında analiz ettikten sonra bu sonuçları
yapay sinir ağları yöntemiyle analiz etmiş; rulmanlardaki hata
oranını yüzdeyle belirterek kategorize etmişlerdir. Rukhande
vd. [6] şok darbe izleme yöntemiyle rulmanlarda meydana
gelen hataların değişimini gözlemlemiştir. Shi vd. [7] dalgacık
enerji entropisi ve danışmansız öğrenme (SOM) yöntemleri ile
rulmanlarda arıza teşhisine yönelik analiz yapmışlardır. Zhang
vd. [8] ortak vektör yöntemiyle rulmanlarda meydana gelen
hataların meydana getirdiği titreşim verilerinin özniteliklerini
çıkararak, hatanın boyutunu ve oluştuğu frekansları
görüntülemiştir. Girondin vd. [9] helikopterlerde kullanılan
rulmanlarda meydana gelen hataları tespit etmek için frekans
analizi metodunu kullanmıştır.
Bu çalışmada ise, önceki çalışmalar [10,11] sonucu
tasarlanmış bir rulman test düzeneği üzerinde, lazerle yapay
olarak meydana getirilmiş ve değişik deney şartlarında testler
yapılmıştır. Farklı hata boyutlarına sahip rulmanlardan alınan
titreşim verileri, zaman uzayında öznitelik matrisi çıkarılarak
yapay sinir ağları yöntemiyle analiz edilmiş, rulmanlardaki
hata boyutu kestirilmeye çalışılmıştır.
Özetçe
Dönel makinelerde yataklama elemanı olarak kullanılan
rulmanlarda meydana gelen arızalar, sistemin çalışmasını
aksatan veya durduran nedenlerdendir. Bu çalışmada, bir milrulman sisteminde, belirli boyutlarda yapay hatalar
oluşturulmuş rulmanlardan titreşim sinyalleri elde edilmiştir.
Çalışmanın amacı, rulmanlarda meydana gelen arızaların
boyutunu, yapay sinir ağları modelini kullanarak teşhis
etmektir. Elde edilen titreşim verilerinin gerçek zamanda
özellikleri çıkarılarak belirli ağırlıklarla çarpılmış, oluşturulan
yapay sinir ağı modeline giriş olarak verilmiştir. Farklı arıza
boyutlarına sahip rulmanların gerçek zamanda istatistiki
özellikleri de farklı olmaktadır. Bu özellikler kullanılarak
geliştirilen yapay sinir ağı ile rulmanlarda meydana gelen
arızaların büyüklüğü, %100 bir başarı ile sınıflandırılırken,
gerçek hata değerinin ise, ortalama %2 hata ile kestirildiği
gözlemlenmiştir.
1. Giriş
Günümüz endüstrisinde, dönel makine elemanlarına birçok
makinede sıklıkla karşılaşılmaktadır. Rulmanlar, farklı
mekanizmaların dönen millerine yataklık yapması için
kullanılan elemanlardır. Böylelikle sürtünme en aza
indirgenerek makinenin çalışması daha düzgün bir seviyeye
getirilmektedir. Rulmanlar, makinelerde tahrik elemanı olarak
kullanılan motor millerinde veya bunun dışında başka kritik
bölgelerde yataklama elemanı olarak görev yapmaktadır. Bu
elemanlarda meydana gelebilecek arızaların sisteme olumsuz
etkisi kaçınılmazdır. Sistemin rulmana göre çok fazla maliyetli
oluşu,
otomasyon
sisteminin
dolayısıyla
üretimin
durdurulması, bakım onarım masrafları gibi durumların
yanında rulmanlarda meydana gelen arızalar üretim kalitesini
de etkilemekte ve rulmanlarda arıza teşhisini zorunlu
kılmaktadır [1].
Çalışan her makine titreşim meydana getirir.
Makinelerde çalışan parçalar arasındaki boşluğun artması,
parçalardaki sürtünmelerden kaynaklanan aşınmalar, çatlak
oluşması ve benzeri nedenler titreşime neden olurlar. Bunlara
sebep olan en önemli faktör ise makineye etki eden iç ve dış
kuvvetlerdir. Bu yüzden makineler tasarlanırken bu
kuvvetlerin mümkün olduğu kadar küçük olması istenir.
2. Yapay Sinir Ağları
Yapay sinir ağları, biyolojik sinir sisteminin simülasyonu
olarak ortaya çıkmıştır. Bir bilgisayarın çalışma şekli beynin
986
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
aşamadan sonra sonuç katmanında son bir defa daha
aktivasyon
fonksiyonları
saklı
katman
çıkışlarını
değerlendirerek nihai çıkış elde edilir. Şekil 1'de giriş
katmanının girişleri xj, çıkışı hj ile gösterilmiştir. hj, aynı
zamanda saklı katmanın girişi olarak gösterilmiştir.
Yapay sinir ağlarında öğrenmenin ilk adımı aktivasyon
olarak nitelendirilebilir. Sinir hücresine giren sinyallerin
toplamı o hücreyi aktif hale getirebilecek bir değere sahip olup
olmamasına göre çıkış değeri değişmektedir. Eğer toplam
sinyal hücreyi ateşleyebilecek, eşik değerini atlatabilecek
kadar yüksek ise o hücre aktiftir, aksi durumda ise o hücre
pasiftir. Sinir hücresinin aktif veya pasif durumda olmasına
göre sınıflandırma yapıp yapamadığı sonucuna ulaşılmaktadır.
Örneğin, girdi örüntülerine 1 ya da 0 cevabini vererek
sınıflandırma yapabilen bir yapay sinir ağı hücresi, örüntüye 1
veya 0 değerini atayarak karar vermiş sayılmaktadır. “Karar
vermek” ve “sınıflandırmak”, öğrenme sürecinin temel yapı
taşlarını oluşturmaktadır.[14]
çalışmasına benzetilerek yapay sinir ağları modeli
geliştirilmiştir. Yapay sinir ağları algoritmalarında öğrenme,
daha önce edinilen tecrübelere bağlıdır. Bir sistemin
özelliklerinin çıkarıldıktan sonra sistemin çözümüne dayalı bir
algoritma olmasa veya karmaşık bir çözüm algoritması olsa
dahi, yapay sinir ağları bu sisteme uygulanabilir. Yapay sinir
ağları nöronlardan oluşmaktadır. Bu nöronlar gerçek sinir
sistemindeki gibi bir birlerine çok karmaşık bir şekilde dahi
bağlanabilmektedirler. Her bir nöronun farklı ağırlıkta girişleri
ve bir tane çıkışı bulunmaktadır. Bu amaçla farklı ağırlıktaki
girişlerin toplamı şu şekilde ifade edilir [12]:
P
n   wi xi  b
(1)
i 1
Burada P giriş sayısı, w girişin ağırlığı, x giriş ve b biastır.
Ağırlıklandırılmış girişler ve her nöronun biasıyla beraber
toplamları, aktivasyon fonksiyonundan geçirilir ve bunun
sonucunda o nörona bağlı çıkış elde edilir. Aktivasyon
fonksiyonunu "f" ile gösterirsek:
3. Yöntem
P
f (n)  f ( wi xi  b)
3.1. Deney Düzeneği
(2)
i 1
Çalışmada kullanılan veriler, Şekil 2'de görülen bir AC servo
motora bağlı rulman-mil düzeneğinden elde edilmiştir.
Şeklinde ifade edilir. Aktivasyon fonksiyonu sistemin yapısına
uygun olarak sigmoid fonksiyonu, eşik (treshold) fonksiyonu
veya hiperbolik tanjant fonksiyonu olabilir. Çıkış elde
edildikten sonra eğer sistem çok katmanlıysa, bir nöronun
çıkışı diğer bir nöronun girişi olabilir. Bu şekilde çok katmanlı
bir yapay sinir ağı modeli oluşturulur [13].
Şekil 2: Deney Düzeneği
Düzenekte veri toplamak için Matlab ile uyumlu National
Instruments 6211 veri toplama kartı(DAQ) kullanılmıştır.
Titreşimi, elektrik sinyallerine dönüştürmek için içerisinde
piezoelektrik malzeme bulunan titreşim sensörü (352C65)
tercih edilmiştir. Titreşim sensörü ile ilgili bilgiler Tablo 1’de
verilmiştir. Titreşim sinyallerini düzenleyip yükseltmek için
sensörle bağlantılı sinyal şartlandırıcılar da bulunmaktadır.
Tablo 1: Titreşim sensörünün özellikleri
Parametreler
Hassasiyet (±10 %)
Ölçüm aralığı
Rezonans frekansı
Doğrusalsızlık
Şekil 1: Sinir hücreleri ve katmanlar [1]
Değerler(SI)
10.2 mV/(m/s2)
±491 m/s2 pk
≥35 KHz
≤1%
Rulmanda hata boyutunu sınıflandırmak için belirli çaplarda
yapay hatalar oluşturulmuştur. Rulmanda yapay hatalar
dışında ekstra bir titreşimin olmaması için yapay hataların
özenle açılması gerekmektedir. Bunun için lazer delme
yöntemi ile mikron hassasiyetinde iç bileziğe, dış bileziğe ve
Yapay sinir ağları modeli genelde üç kısımdan oluşur:
giriş katmanı, saklı katman ve çıkış katmanı. Her katman çok
fazla nörondan oluşabilir. Bilgi giriş katmanından yapıldıktan
sonra aktivasyon fonksiyonlarından geçer. Giriş katmanın
çıkışları saklı katmanın girişleri olarak devam eder. Bu
987
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
Tablo 2: Zaman uzayında özellik çıkarımı ve ağırlıklar
bilye üzerine 0.15 mm ve 0.9 mm çapında delikler açılmıştır.
Şekil 3'te lazerle oluşturulmuş yapay hatalar görülmektedir.
HATA BOYUTU
ÖZELLİKLER KÜÇÜK ORTA BÜYÜK AĞIRLIK
Ortalama
-0.0027 -0.0047
0.016
Maksimum
0.9364
7.0941
0.2
Minimum
-0.6598 -1.902 -4.4361
0.02
Standart Sapma 0.0994
Skewness
0.1421
0.4088
0.2
-0.05
0.974
0.01
Kurtosis
13.8513 25.1383 47.0916
0.39
Medyan
-0.0047 -0.0051 -0.0048
0.01
0.0994
0.4088
0.1
9.4162 10.2113 17.3518
0.05
RMS
Şekil 3 : Lazerle oluşturulmuş yapay hatalar
1.02
1.4513
0.02
Crest faktör
0.1421
3.2. Ham Titreşim Verisi ve Özellik Çıkarımı
3.3. Yapay Sinir Ağı Modelinin oluşturulması
Titreşim verileri 24 KHz örnekleme frekansında toplanmış,
1'er saniyelik kısımlara ayrılarak 20 adet veri paketi şeklinde
bilgisayar ortamında saklanmıştır. Şekil 4'te bir titreşim verisi
örneği görülmektedir.
20'şer adet üç hata tipinde veri paketleri ve 9 adet zaman
uzayında istatistiksel özellikler ile beraber 9x60 boyutunda
özellik matrisi oluşturulmuştur Özellik çıkarımından sonra,
yapay sinir ağı modelinin girişleri için ağırlıklar belirlenmiştir.
Hatanın değişimine hangi özelliklerin tepkisi daha belirgin ise
o girişe ait ağırlık daha büyük belirlenmiştir. Örneğin; hata
miktarı arttıkça kurtosis özelliğinin belirgin bir şekilde arttığı
gözlenmiştir. Dolayısıyla bu girişe ait ağırlık büyük
seçilmiştir.
Ağırlıklar
deneme-yanılma
yöntemiyle
bulunmuştur. Tablo 2'de, istatistiksel özelliklere ait ağırlıklar
gösterilmiştir. Tüm girişlere ait ağırlıklar bu şekilde
belirlendikten sonra yapay sinir ağı modeli Şekil 5'e benzer bir
şekilde oluşturulmuştur.
Şekil 4: Ham titreşim verisi
Hata boyutu değiştikçe titreşim verisi üzerinde çeşitli
değişiklikler olacaktır. Bu değişiklikleri elde etmek için
titreşim verisinin zaman uzayında özellik çıkarımı yapılmıştır.
Bu özellikler aşağıda verilmiştir.

RMS

Kurtosis

Standart sapma

Skewness

Maksimum

Minimum

Ortalama

Medyan

Crest faktör
Tablo 2'de küçük, orta ve büyük hatalı rulmanlardan alınmış
birer titreşim verisinin örnek özellik çıkarımı görülmektedir.
Şekil 5: Yapay sinir ağı modeli
Girişler belirlendikten sonra, hedef çıkış matrisi belirlenir.
9x60'lık giriş matrisine karşılık, 1x60'lık hedef çıkış matrisi
belirlenmiştir. Küçük boyutlu hatalar için 0.15, orta boyuttaki
hatalar için 0.5 ve büyük boyuttaki hatalar için 0.9 değeri
verilmiştir. Verilen bu değerler varsayımsal değerlerdir ve
arızanın büyüklüğünü belirtmek için verilmiştir. Rulmanlar
güvenilir bir yöntemle hata frekans genlikleri ölçülmüş ve hata
genliklerine göre sınıflandırılmıştır. Bu büyüklükleri ve hedef
çıkış matrisindeki karşılığını belirten değerler Tablo 3'te
gösterilmiştir.
988
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
Öğrenme oranı, elde edilen en iyi sonuca göre 0.55 olarak
belirlenmiştir. Küçük, orta ve büyük hataya sahip
rulmanlardan alınan 20'şer adet titreşim verisi olmak üzere 60
adet titreşim verisi kullanılmıştır. Buna göre bu verilerin %55'i
yapay sinir ağımını eğitmek için, %45'i test için kullanılmıştır.
Yüzde oranları deneme-yanılma ile bulunmuş en iyi
değerlerdir.
Tablo 3: Hata tipleri
Hata Tipi
Hata Boyut
Hedef Çıkış
Küçük
Orta
Büyük
0-200
201-349
≥350
0.15
0.5
0.9
4. Deneysel Sonuçlar
3.4. Simülasyon
Yapay sinir ağı modeli Matlab üzerinde yazılan kodlarla
simüle edilmiştir. Simülasyon parametreleri Tablo 4’te
gösterilmiştir.
Şekil 8'de kestirilen değerlerin hedeflenen değerlere göre
dağılımı görülmektedir. Kestirilen değerler, 0.15(küçük hata),
0.5 (orta hata) ve 0.9 (büyük hata) civarında toplanmıştır.
Kestirilen değerlerin dağılımı ±%5 bandı içerisinde olması
hedeflenmiştir. Kestirim sonucunda ortalama hata ve
korelasyon değerleri hesaplanarak gösterilmiştir. Ortalama
hata ve korelasyon katsayısı formülleri Denklem 3 ve 4
verilmiştir.
Tablo 4: Simülasyon parametreleri
YSA Parametreler
Transfer fonksiyonu
Öğrenme oranı
Max Epochs
Hedef hata
Eğitim algoritması
Değerler(SI)
Tansig, Purelin
0.55
500
Ortalama Hata(%) 
1e-7
LM
1
N
 100
N
i 1
Tanjant-Sigmoid (tansig) transfer fonksiyonu çok katmanlı
yapay sinir ağlarında kullanılan bir transfer fonksiyonudur. Bu
fonksiyon sistemde giriş katmanı ile saklı katman arasında
transfer fonksiyonu olarak kullanılmıştır. tansig fonksiyonu
sistemin çıkışını -1 ile +1 arasında düzenler.
Korelasyon, R(a,p) 
a  p 
i
i
(3)
ai
Cov( a, p)
(4)
Cov( a, a)Cov( p, p)
a ve p değerleri, sırasıyla gerçek ve kestirilen değerlerdir.
Cov(a,p) ise a ile p arasındaki kovaryansı ifade eder. [13].
Öngörülen ve kestirilen değerler ±%5 lik bir bandın içerisinde
kalması arzulanmıştır. Şekil 8'de, %99.76'lık bir başarıyla
öngörünün gerçekleştiği görülmektedir.
Şekil 6: Tanjant-Sigmoid (tansig)Transfer Fonksiyonu
Purelin fonksiyonu, saklı katman ile çıkış katmanı arasında
kullanılan transfer fonksiyonudur. Bu transfer fonksiyonu ile
çıkış, -1 ile +1 arasında lineer olarak düzenlenir.
Şekil 8: Hedeflenen ve kestirilen çıkışların dağılımı
Her seferinde verilerin %55 i rastgele olarak seçilmiş ve yapay
sinir ağı eğitilmiştir. Hedef çıkış ve kestirilen çıkışın beraber
çizdirildiğinde Şekil 9'daki sonuç ortaya çıkmaktadır. Eğitim
ve test için seçilen değerler rastgele olduğu için sonuç her
seferinde farklı ama Şekil 9'daki sonuca benzer çıkmaktadır.
Şekil 7: Purelin Transfer Fonksiyonu
989
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
Teşekkür
Bu çalışma Kocaeli Üniversitesi Mekatronik Mühendisliği
Bölümü Sensör Laboratuarında 106M208 kodlu Tübitak
projesi kapsamında altyapısı oluşturulan deney düzeneğinde
yapılmıştır. Bu bildirinin yazarları, hibe edilen rulmanlardan
dolayı Ortadoğu Rulman Sanayi'ne (ORS), rulmanlarda yapay
hataların oluşturulmasına katkılarından dolayı Lazer
Teknolojileri
Araştırma
ve
Uygulama
Merkezine
(LATARUM) ve TÜBİTAK'a teşekkür ederler.
Kaynakça
[1] K. Al-Raheem," Wavelet Analysis and Neural
Networks for Bearing Fault Diagnosis," Caledonian
College of Engineering, Oman.
[2] ZHANG Jingyi, WANG Lan, ZHU Meichen, ZHU
Yuanyuan, YANG Qing, "Fault diagnosis based on
wavelet packet energy and PNN analysis method for
rolling bearing", School of Information Science and
Engineering Shenyang Ligong University Shenyang
110159, China,2012
[3] E. Mendel, T. W. Rauber, F. M. Varejao and R. J.
Batista” Rolling Element bearing fault diagnosis in
rotating machines of oil extraction rigs”, 17th European
Signal Processing Conference (EUSIPCO 2009)
[4] Dr. S. J. Lacey,” An Overview of Bearing Vibration
Analysis”, Nov / Dec 2008,maintenance & asset
management vol 23 no 6
[5] Manish yadav, Dr. Sulochana wadhwani,”Vibration
analysis of bearing for fault detection using time domain
features and neural network”, International Journal of
Applied Research in Mechanical Engineering, Volume-1,
Issue-1, 2011
[6] Sanjay Rukhande, Shamim Pathan, Pratik Lahane, Vijay
Patil, Devendra Mhatre, Ashish Gosavi, “Condition
Monitoring for Fault Diagnosis of Bearings”,
Proceedings of the NCNTE-2012, Third Biennial
National Conference on
Nascent Technologies Fr. C. Rodrigues Institute of
Technology, Vashi, Navi Mumbai, Feb 24-25, 2012
[7] Shuai Shi, Laibin Zhang, Wei Liang,” Condition
Monitoring and Fault Diagnosis of Rolling Element
Bearings Based on Wavelet Energy Entropy and SOM
“,College of Mechanical and Transportation Engineering
China University of Petroleum Beijing, China,2012
[8] BinZhang, GeorgiosGeorgoulas, MarcosOrchard,
AbhinavSaxena, DouglasBrown, GeorgeVachtsevanos,
StevenLiang,” Rolling Element Bearing Feature
Extraction and Anomaly Detection Basedon Vibration
Monitoring”, 16th Mediterranean Conference on Control
and Automation
[9] Victor Girondina, Komi Midzodzi Pekpea, Herve
Morelb, Jean-Philippe Cassar," Bearings fault detection
in
helicopters
using
frequency
readjustment
andcyclostationary analysis", "Mechanical Systems and
Signal Processing NA, NA (2013) NA
Şekil 9: Hedef çıkış ile kestirilen çıkış
Şekil 9'daki mavi değerler hedef çıkışı, kırmızı değerler ise
yapay sinir ağı modeli ile kestirilen sonuçları göstermektedir.
Grafiğe bakarak, hata boyutunun sınıflandırılması %100 lük
bir başarıyla gerçekleştiği görülmektedir. Grafikteki değerler
sadece test verileri içindir. Diğer bir ifadeyle, yapay sinir
ağının eğitimi aşamasında kullanılan veriler test aşamasında
kullanılmamıştır.
Şekil 10'da simülasyonun performans grafiği görülmektedir.
Hataların karelerinin ortalaması, belli bir değerin(10-7) altına
düştüğünde Matlab iterasyona son vermektedir.
Şekil 10:Performans grafiği (Hataların karelerinin
ortalaması)
5. Genel Sonuçlar
Bu çalışmada, küçük, orta ve büyük hata miktarlarına
sahip rulmanlardan elde edilen titreşim verilerinin zaman
uzayında istatistiksel öznitelikleri çıkartılmış, yapay sinir ağı
modeli oluşturulmuş ve hata boyutunun tespiti, sınıflandırma
olarak değerlendirildiğinde, %100 lük bir başarı sağlanmış ve
gerçek hata değerinin ise %2’lik bir ortalama hata ile
kestirildiği gözlemlenmiştir.
Yapay sinir ağları sayesinde, rulmanda meydana gelmiş
hatanın boyutu, titreşim sinyallerinden zaman uzayında elde
edilen özniteliklere dayanılarak kestirilmiştir.
990
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
[10] H.Metin Ertunç, Hasan Ocak, Muhammet Merdoğlu,
Samet Bayram, Mesut Çavuş,"Vibration Analysis Based
Localized Bearing Fault Diagnosis Under Different Load
Conditions " 12.International Workshop on Research and
Education in Mechatronics,2011,Kocaeli, Turkey
[11] Kaplan Kaplan, Samet Bayram, Mel h Kuncan, H.Met n
Ertunç,"Farklı Rulman Hatalarından Elde Ed len T treş m
S nyaller Üzer ndek Radyal Yükler n Etk s " Otomatık
Kontrol Ulusal Toplantisi, TOK-2012, 11-13 Ekim 2012,
Niğde
[12] Haykin S (1994) Neural networks—a comprehensive
foundation.
[13] H.Metin Ertunç, Hasan Ocak, Cüneyt Aliustaoğlu,"
ANN- and ANFIS-based multi-staged decision algorithm
for the detection and diagnosis of bearing faults" Neural
Comput & Applic,2012
[14] Fausett L.," Fundamentals Of Neural Networks",1994
991
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
Chua Devresinin Kaotikliğinin YSA ile Kestirimi
Muhittin Bayram1, Ferhat Çıra1
1
Elektrik Elektronik Mühendisliği Bölümü
Dicle Üniversitesi, Mühendislik Fakültesi
{muba,fcira}@dicle.edu.tr
Farklı başlangıç değerleri ile oluşturulan (x,y,z) giriş
değerlerinin entropileri hesaplanarak öznitelik vektörleri
oluşturulmuştur. Bu öznitelik vektörleri YSA ile eğitilmiş ve
sonra test edilerek, Chua devresinin hangi başlangıç
değerlerinde kaotik özellik gösterdiği tespit edilmiştir.
Özetçe
Bu çalışmada Chua devresi, Yapay Sinir Ağları (YSA) ile
analiz edilmiştir. Öncelikle Chua devresinin zaman
dinamikleri elde edilmiş ve sonra bu dinamiklerin faz uzayları
oluşturularak faz uzay çekicileri incelenmiştir. Daha sonra bu
dinamiklere ait Lyapunov üstelleri elde edilerek, Chua
devresinin farklı başlangıç şartlarında aldığı değişik durumlar
görsel olarak incelenmiştir. Son olarak farklı başlangıç
durumundaki sinyallerin entropileri hesaplanmış ve elde
edilen öznitelik vektörleri YSA ile otomatize edilerek, Chua
devresinin hangi değerlerde kaotik özellikler gösterdiği
kestirilmiştir.
Çalışmada, 10 adet periyodik ve 10 adet kaotik olmak
üzere toplam 20 adet Chua işaret kombinezonu kullanılmıştır.
İşaretlerden 10 tanesi YSA’nın eğitimi, 10 tanesi ise testi için
kullanılmıştır. Bu işaretlerin entropileri hesaplanmıştır. Her
bir işarete ait x, y, z dinamikleri için 3 öznitelik vektörü elde
edilmiş ve YSA girişleri 3 olarak alınmıştır. Periyodik ve
kaotik olmak üzere 2 çıkış oluşturulmuştur. Bu şekilde
yapılan sınıflandırmada % 100 başarım oranı elde edilmiştir.
1. Giriş
2. Chua Devresi ve Lyapunov üstelleri
Bu çalışmada, Literatürde popüler olan elektronik Chua
devresinin Lyapunov üstelleri ve YSA ile değerlendirilmesi
üzerinde durulmuştur. Yani Chua devresinin kaotikliği kaosu
nicel olarak tanımlayan Lyapunov üstelleri ile belirlenmiştir.
Chua devresi bize kaosu çağrıştırmaktadır. Basit bir devre
yapısına sahip olması, periyodik ve kaotik davranış
sergilemesi dolayısıyla Chua devresi, kaos ve kaotik işaret
uygulamalarında model devre olarak kabul edilmekte ve
yaygın olarak kullanılmaktadır [1-3].
2.1. Chua Devresi
Chua devresi, kaotik dinamiklerin gösterilmesi açısından
oldukça popüler olan bir elektronik araçtır. Bu devrenin giriş
parametreleri değiştirilerek limit çevrim ve garip çeker elde
edilebilmektedir. Parametre değişikliğine göre devre farklı
kılıflara bürünmekte ve değişik dinamikler göstermektedir.
Chua devresinin diferansiyel modeli Denklem (1)’de
gösterilmiştir [7].
Kaotik sistemler belirli şartlar altında kaotik özellikler
gösterirler. Yani kaotik sistemler her zaman kaotik değillerdir.
Chua devresi farklı giriş değerlerinde değişik karakteristikler
sergilediğinden hangi değerlerde ne tip karakteristikler
sergilediği bazı çalışmalarda önem arz etmektedir. Örneğin
Chua devresi güvenli haberleşme sistemlerinde sık
kullanılmaktadır [4-6]. Mesajın gizliliği için kaotik olması
istenmektedir. İşte burada Chua devresinin hangi değerlerde
kaotik olduğu önem arz etmektedir. Kaotiklik derecesinin
yükselmesi işaretin daha sonraki adımlarının görülmesini
olumsuz yönde etkilemektedir. Yani öngörüyü negatif yönde
etkilemektedir. Bu da güvenli mesaj iletimi için önem arz
etmektedir.
dx
 a ( y  x  g ( x ))
dt
dy
 x yz
dt
dz
 by
dt
(1)
Denklem (1)’deki “a” ve “b” boyutsuz parametrelerdir.
g(x) fonksiyonu denklem (2)’de gösterilmiştir. Denklem
(2)’deki “c” ve “d” ise katsayılardır.
1
(2)
g ( x )  cx  ( d  c )( x  1  x  1 )
2
İşaretlerin kaotiklik davranışlarını zaman dinamiklerinde
görmek hiç de kolay değildir. Bunun için işaretleri faz uzayına
taşımak ve başlangıç koşullarına hassas bağlılıklarını ölçmek
için Lyapunov üstellerini incelemek gerekir. Çalışmamızda,
öncelikle Chua diferansiyel denklemleri gerçekleştirilmiş ve
sonra devredeki değişkenlerin zaman dinamikleri elde
edilmiştir. Sonra bu değişkenlerin birbirleriyle karşılaştırılması
yapılarak faz uzayları çizilmiştir. Daha sonra da farklı devre
parametrelerine göre zaman dinamiği, faz uzayı ve Lyapunov
üstel grafikleri elde edilerek karşılaştırılmaları yapılmıştır.
Chua devresinin farklı giriş koşulları altında nasıl
dinamikler gösterdiği aşağıda değişik örneklerle incelenmiştir.
992
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
Şekil 1’de görüldüğü gibi artan bir periyodik işaret,
Şekil 2’de azalan bir periyodik işaret ve Şekil 3’te ise kaotik
bir işaret elde edilmiştir. Tüm bu işaretler sadece başlangıç
değerlerinin değiştirilmesiyle sağlanmıştır. Bu dinamikler faz
uzayına taşındığı zaman daha anlamlı şekiller elde
edilmektedir.
y(0)=0.01 için y dinamiği
8
6
4
y
2
0
2.2. Faz (Durum) Uzayı
-2
Lyapunov üstel dinamiği için faz uzayının oluşturulması önem
arz etmektedir. Çünkü kaotik dinamiklerin hesaplanması için,
zaman serisinin faz uzayında yeniden oluşturulması
gerekmektedir. Faz uzayında aynı zaman diliminde iki veya
daha fazla fonksiyonun birbiriyle karşılaştırılması yapıldığı
için, durum uzayını yapılandırmak için en az iki fonksiyon
gereklidir. Takens [8], aynı değişkenin farklı anlardaki
değerlerini koordinat olarak kullandığı sahte (pseudo) faz
uzayını ortaya koymuştur. Bu uzayda genellikle bir koordinat
orijinal zaman serisinden, diğerleri de zaman serisinin
gecikmiş değerlerinden oluşur. Burada önemli olan en uygun
gecikme değerinin ve koordinat sayısının bulunmasıdır.
Takens’a (1981) göre yalnızca bir zaman serisi varsa, zaman
serisinin bir veya daha çok türevleri kullanılarak
Denklem(3)’deki gibi faz uzayı gerçekleştirilebilir.
-4
-6
-8
0
1000
2000
3000
t(zaman)
4000
5000
6000
Şekil 1: Chua devresinin x(0)=0.01, y(0)=0.01, z(0)=0.01
için y dinamiği
y(0)=0.05 için y dinamiği
20
15
X  x(t )  x(t   )  x(t  2 )  ....x(t  (m  1) )
10
y
5
Denklem (3)’de kullanılan m yerleştirme boyutu, τ ise
zaman gecikmesidir. Yerleştirme boyutu m, en yakın yanlış
komşuluklar metodu ile zaman gecikmesi τ ise karşılıklı bilgi
fonksiyonun ilk yerel minimumundan hesaplanır. Yerleştirme
boyutu m hesaplanırken Denklem (4)’deki durum göz önünde
bulundurulmalıdır. Burada “d” faz uzayındaki çekicinin
boyutudur.
0
-5
-10
-15
-20
(3)
0
1000
2000
3000
t(zaman)
4000
5000
2d  1  m
6000
(4)
Zaman gecikmesi τ değeri küçük olduğu zaman çekici
doğrusallaşarak, büyük olduğu zaman ise faz uzayında
dağılarak özelliğini kaybeder [9].
Şekil 2: Chua devresinin x(0)=0.05, y(0)=0.05, z(0)=0.05
için y dinamiği.
Aşağıdaki Şekil 4, 5 ve 6’da, Şekil 1, 2 ve 3’te gösterilen
Chua zaman dinamiklerinin faz uzayları oluşturulmuştur.
y(0)=0.05 için y dinamiği
1
(y,z) için faz uzayı
0.02
0.5
0.015
0
y
0.01
0.005
z
-0.5
0
-0.005
-1
-0.01
-1.5
0
200
400
600
800
1000 1200
t(zaman)
1400
1600
1800
2000
-0.015
-0.02
-8
Şekil 3: Chua devresinin x(0)=0.05, y(0)=0.05, z(0)=0 için
y dinamiği.
-6
-4
-2
0
y
2
4
6
8
Şekil 4: Chua devresinin x(0)=0.01, y(0)=0.01, z(0)=0.01
için (y,z) faz uzayı.
993
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
Aşağıdaki Şekil 7, 8 ve 9’da farklı başlangıç koşulları için
değişik Lyapunov üstel dinamikleri gösterilmiştir.
(y,z) için faz uzayı
0.05
0.04
Lyapunov Üstel Dinamiği
2
0.03
0.02
1
0.01
Lyapunov Üstelleri
z
0
-0.01
-0.02
-0.03
0
-1
-2
-0.04
-3
-0.05
-20
-15
-10
-5
0
y
5
10
15
20
Şekil 5: Chua devresinin x(0)=0.05, y(0)=0.05, z(0)=0.05
için (y,z) faz uzayı.
-4
0
10
20
30
40
50
60
t(zaman)
70
80
90
100
Şekil 7: Chua devresinin x(0)=0.01, y(0)=0.01, z(0)=0.01
için Lyapunov Üstel dinamikleri.
(y,z) faz uzayı
-3
5
x 10
Lyapunov Üstel Dinamiği
2
4
1
3
Lyapunov Üstelleri
2
z
1
0
-1
-2
-3
0
-1
-2
-3
-4
-5
-1.5
-1
-0.5
0
0.5
-4
1
0
10
20
30
40
y
Şekil 6: Chua devresinin x(0)=0.05, y(0)=0.05, z(0)=0 için
(y,z) faz uzayı.
50
60
t(zaman)
70
80
90
100
Şekil 8: Chua devresinin x(0)=0.05, y(0)=0.05, z(0)=0.05
için Lyapunov Üstel dinamikleri.
Lyapunov Üstel Dinamiği
3
Şekil 4’te gösterilen çekici Şekil 1’deki Chua zaman
dinamiğine aittir. Zaman dinamiği artan periyodik işaret
olduğundan faz uzayı da dışa doğru yoğunlaşan limit çevrim
halini almıştır. Şekil 5’te gösterilen çekici Şekil 2’deki Chua
zaman dinamiğine aittir. Zaman dinamiği azalan periyodik
işaret olduğundan faz uzayı da içe doğru yoğunlaşan limit
çevrim halini almıştır. Şekil 6’da verilen çekici ise Şekil 3’teki
zaman dinamiğine aittir. Zaman dinamiği kaotik olduğundan
faz uzayı da garip (kaotik) çekici halini almıştır.
2
Lyapunov Üstelleri
1
0
-1
-2
-3
2.3. Lyapunov Üstel Dinamiği
Lyapunov üstellerinin pozitif olması, başlangıç şartlarına
hassas bağımlılığın bir ölçüsü olarak kabul edilmektedir.
Lyapunov üstel dinamiğinin pozitif değer alması, faz
uzayındaki eğrilerin başlangıcının küçük değişikliklere
uğratılması ile tahmin edilemeyecek derecede sapmalarından
kaynaklıdır. Bu da kaotikliğin bir göstergesi olarak kabul
edilir. Deterministik sistemleri, tahmin edilemezlik zırhına
büründüren işte bu fizyolojik özelliktir.
-4
0
10
20
30
40
50
60
t(zaman)
70
80
90
100
Şekil 9: Chua devresinin x(0)=0.05, y(0)=0.05, z(0)=0 için
Lyapunov Üstel dinamikleri.
Şekil 7 ve 8’de, sırasıyla artan ve azalan periyodik
işaretlerin Lyapunov üstelleri gösterilmiştir. Şekil 9’da ise
kaotik Chua devresinin Lyapunov üstelleri gösterilmiştir.
994
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
uzayında garip çeker oluşturdukları, Lyapunov üstelleri
alındığında ise en az bir değerin pozitif değere evrildiği
görülmüştür (Şekil 9).
Görüldüğü gibi Şekil 9’daki Lyapunov üstellerinden en az
birisi pozitif değere evrilmiştir. Bu da kaotiklik için gerekli
bir şarttır.
YSA’ya (x,y,z) giriş değerlerinin entropileri öznitelik vektörü
olarak uygulanmış ve farklı başlangıç değerlerinde periyodik
veya kaotik özellik gösterdiği görülmüştür. Rastgele verilen
giriş değerlerine göre yapılan testlerde tam başarım elde
edilmiştir.
2.4. Yapay Sinir Ağları
YSA, karşılaştırma ve sınıflandırmalarda yaygın olarak
kullanılan bir araçtır. YSA’nın temelinde, zekâ gerektiren
işlemlerden oluşan bilgi işleme işlevi vardır. Bu sistem tek
yönlü işaret kanalları ile birbirine bağlanan işlem
elemanlarından oluşur. YSA ile insan beyninin fonksiyonları
arasında bir benzerlik de vardır. Bu yüzden YSA sistemine
insan beyninin modeli de denilebilir. YSA davranışları çevre
şartlarına göre şekillenebilir. Girişler ve istenen çıkışların
sisteme verilmesi ile kendisini farklı cevaplar verebilecek
şekilde ayarlayabilir. Tipik bir YSA, işlem elemanlarından
oluşan katmanların bileşimidir. En yaygın kullanılan YSA tipi,
geri beslemeli öğrenmeye sahip çok katmanlı algılayıcıdır.
Çok katmanlı algılayıcı, dışarıdan verileri alan giriş
katmanından, ağın çıktılarını dışarıya veren çıktı katmanından
ve bu ikisi arasında genellikle bir ve bazen de daha fazla gizli
katmandan meydana gelmektedir [10].
4. Kaynakça
[1] R., Kılıç, F., Yıldırım, “CFOA-Tabanlı Kaotik Chua
Devresinin Tasarımı ve Yüksek Frekans Performansının
Deneysel Olarak Doğrulanması”, 11. Sinyal İşleme ve
İletişim Uygulamaları Kurultayı-SIU, s: 357-360, 2003.
[2] A., Gülten, M., Türk, “Examination of chaotic behaviours
using bond graph model”, Journal of the Franklin
Institute, 340 (6-7), p: 415-422, 2003.
[3] M. P., Kennedy, “Three Steps to Chaos-Part I:
Evolution”, IEEE Transaction on Circuits and Systems,
40(10), p: 640-656, 1993.
[4] T., Yang, L.O., Chua, “Secure Communication via
Chaotic Parameter Modulation”, IEEE Transactions on
Circuits and Systems-I:Fundamental Theory and
Applications, 43(9), p: 817-819, 1996.
[5] C., Cruz-Hernandez, “Synchronization of Time Delay
Chua’s Ossilator with Application to Secure
Communication”, Nonlinear Dynamics and Systems
Theory, 4(1), p:1-13,2004.
[6] M., Mamat, M., Sanjaya WS., D.S., Maulana, “Numerical
Simulation Chaotic Synchronization of Chua Circuit and
Its Application for Secure Communication”, Applied
Mathematical Sciences, 7(1), p:1-10, 2013.
[7] S., Lynch, “Dynamical Systems with Application using
Mathematica”, p: 160-161, Boston, 2007.
[8] F., Takens, “Detecting Strange Attractors in Turbulunce”,
Lecture Notes in Mathematics, p: 366-381, 1981.
[9] H., Acar, M., Bayram, “Epileptik Nöbetin Lyapunov
Üsteli, Dalgacık Entropi ve Yapay Sinir Ağları İle
Kestirimi”, 20. Sinyal İşleme ve İletişim Uygulamaları
Kurultayı, 18-20 Nisan 2012, Muğla.
[10] D. JC., MacKay, “Information Theory, Inference and
Learning Algorithms”, Cambridge University Press, 527,
UK, 2003.
Farklı durumlar üzerinde çalışılarak, en başarılı sonucu
veren YSA modeli Şekil 4’te elde edilmiştir. Bu model 3 giriş,
6 nöronlu bir gizli katman ve 2 çıkıştan oluşmaktadır. Gizli ve
çıkış katmanları için log sigmoid transfer fonksiyonu, öğrenme
algoritması için de Levenberg-Marquardt algoritması
kullanılmıştır. Girişler x, y ve z Chua zaman dinamiklerine ait
entropiler olup sırasıyla entx, enty ve entz’dir.
.
.
.
Giriş
Katmanı
Gizli
Katman
Çıkış
Katmanı
Şekil 4: Çok katmanlı Yapay Sinir Ağları modeli.
Çıkış katmanı ise Chua devresinin kaotik ve artan mı
yoksa azalan mı olduğunu gözetmeksizin periyodik durumunu
göstermektedir.
3. Tartışma ve Sonuç
Bu çalışmada, yaygın olarak kullanılan Chua devresinin farklı
başlangıç koşullarında değişik zaman dinamikleri gösterdiği
gözlenmiştir. Bu farklılıklar faz uzayında da gözlenmiş ve
grafikler incelendiğinde zaman dinamiğinde periyodik olarak
görülen işaretlerin faz uzayında limit çevrim oluşturdukları
görülmektedir. Limit çevrim oluşturan dinamiklerin Lyapunov
üstelleri alındığında sıfıra yaklaştıkları gözlenmiştir (Şekil 7 8). Kaotik özellik gösteren Chua dinamiklerinin ise faz
995
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
YSA ve Pencere Ortalamaları Kullanılarak Yüz Tanıma Sistemi
Ali Ötkün1, Bekir Karlık1
1
Bilgisayar Mühendisliği Bölümü
Selçuk Üniversitesi, Konya
[email protected]
[email protected]
Yüz tanıma sistemi, bir fotoğraf veya bir videodaki yüzün
karakteristik özelliklerinin kullanılarak teşhis etme, kimlik
belirleme veya doğrulama işleminin yapıldığı biyometrik
tanıma sistemleridir.
İnsanın
yüz
özelliklerinin
çıkartılması
kolay
olmadığından yüz tanımanın gelişimi çok eskiye
dayanmamaktadır. Yüzümüzün içerdiği özelliklerin fazlalığı
bu özellikleri kullanacak yöntemlerin de sayısını arttırmıştır.
Değişik özellikleri kullanan değişik yöntemler ortaya
çıkmıştır[1]. Bu yöntemleri şekilsel ve renk özelliklerinden
yararlanılarak tanıma olmak üzere iki kısımda gruplamak
mümkündür. İnsan yüzünde yaklaşık olarak seksen tane
belirleyici nokta vardır. Genellikle bu noktalardan on ila yirmi
tanesi alınarak şekilsel verilerden tanıma yapılabilir. Veya
doğrudan resim işleme ve uygun dönüşümlerle renk verisi
kullanılarak tanıma işlemi yapılmaktadır.
Yüz tanıma alanında yapılan çalışmalardan ilki
sayılabilecek yöntem olan “eigenfaces” Sirovich ve Kirby [2]
tarafından ortaya atılmıştır. Daha sonra bu yöntem M. Turk ve
A. Pentland [3] tarafından kullanılmıştır.
Hua Yu*, Jie Yang[4] yaptıkları çalışmada doğrudan
Doğrusal Diskriminant Analizi(Linear Discriminant Analysis LDA) kullanmışlardır. Çalışmalarını ORL veri tabanını
kullanarak gerçekleştirmişlerdir. Çalışmalarında kullandıkları
yöntemde boyut indirgeme kullanmadan 90,8% tanıma
oranına ulaşmışlardır.
Kyungnam Kim[5] çalışmasında temel bileşen analizi
(Principle Component Analysis) yöntemini kullanarak AT&T
Laboratuvarları veri tabanını üzerinde yüz tanıma alanında
çalışmalar yapmıştır. Yapmış olduğu çalışmalarda yüz verisi
olmayan verileri de kullanmış başarılı sonuçlar elde etmiştir.
Meng Joo Er[6] ve arkadaşları ORL veri tabanı üzerinde
radyal tabanlı fonksiyon sinir ağı (Radial Basis Function
Neural Networks) kullanarak çalışmalar yapmışlardır. Öz
nitelik çıkarımı için eigenfaces ve temel bileşen analizi
kullanmışlardır. Çalışmalar sonucunda 1.92% hata oranıyla
tanıma yakalamışlardır.
Karlık ve Atamuradov[7] Temel Bileşenler Analizi
(Principle Companent Analysis-PCA) tabanlı Bayes
sınıflandırıcılı bir yüz tanıma sistemi sunmuşlardır. Tüm bu
çalışmalarda hazır veri tabanları kulanılarak doğrudan yüz
resimlerinden yararlanılmıştır. Tilki ve Karlık[8] yüze ait
temel özellikler alınarak altın oranların kullanıldığı bir veri
seti ile yüz tanıma sistemi üzerinde çalışmışlardır.
Bu çalışmada ise, Java programlama dili kullanılarak
insan yüz özniteliklerinin çıkarımı ve kişilerin tanınması
üzerine bir uygulama geliştirilmiştir. Öz nitelik vektörü
çıkarma işlemi için pencere ortalamaları kullanılmıştır.
Öznitelikleri elde edilen yüz verileri yapay sinir ağı
Özetçe
Son yıllarda en popüler biyometrik tanıma sistemlerinden
birisi de yüz tanıma sistemleridir. Şahsi hayatı ihlal etmeden
kişiyi uzaktan tanımlama amaçlı kullanılan yüz tanıma
sistemi, bir resmi ya da video görüntüsünü yüzün karakteristik
özelliklerini tanımlayan bir koda dönüştürülmesi esasına
dayanır. Bu çalışmada, pencere ortalama tabanlı öz nitelik
çıkartma algoritması ile yapay sinir ağları (YSA) sınıflandırıcı
kullanılarak etkin kullanımlı bir yüz tanıma yazılımı
sunulmuştur. Yazılımda Java programlama dili kullanılmıştır.
1. Giriş
Eski çağlardan günümüze kimlik doğrulama ve
tanımlama
insanoğlunun
önemli
problemlerindendir.
Bilgisayar bilimlerinin gelişimiyle birlikte kimlik denetimi
için geliştirilen yöntemler farklılaşmıştır. İlk başlarda şifre
gibi bilgi tabanlı kimlik denetimi yöntemleri geliştirilmiştir.
Ardından akıllı kartlar gibi anahtar temelli denetim yöntemleri
geliştirilmiştir. Fakat her iki yöntemde de unutulma, kaybolma
ve çalınma gibi sorunlar vardır. Bu nedenle kişinin sürekli
yanında taşıyacağı, başkasına vermeyeceği ve kaybetmeyeceği
bir yöntem olarak kişiye ait bir organın veya bir hareketin
denetim mekanizması olarak kullanılması fikri ortaya
çıkmıştır. Bu tür tanımlama ve doğrulama yöntemlerine de
biyometrik tanıma yöntemleri adı verilmiştir[1].
Biyometrik tanıma sistemleri, bir bireyin fiziksel veya
davranışsal benzersizliğini ölçen ve mevcut kayıtlarla
karşılaştırarak tanımlama ve doğrulama yapan otomatik
sistemlerdir. Biyometrik sistemler bir şifreyi aklında tutma
veya bir anahtarı yanında taşıma zorunluluklarını ortadan
kaldırır. Benzer biçimde unutma, çalınma veya kaybedilme
gibi sorunları ortadan kaldırır. Parmak izi, el geometrisi, yüz,
iris, retina, imza ve tuş vuruşu tanıma sistemleri biyometrik
tanıma sistemlerine birer örnektir.
Biyometrik tanıma sistemleri fiziksel ve davranışsal
olmak üzere iki kısım altında incelenmektedir. Fiziksel
biyometrik tanıma sistemleri bireyleri birbirinden ayırt etmek
için belirli organların şekilleri ile ilgilenirler. Yüz, parmak izi,
el, iris ve retina tanıma sistemleri bu tür biyometrik tanıma
sistemlerine güzel örneklerdir. En eski fizyolojik biyometrik
tanıma sistemi parmak izi tanımadır. Davranışsal biyometrik
tanıma sistemleri ise kişilerin davranışlarına, hareketlerine
bakılarak birbirinden ayırt etmeyi amaçlayan sistemlerdir. Bu
tür tanıma sistemlerine örnek olarak imza tanıma, yürüyüş
tanıma, tuş vuruşlarından tanıma gibi örnekler verebiliriz. Bu
yöntemin en eskisi ise imza tanımadır.
996
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
kullanılarak başarılı bir şekilde sınıflandırılmıştır. Yapılan
çalışmalar ORL veri tabanı[9] üzerinde test edilmiştir.
Uygulamalarda en çok kullanılan YSA mimarisi, çok katman
içeren bir mimari olup genelde hatanın geriye yayılımı (Error
Back-propagation) algoritmasını kullanmaktadır[10].
YSA ağ yapısında, verilen bir girdi setine karşılık çıktı
değerleri verilerek belirtilen öğrenme kuralına göre ağırlık
değerleri otomatik olarak değiştirilmektedir. Eğitim verisinin
tamamlanmasından sonra eğitilmiş olan ağ, ağırlık
değerlerinin son durumuna göre, verilen herhangi bir veri
setinin sonucunu tahmin edebilmektedir[11]. Bu çalışmada da
Çok Katmanlı İdrak (Multi Layer Perceptron-MLP) mimarisi
kullanılmıştır. İleri beslemeli geri yayılımlı bir Çok Katmanlı
Ağ Modeli Şekil 2' de gösterilmiştir.
2. Kullanılan Materyaller Ve Yöntemler
Bu çalışmada iki boyutlu insan yüz resmi kullanılarak kişinin
tanınması ele alınmıştır. Yüz tanıma için ORL veri
tabanındaki yüz verileri ele alınmıştır. Uygulama Java
programlama dili SDK 1.7 ve Netbeans 7.3 IDE’si
kullanılarak geliştirilmiştir.
2.1. ORL Veri Tabanı
Yüz veri tabanı olarak ORL veri tabanı kullanılmıştır. ORL
veri tabanında s1, s2, s3, … , s40 olmak üzere 40 kişinin,
1.pgm, 2.pgm, … , 10.pgm olmak üzere 10’ar adet resmi
bulunmaktadır. Toplamda 400 adet resim vardır. Resimlerin
boyutları eşit ve Şekil 1’de gösterildiği gibi genişlikleri 92px,
yükseklikleri 112px’dir.
Hatanın geri yayılımı yönü
Ç ı k ış l a r
G i r i ş l e r
92 px
Giriş Katmanı
112 px
Gizli Katmanlar
Eşik(Bias)
Çıkış Katmanı
Eşik(Bias)
İleri besleme yönü
Şekil 1: ORL yüz veri tabanında s1 kişisinin 1.pgm resmi
2.2. Görüntü İşleme ve Öz Nitelik Çıkarımı
Şekil 2: Çok katmanlı idrak modeli
Veri tabanında bulunan resimler Pgm formatındadır. Pgm
resim formatı resimlerin gri seviye değerlerinin tutulduğu bir
resim dosyası şeklidir. Bu resimler sadece yüz resmi oldukları
ve gri tonda bulundukları için yüz tespiti ve grileştirme ön
işlemleri yapılmamıştır.
Öz nitelik vektörü çıkarma yöntemi olarak pencere
ortalamaları yöntemi kullanılmıştır. Resim uygulamada
verilen genişlik ve yükseklikte pencerelere ayrılır. Sonra bu
pencerelerin ortalaması bulunduktan sonra en büyük gri piksel
değeri 255 ‘e bölünerek normalleştirme yapılır. Elde edilen öz
nitelik vektörü genişlik * yükseklik boyutundadır.
3. Biyometrik Yüz Tanıma Sistemi
Bu çalışmada insan yüz resminden kişi tanıma sistemi
gerçekleştirilmiştir. Yüz veri tabanından alınan yüz
resimlerinin sınıflandırılması için kullanılan öznitelik vektörü
çıkarma algoritmaları belirlenmiştir. İleri yönlü geri beslemeli
çok katmanlı bir yapay sinir ağı geliştirilerek elde edilen
öznitelik verileri ağa girdi olarak verilmiş ve ağın eğitiminden
sonra çıkışta başarılı bir şekilde sınıflandırılmıştır.
Geliştirilmiş olan uygulamada resimler gerçek zamanlı
bir kameradan değil doğrudan bir veri tabanından elde
edilmiştir. Bu sebeple yüz tespiti ve kameradan yüz verisi elde
etme işlemleri gerçekleştirilmemiştir. Ayrıca veri tabanındaki
resimlerin boyutları aynı ve tamamı gri seviye olduğu için
grileştirme ve boyutlandırma gibi ön işlemler yapılmamıştır.
Gerçek zamanlı yüz tanıma sistemlerinin genel yapısı
Şekil 3’te gösterildiği gibi bir yüz tespiti ve elde edilen yüz
verisinin belirli
bir ön işlem sürecinden geçirilmesi
şeklindedir.
2.3. Yapay Sinir Ağları (YSA)
Beynin bir işlevi yerine getirme yöntemini modellemek için
tasarlanan bir sistem olarak tanımlanabilir. Yapay sinir ağları,
beynin bilgi işleme yöntemine uygun olarak bir öğrenme
sürecinden sonra bilgi toplama, hücreler arası bağlantı
ağırlıkları ile bu bilgiyi saklama, genelleme ve çıkarım
kabiliyetlerine sahip paralel dağıtılmış sistemdir. YSA’da
öğrenme süreci, arzu edilen amaca ulaşmak için ağ
ağırlıklarının yenilenmesini (güncellenmesini) sağlayan
öğrenme algoritmalarının çalıştırılmasını ihtiva eder.
997
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
3.2. Öz Nitelik Vektörü Çıkarma
Bu aşama genel olarak biyometrik tanıma sistemlerinin en
önemli aşamasıdır. Bu sebeple yüz tanımanın da en önemli
adımıdır. Burada yapılacak olan işlem elimizdeki yüz verisinin
bir nevi imzasının çıkarılması işlemidir.
Öznitelik vektörü çıkartmanın iki amacı vardır. İlki
sınıflandırıcı için eldeki büyük resim verisini küçültmek.
İkincisi ise elimizdeki verinin önemli noktalarını bularak aynı
kişinin farklı resimlerindeki küçük değişikliklerden sistemin
etkilenmesinin önüne geçmektir.
İnsan yüzü çok sayıda nitelik içermesi bakımından bu
aşamada birçok yöntem geliştirilmiştir. Bu yöntemler genel
olarak iki kısım altında incelenebilir. Birinci kısım doğrudan
yüz resmi üzerinde işlemler yapılarak resmin önemli
noktalarının tespit edilmesi ve bu şekilde öz nitelik
vektörünün elde edilmesidir. Eigenfaces, PCA, ICA, LDA,
LBP ve pencere ortalamaları gibi yöntemler bu tür öz nitelik
çıkarımına verilebilecek örneklerdir. İkinci kısım öz nitelik
vektörü çıkarma yöntemi ise yüz üzerinde bulunan seksene
yakın önemli noktanın bir takım resim işleme ve örüntü
tanıma yöntemleri kullanılarak bulunmasıdır. Kullanımda
genel olarak bu seksen noktadan on ila yirmi tanesi bulunur ve
bir öz nitelik vektörü elde edilir.
Bu çalışmada, öz nitelik vektörü çıkarma yöntemi olarak
pencere ortalamaları yöntemi kullanılmıştır. Yüz resmi
uygulamada verilen genişlik ve yükseklikte pencerelere ayrılır.
Sonra bu pencerelerin piksel değerlerinin aritmetik ortalaması
bulunduktan sonra en büyük gri piksel değeri 255 ‘e bölünerek
normalleştirme yapılır. Oluşan vektör genişlik*yükseklik
boyutundadır. Şekil 5’te görülen örnekte genişlik 8 ve
yükseklik 8 olarak verilmiştir. Dolayısıyla öz nitelik
vektörlerimizin boyutları 64’tür. Genişlik ve yükseklik örnekte
verildiği gibi olduğu zaman bir pencerenin genişliği 92/8=
11px ve yüksekliği 112/8=14px olmaktadır.
Şekil 3: Gerçek zamanlı yüz tanıma sistemi blok diyagramı
Bir kameradan, bir videodan veya bir resim veri
tabanından elde edilen resimler yüz bölgesi tespiti için
hazırlanır. Örneğin elde edilen resimde gürültü varsa
temizlenir. Elde edilen resim üzerinde yüz tespiti algoritmaları
çalıştırılarak yüz kesiti alınır. Elde edilen yüz kesiti öz nitelik
vektörü çıkarma işlemi için yüz resimlerini aynı boyuta
getirme, gri seviyeye dönüştürme gibi bir ön işlemden
geçirilir. Bütün ön işlemler bittikten sonra eldeki yüz
resimleri belirli algoritmalar kullanılarak öz nitelik çıkartılır.
Elde edilen öz nitelik vektörleri bir sınıflandırıcı ile
sınıflandırılarak tanıma yapılır.
Bu çalışmada resimler bir kameradan, bir videodan veya
işlenmemiş geniş bir resim üzerinden elde edilmeyip, bir veri
tabanından hazır alınmış ve bunun üzerine çalışma yapılmıştır.
Bu sebeple yapmış olduğumuz uygulamanın blok diyagramı
Şekil 3’ten biraz daha farklıdır. Geliştirilen uygulamanın
diyagramı Şekil 4’teki gibidir.
Şekil 4: Uygulama blok diyagramı
Görüldüğü üzere gerçek zamanlı yüz tanıma sisteminden
farklı olarak bazı ön işleme adımlarına ihtiyaç duyulmamıştır.
Bu adımlar detaylı bir şekilde anlatılacaktır.
Şekil 5: 8 x 8 pencereye bölünmüş resim
Şekil 6’da görüldüğü resim genişliği 8’e bölündüğü
zaman 4 px kalan oluşmaktadır. Bu durumda karşımıza iki
seçenek çıkar. Bunlardan ilki bu kalan değerleri hesaba
katmadan işlemlere devam etmek olabilir. Aynı durum
yükseklik pikselleri içinde geçerlidir. İkinci seçenek olarak bu
kalan piksellerin bir şekilde değerlendirilmesi söz konusu
olabilir. Bunun için birçok yöntem geliştirilebilir. Pikseller
sabit bir renk genişlik ve yükseklik oranına bölünecek şekilde
tamamlanabilir. Veya en yakın dolu değerini kopyalama
şeklinde olabilir. Ayrıca bu yöntemler ikiye bölünüp genişlik
3.1. Veri Tabanından Resmin Okunması
Veri tabanından resmin okunması bu çalışmanın ilk adımını
teşkil etmektedir. Kullanıcı ORL veri tabanının bulunduğu
yeri uygulamaya gösterir. ORL veri tabanındaki resimler daha
önce de belirtildiği gibi pgm formatındadır. Pgm formatı
resimlerin gri seviye değerlerin tutulduğu resim formatıdır.
Veri tabanında 40 kişinin 10’ar adet olmak üzere toplamda
400 adet resim vardır. Kişi isimleri yerine kişilerin bulunduğu
klasör isimleri kullanılmıştır.
998
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
Gizli katmandaki düğüm sayısı ise giriş ve çıkış katman
düğüm sayılarından hangisi fazla ise o kadardır. Kullanılan
çok katmanlı idrak ağı (Multi Layer Perceptron - MLP) yapısı
64:64:40 biçimindedir. Uygulanan ağ modeli Şekil 8’de
gösterilmiştir.
için hem sağa hem sola, yükseklik için hem yukarıya hem
aşağıya olacak şekilde eşit olarak dağıtılabilir.
Uygulamada kalan pikseller Şekil’6 de olduğu gibi 0x00
ile genişlik oranına bölünecek şekilde (örneğimizde genişlik 8
olduğu için 96 ya) yukarıya tamamlanmıştır. Bu sayede tüm
piksellerin kullanılması sağlanmıştır.
Şekil 8: Uygulamada kullanılan yapay sinir ağı yapısı
Uygulamanın ikinci adımı yapay sinir ağının
eğitilmesidir. Şekil 9’da görüldüğü üzere yapay sinir ağının
parametreleri ayarlanabilmektedir. Durma kriteri olarak hata
oranı çok küçük verilirse döngü kriteri ile duracaktır. Hata
kriteri normal verilip durma kriteri çok yüksek verilirse bu
durumda hata kriterine göre sonlanma olacaktır. Her iki
durumda eğitim sonunda ulaşılan minimum hata, döngü sayısı
ve işlem süresi ekrana basılır.
Şekil 6: Kalan pikseller 0x00 ile tamamlanmıştır
Bu işlemin çalışmaya oldukça katkısının olduğu
gözlenmiştir. Tanıma oranının %3-4 oranında artmasına ve
eğitimdeki döngü sayısının neredeyse yarıya düşmesine vesile
olmuştur. Bunun sebebi de bu kalan piksellerde bazen kişinin
kulağı, gözü, burnu ve ağzı gibi belirleyici özelliklerinin
bulunmasıdır. Şekil 7’de uygulamanın öz nitelik çıkarma
ekranı gösterilmektedir.
Şekil 9: Yapay sinir ağının eğitim ekranı
Eğitim verileri olarak hangi resimlerin verileceği
ekrandan seçilir. Uygulamada genellikle eğitim verisi olarak
tek sayı numaralı resimler verilmiş, çift sayı numaralı veriler
test için ayrılmıştır. Eğitim verileri yapay sinir ağına
gösterilirken önce bir kişinin seçilen resimlerinin tümü, sonra
ikinci kişinin resimlerinin tümü ve bu şekilde bütün kişilerin
seçilen eğitim resimlerinin tümü gösterilmiştir. Bu durumda
ağ öğrenme yapmamış ezberleme yapmıştır. Farklı resimler
gösterildiği zaman bütün kişiler için tek bir sonuç döndürecek
şekilde çalışmıştır. Daha sonra eğitimde örneklerin gösterilme
sırası değiştirilmiş, önce tüm kişilerin seçilen ilk resimleri,
sonra tüm kişilerin seçilen ikinci resimleri ve bu şekilde tüm
kişilerin seçilen resimleri kişi sırasına göre değil resim sırasına
göre ağa gösterilmiştir. Bu sayede ağ öğrenmiş ve doğru sonuç
Şekil 7: Öznitelik vektörü çıkarma ekranı
3.3. Sınıflandırma
Uygulamada sınıflandırıcı olarak geri beslemeli yapay sinir
ağı kullanılmıştır. Ağın giriş değerleri resmin öz nitelik
vektörüdür. Giriş düğüm sayısı öz nitelik çıkarmada belirtilen
genişlik * yükseklik kadardır. Örneğimizde bu değer 8*8
olduğu için 64’tür. Çıkış düğüm sayısı ise her kişi için doğru
bir çıkış olacak şekilde düşünülmüştür. ORL veri tabanında 40
kişi olduğu için ağın çıkış düğüm sayısı da 40’tır. Her kişi için
doğru bir çıkış olacak şekilde beklenen değer kişinin indeksine
eşit olduğu çıkış düğümü 0.9 diğer düğümler 0.1 şeklindedir.
999
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
üretmeye başlamıştır. Hata kriteri olarak ortalama karesel hata
(Mean Square Error - MSE) kullanılmıştır.
Uygulamanın son adımı yapay sinir ağının test edilmesi
aşamasıdır. Burada kullanıcı isterse önce eğitim verisinde
kullanmış olduğu resimleri seçerek ağın doğru öğrenip
öğrenmediğini doğrulayabilir. İsterse eğitim esnasında
göstermediği verileri seçip ağdan tanımasını isteyebilir. Bu
çoklu testte kullanılmış olan test setindeki resim sayısı, doğru
tanıma sayısı, yanlış tanıma sayısı ve doğru tanıma oranı
ekranda gösterilir. Ayrıca yanlış tanınmış olan resimler ve bu
resimlerin kimlere ait olduğu ile kim olarak tanındığı ekrana
yazdırılır. İstenirse tek bir resim seçilerek de doğrulama ve
test işlemi yapılabilir. Bu işlemlerin yapıldığı test ekranı şekil
10’da gösterilmiştir.
5. Kaynakça
[1] Kakıcı, A. (2008), “Biyometrik Tanıma Sistemleri”;
http://www.ahmetkakici.com/genel/biyometriktanimasistemleri/, (Erişme tarihi: 13.06.2013).
[2] L. Sirovich and M. Kirby (1987). "Low-dimensional
procedure for the characterization of human faces".
Journal of the Optical Society of America A 4 (3):
519–524. doi:10.1364/JOSAA.4.000519.
[3] M. Turk and A. Pentland (1991). "Face recognition
using eigenfaces". Proc. IEEE Conference on
Computer Vision and Pattern Recognition. pp. 586–
591.
[4] Hua Yu, Jie Yang, “A Direct LDA Algorithm for
High-Dimensional Data With Application to Face
Recognition. Pattern Recognition” 34(10), 2001, pp.
2067-2070
[5] Lee, S. J., Yung, S. B., Kwon, J. W. & Hong, S. H.
(1999). “Face Detection and Recognition Using
PCA”. IEEE TENCON: 84-87.
[6] M. J. Er, S. Wu, J.Lu, and H. L. Toh “Face
Recognition With Radial Basis Function (RBF)
Neural Networks”, IEEE Trans. On Neural
Networks, Vol. 13, No. 3, May 2002
[7] Karlık B. and Atamuradov V., “Principles
Component
Analysis
(PCA)
Based
Face
Recognition by Bayesian Classifier”, International
Conference on Inductive Modelling, pp. 55-62,
May, 16-22, 2010, Yevpatoriya, Ukraine
Şekil 10: Yapay sinir ağının test edilmesi
[8] Tilki B. and Karlık B., “Face Recognition by Using
Face Dimensions and Artificial Neural Networks”,
The 4th International Conferences on Information
Security and Cryptology (ISC '10), pp. 355-359, 6-8
May, 2010, Ankara, Turkey
Uygulama test sonucu ekranında hangi resimlerin hatalı
tanındığı gösterilmiştir.
4. Sonuçlar ve Tartışma
[9] Uğur, A. C. Kınacı, "Yapay Zeka Teknikleri ve
Yapay Sinir Ağları Kullanılarak Web Sayfalarının
Sınıflandırılması", XI.
Türkiye' de İnternet
Konferansı (inet-tr'06), Ankara, 1-4, 2006.
Bu çalışmada, pencere ortalamaları ve yapay sinir ağları
kullanılarak Java tabanlı bir yüz tanıma yazılımı
gerçekleştirilmiştir. Geliştirilen yazılımın performansını
görmek için literatürde sıkça kullanılan ORL veri tabanından
yararlanılmıştır. Çalışma sonucunda 96% ila 97% oranında bir
tanıma yüzdesi gözlemlenmiştir. Bu sonuç, J. Er ve
diğerlerinin[6] çalışmasından sonra en iyi tanıma
yüzdelerinden birine sahip olmaktadır. Uygulamada
sınıflandırıcının yanlış tanımladığı kişiler incelendiği zaman
bu kişilerin gerçekte de birbirlerine benzedikleri görülmüştür.
Bunu ayırt edebilecek daha iyi bir öz nitelik vektörü çıkarımı
denenmelidir. Ayrıca çalışmada sadece bir veri tabanı
kullanılmıştır. Diğer veri tabanları da kullanılarak performans
ölçümü yapılmalıdır.
Uygulama ile öz nitelik vektörü çıkarma yönteminin
biyometrik tanıma sistemlerinde ne kadar önemli olduğunun
farkına varılmıştır. İleriki çalışmalarda öz nitelik vektörü
çıkarma yöntemlerinde bahsi geçen tamamlama yöntemleri
denenecektir. Kullanılabilecek farklı özellik çıkarma ve hibrid
sınıflandırıcı yöntemleri ile tanıma yüzdesi arttırılabilir.
[10] Karlık B. ve Cemel Ş.Ş., “Yapay Sinir Ağları ile
Ağız Kokusundan Diyabet Tanısı”, Turkiye
Klinikleri, cilt:32(2), sayfa:331-336, 2012.
[11] Karlık B. and Olgaç A.V., “Performance Analysis of
Various Activation Functions in Generalized MLP
Architectures of Neural Networks, International
Journal of Artificial Intelligence and Expert
Systems, vol: 1(4), pp: 111-122, 2011.
1000
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
Yapay Sinir Ağları ile Banka Pazarlama Kampanyalarının
Performans Tahmini
Mücella ÖZBAY KARAKUŞ1, Cemil ALTIN2, Orhan ER2
1
Bilgisayar Mühendisliği Bölümü
Bozok Üniversitesi, Yozgat
[email protected]
2
Elektrik-Elektronik Mühendisliği Bölümü
Bozok Üniversitesi, Yozgat
[email protected], [email protected]
tanıtımları incelenmiştir. 45211 kişiyle yapılan telefon
görüşmeleri sırasında kişilere bazı sorular sorulmuş, o dönem
geçerli olan kampanya tanıtılarak bankada mevduat hesabı
açtırmaları için ikna edilmeye çalışılmışlardır. Çalışma; 2008
yılının Mayıs ayından 2010 yılının Kasım ayına kadar
yapılmış olan toplam 17 kampanya için düzenlenmiştir. Elde
edilen verilerden faydalanılarak kişilerin, yapılan görüşmeler
sonucunda bankada mevduat hesabı açtırma ya da açtırmama
ihtimallerinin tahmin edilmesine yönelik incelemelerde
bulunmuşlardır.
Özetçe
20. yüzyılın ikinci yarısında temelleri atılan ve günümüzde
büyük bir kitlenin üzerinde çalıştığı yapay sinir ağları, pek çok
problemin analizinde ve çözümünde başarı ile kullanılmış ve
artan bir hızla kullanılmaya devam etmektedir. Đlk kullanıldığı
yıllarda tıp alanında ve askeri alandaki çalışmalar veya kontrol
problemleri gibi farklı amaçlar için geliştirilen bu teknik
günümüzde ekonomi, iktisat, endüstri mühendisliği,
otomasyon, elektronik ve bilgisayar mühendisliği, elektronik
devre tasarımı, çeşitli zeka problemlerinin çözümü ve optik
algılama gibi hemen her disiplinde kullanılır olmuştur. Bu
bağlamda bir bankanın pazarlama kampanyası dahilinde elde
ettiği, şahıslara ait verilerden oluşturulan eğitim ve test setleri
ile yapılandırılan yapay sinir ağının eğitilmesi sonucunda
bankanın pazarlama kampanyaları için bu kişilerin belirli
özellikleri baz alınarak bankada vadeli mevduat hesabı açtırma
ya da açtırmama durumları incelenmiştir. Bu amaç
doğrultusunda çok katmanlı yapay sinir ağı (multi-layer neural
network) kullanılmış olup % 94,22 oranında bir doğrulukla
tahmin edilmiştir.
Bu çalışma kapsamında alınan veri seti ile daha önce
denenmemiş olan yapay sinir ağı modeli kullanılarak
müşterilerin, bankada vadeli mevduat hesabı açıp açmamaları
konusunda ön tahmin yapılması amaçlanmıştır.
2. Literatür Çalışması
Yapay sinir ağları günümüzde birçok alanda yer aldığı gibi
banka kredileri alanında da yaygın bir şekilde
kullanılmaktadır. Bu çalışmada kullanılan veri seti
oluşturulurken, uluslararası veritabanı [3] kaynak alınarak;
kişilerin çeşitli özellikleri göz önünde bulundurulmuş ve
belirli kampanyalar dahilinde bankada mevduat hesabı açtırıp
açtırmayacakları
konusunda
bir
tahmin
yapılması
hedeflenmiştir. Bu konu ile ilgili az sayıda çalışma
bulunmaktadır.
Anahtar Kelimeler: Banka Pazarlama Kampanyası, Yapay
Sinir Ağları.
1. Giriş
Bankalar, hizmet sektörü içinde yer alan finansal aracılardır.
Bankacılık halkla ilişkiler faaliyetlerinin en gelişkin olduğu
işkollarından biridir ve teknolojik gelişmeleri anında
uygulamaya sokan bankacılık işkolu, bu alanda değişime
öncülük etmektedir [1]. Gelişen teknoloji sayesinde kullanıma
giren ve etkisini gittikçe arttıran kitle iletişim araçları aynı
anda milyonlarca insana ulaşıp mesajlarını aktarmakta,
kamuoyunu yönlendirmekte ve insanların tutum ve
davranışlarında köklü değişimlere neden olmaktadır.
Yatırımcıların giderek zorlaşan rekabet ortamında var olma
çabaları, yeni arayışları ve buluşları beraberinde getirmektedir
[2]. Bu bağlamda kitle iletişim araçlarından biri olan telefonun
banka uygulamalarındaki etkisini incelemek amacıyla
hazırlanmış olan bir çalışmada bir Portekiz bankasının kendi
çağrı merkezi tarafından yürütülen pazarlama kampanyası
Ref [4] farklı veriler ile yaptığı çalışmada yapay sinir ağlarını
kullanmış olup elde ettiği sonuçlara göre kredi ölçümü için
kullanılan yapay sinir ağı modelleri içerisinde PNN ve
MLP’nin diğer modellerden daha iyi performans sağladığını
belirtmiştir. Ref [5] ise yaptıkları çalışmada, bu çalışmada
kullanılmış olan veriler için veri madenciliği (DM) yaklaşımı
uygulamış ve DM modeli sonuçlarını ayarlamak için dalgalı
veri madenciliği (CRISP-DM) yaklaşımını üç iterasyon
süresince çalıştırmıştır. Çalışma kapsamında sınıflandırmada
kullanılan SVM (Support Vector Machine- Destek vektörü)
ile ROC (Receiver Operating Characteristic - işlem
karakteristik eğrisi) gibi iki istatistiksel yaklaşımın
karşılaştırılması söz konusudur. Sonuç olarak CRISP-DM’nin
her iterasyon sonunda daha iyi sonuç verdiğini açıklamışlar ve
1001
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
en iyi sonuç olarak SVM ile elde edilen yüksek öngörü
performansını kaydetmişlerdir. Çalışmada adı geçen
yöntemlerin uygulanmasıyla elde edilen bulgular ışığında en
yüksek performans değerinin SVM için kaldırma eğrisi
(ALIFT) altında kalan alana göre %88,7 ve ROC (AUC - Area
Under Curve) altında kalan alana göre ise %93,8 olduğu
Tablo 3’de görülmektedir.
4. Metot
Bu çalışma kapsamında kullanılan yapay sinir ağı yapısı;
ağırlıkların
geri
yayılma
algoritması
kullanılarak
gerçekleştirilen, iki gizli katmanlı, MLNN ağıdır (1 giriş
katmanı, iki gizli katman, bir çıkış katmanı). Gizli katman
sinirleri (birinci katman için 10, ikinci katman için 5 adet) ve
çıkış katman sinirleri için nonlineer sigmoid aktivasyon
fonksiyonu kullanılmıştır. Bu kriterler en iyi sonucu üretecek
şekilde deneme-yanılma yoluyla elde edilmiştir. Bu sistem 16
adet özellik (girdi vektörünü oluşturan durum sayısı) ve 2 adet
durum sınıflandırılması (Mevduat hesabı açtırmak ve
açtırmamak) içermektedir. Literatürde sınıflandırma için
yapılan çalışmalarda sıklıkla PNN ağının daha başarılı
sonuçlar ürettiği görülmesine [9-10] rağmen bu çalışmada
kullanılan veri sayısı çok fazla olduğundan PNN ağı beklenen
performansta başarı göstermediğinden çalışma MLNN ağıyla
denenmiş ve başarılı sonuçlar elde edilmiştir.
Tablo 1: DM ve CRISP-DM algoritmaları için her iterasyon
sonunda elde edilen performanslar [5].
CRISP-DM Iteration
Instances X Attributes (Nr.
Possible Results)
Algorithm
Number
of executions
(runs)
AUC (Area Under the ROC
Curve)
ALIFT (Area Under the
LIFT Curve)
1nd
79354
X
59(12)
2nd
55817
X
53 (2)
3nd
45211
X
29 (2)
NB
NB
DT
NB
DT
SVM
1
20
20
20
20
20
0.776
0.823
0.764
0.870
0.868
0.938
0.687
0.790
0.591
0.827
0.790
0.887
En genel anlamda yapay sinir ağları ileri beslemeli ve geri
beslemeli ağlar şeklinde iki ana grupta düşünülebilir. Đleri
beslemeli ağlarda bilgi, girdi katmanından çıktı katmanına
doğru ilerler. Buna aktivasyon yönü de denir. Bu tür yapay
sinir ağına örnek olarak tek ve çok katmanlı perseptron
verilebilir. Bu tür ağlar denetimli öğrenme teknikleriyle eğitilir
[11]. Şekil 1’ de bir nöronun matematiksel modeli
gösterilmektedir [12]:
Daha önceki çalışmalarda kullanılmış olan yöntemlerden biri
olan ROC eğrisi; istatistik karar teorisine dayanır [6]. ROC
eğrisi; testin ayırt etme gücünün belirlenmesine, çeşitli
testlerin etkinliklerinin kıyaslanmasına, uygun pozitiflik
eşiğinin belirlenmesine, laboratuar sonuçlarının kalitesinin
izlenmesine, uygulayıcının gelişiminin izlenmesine ve farklı
uygulayıcıların tanı etkinliklerinin kıyaslanmasına olanak
sağlar [7]. En yaygın kullanılan ölçüm ise, ROC eğrisinin
altında kalan alandır. AUC ne kadar büyükse sonucun tahmin
edilmesinde test o kadar iyi olur. Bir diğer yöntem olan Destek
Vektör Makineleri (SVM) ise Weston ve Watkins [8]
tarafından bulunan istatistiksel bir yöntemdir. SVM yapısal
risk en küçükleme ilkesi etrafında formüle edilmiştir. Temelde
SVM iki sınıflı problemlerle ilgilenir.
Bu çalışma dahilinde istatistiksel herhangi bir yönteme yer
verilmemiştir.
3. Veri Seti
Şekil 1: Nöronun Matematik Modeli (Mathematics Model of
Neuron) [12].
Bu çalışmada kullanılan veri seti, uluslararası veritabanı (UCIIrvine Machine Learning Repository) [3]’ den temin
edilmiştir. Bu veri seti hazırlanırken 45211 kişiye, bir Portekiz
bankasının pazarlama kampanyaları, kendi çağrı merkezi
tarafından yapılan telefon görüşmeleriyle tanıtılmıştır.
Uygulamada özellik olarak kullanılan parametreler şunlardır:
kişinin; yaşı, mesleği, medeni hali, eğitim durumu, kredi
geçmişi, yıllık ortalama gelir düzeyi (euro bazında), ev ve
ihtiyaç kredisi olup olmadığı, iletişim bilgisi, son görüşme
tarihi, görüşme sayısı, kampanya hakkındaki bilgisi, başka bir
kampanya kapsamında görüşme yapılan gün ve önceki
pazarlama kampanyası sonuçlarıdır. Bu özelliklerin geçerliliği
uzman görüşlerine dayandırılmıştır. Kullanılan toplam veri
45211 olup, 31648 adedi (tüm verinin yaklaşık %70’i) eğitim
verisi, 13563 adedi (tüm verinin yaklaşık %30’u) ise test
verisi olacak şekilde ve 16 giriş, 2 gizli katman ve 1 çıkış
katmanlı (multi-layer) yapay sinir ağının eğitiminde
kullanılmış olup yukarıda bahsi geçen özelliklere bağlı olarak
pazarlama kampanyaları için kişilerin bankada vadeli mevduat
hesabı açtırma ihtimallerinin tahmin edilmesine çalışılmıştır.
S1 =u1W1 +u2W2 +u3W3.........
+unWn −θ =∑uiWi −θ
(1)
ϕ = ψ (S )
(2)
i=1
Yukarıdaki (1) ve (2) denklemlerinde S; Toplam fonksiyonu,
ui; giriş fonksiyonu, wi; ağırlıklandırma faktörü, ᵩ; çıkış
fonksiyonu, ᴪ(s); aktivasyon fonksiyonu ve θ ise eşik
değeridir. (1) denkleminde ağırlıklı toplamın oluşturulması,
(2) denkleminde ise nöron çıkışının hesaplanması
verilmektedir [12].
Bu çalışmada geri beslemeli ağla çalışan çok katmanlı
perseptron modeli tercih edilmiştir. Basit bir perseptron,
sistem tanımlamasında başarı ile kullanılabilirken birçok
gerçek uygulama lineer olmayan özellikler içerdiği için basit
perseptron modelleri yetersiz kalabilir. Basit perseptronların
lineer olarak araştırılamayan fonksiyonları gerçekleştirmekteki
1002
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
yetersizliği çok katmanlı perseptronlarda (MLP) geçerli
değildir [13]. MLP ağları, algılayıcı birimlerin bir araya
gelerek oluşturduğu bir ağ yapısıdır. MLP'de de üç temel
katman vardır. Bunlar giriş katmanı, gizli katman ve çıkış
katmanıdır. Giriş ve çıkış katmanı dışındaki tüm katmanlar
gizli katman olarak adlandırılır ve bir veya daha fazla sayıda
bulunabilir. Bu yapı Şekil 2’de görüldüğü biçimde sıralanır.
Şekil 3: Sigmoid Tipi Aktivasyon Fonksiyonu (Sigmoid
Activation Function) [12].
5. Sonuç
Bu konuda yapılan çalışmaların az olması münasebeti ile
yapay sinir ağları da denenmiş olup bu amaç doğrultusunda
uluslararası veri tabanından alınan veriler işlenmiştir. Ayrıca
bu çalışma ile pazarlama kampanyaları için kişilerin bankada
vadeli mevduat hesabı açtırma ihtimallerinin tahmin
edilmesine yönelik uygulama sonucunda MLNN ağlarının
kullanılmasıyla elde edilen doğruluk oranları ile bu konuda
literatüre geçmiş olan çalışmaya [5] ait sonuçlar Tablo 1’de
karşılaştırmalı olarak verilmiştir.
Şekil 2: Çok Katmanlı Ağ Yapısı (Multi Layer Neural
Network)
Çalışmada kullanılan 45211 veriden 31648 (tüm verinin
yaklaşık %70’i) adedi eğitim verisi, 13563 adedi (tüm verinin
yaklaşık %30’u) ise test verisi olarak yapay sinir ağının
oluşturulması için kullanılmış ve bankanın pazarlama
kampanyaları için kişilerin bankada vadeli mevduat hesabı
açtırma ya da açtırmama durumları % 94,22 oranında bir
doğrulukla tahmin edilmiştir.
Genelde MLP ağlarının eğitiminde kullanılan en yaygın
yöntem hatanın geriye yayılım algoritmasıdır [14].
Günümüzde bu algoritma, ses tanıma problemlerinden
doğrusal olmayan sistem problemlerine kadar yapay sinir
ağları ile çözüm üretilen birçok alanda başarı ile
kullanılmaktadır [15].
Tablo 2: Bu çalışmada elde edilen doğruluk oranlarının
literatüre geçmiş çalışmalar ile karşılaştırılması.
Uygulamalarda nöron cevabının, girdilerin sürekli bir
fonksiyonu olmasını gerektiren durumlarda sigmoid tipi
aktivasyon fonksiyonu kullanılır. Geriye yayma modeli her
yerde diferansiyeli alınabilen bir aktivasyon fonksiyonu
gerektirir [16]. Grafiği aşağıda verilen sigmoid tipi aktivasyon
fonksiyonu türevi alınabilir ve sürekli problemlerin
çözümünde kullanılmaktadır. Sigmoid tipi aktivasyon
fonksiyonunun denklemi aşağıdaki gibidir [12].
1
ψ (S ) =
1 + e
(3)
Çalışmalar
Yapay Sinir Ağları
Sınıflandırma
Doğruluğu (%)
Referans [5]
ROC-AUC
93,8
Referans [5]
SVM-ALIFT
88,7
Bu çalışma
Đki Gizli Katmanlı
MLNN
94,22
−S
Elde edilen sonuçlar literatür çalışmalarıyla karşılaştırıldığında
sonuçların birbirine çok yakın olmasına rağmen MLNN ağı
kullanılmasının sonucun doğruluğunda pozitif bir etki
yarattığı yadsınamayacak (3)
bir gerçektir. Ayrıca yapay sinir
ağlarının uygulanmasının kolay ve anlaşılır olması ve yaygın
kullanım alanlarının bulunması nedeni ile tercih sebebi
olmuştur.
Sonuçta istatistiksel yöntemlere karşın yapay sinir ağının daha
başarılı bir sonuç elde edilmesini sağladığı görülmüştür. Bu
yöntemin bankalar ve aynı zamanda pazarlama çalışmaları
bulunan her kuruluş tarafından aktif bir şekilde
faydalanılabileceği düşünülmektedir.
1003
Otomatik Kontrol Ulusal Toplantısı, TOK2013, 26-28 Eylül 2013, Malatya
Đlerleyen çalışmalarda veri sayısının fazla olmasından dolayı
anlamlı sonuçlar alınamayan YSA yöntemlerinde, bu
sorunların kaynakları belirlenerek yöntemin geliştirilmesi ya
da yeni yöntemler oluşturulması amaçlı çalışmalar yapılabilir.
[13] Montague, G. A., Willis M. J., Tham M. T., Morris A. J.,
“ Artificial Neural Network Based Multivariable
Predictive Control”, Second InternationalConference on
Artificial Neural Networks, Newcastle, UK, 119-123,
1991.
Kaynakça
[1] Tolon, M., “Ticari Bankalarda Pazarlama Stratejilerinin
Uygulanması ve Türkiye"deki Ticari Bankalar Üzerine Bir
Araştırma”, Verimlilik Dergisi, No 4, 63-88, 2004.
[14] Bakırcı U., Yıldırım T., “Đleri Beslemeli Ağlarla SPECT
Görüntülerinden Kardiyak Problemlerin Teşhisi”, 07803-8318-4104/$20.00© 2004 IEEE, 103-105, 2004
[2] Baybars B., “Türkiye’de Banka Reklamcılığı”, Đstanbul
Üniversitesi Đletişim Fakültesi Dergisi, 177-180, 1996.
[15] Özel Y., “Farklı Kömür Yakıtları ile Elektrik Enerjisi
Üretimi Ve Yakıt Performansının Yapay Zeka Yöntemi
Kullanılarak Saptanması”, Doktora Tezi, Marmara
Üniversitesi, Elektrik Eğitimi, Đstanbul, 2006.
[3] (UCI-Irvine Machine Learning Repository) Uluslar arası
veri tabanı web sitesi:
http://archive.ics.uci.edu/ml/datasets/Bank+Marketing
[Son Erişim: 19.02.2013)
[4]
Bahrammirzaee A., “A comparative survey of artificial
intelligence applications in finance: artificial neural
networks, expert system and hybrid intelligent systems”,
Neural Comput & Applications, Vol 19, Issue 8, 1165–
1195, 2010.
[5]
S. Moro, R. Laureano and P. Cortez. , “Using Data
Mining for Bank Direct Marketing: An Application of
the CRISP-DM Methodology”, Proceedings of the
European Simulation and Modelling Conference ESM'2011, 117-121, Guimarães, Portugal, October,
2011.
[6]
Tomak L., Bek Y., “Đşlem karakteristik eğrisi analizi ve
eğri altında kalan alanların karşılaştırılması”, Journal of
Experimental and Clinical Medicine-Deneysel ve Klinik
Tıp Dergisi, Vol 27, No 2, 58-61, ,Samsun, 2010.
[16] Kang, H.T., Yoon, C.J., “Neural Network Approaches to
Aid Simple Truss Design Problems”, Microcomputers in
Civil Engineering, Vol 9, 211-218, 1994.
[7] Dirican A., “Tanı testi performansının değerlendirilmesi
ve kıyaslanması”. Cerrahpaşa Tıp Dergisi, 32, 25-30,
2001.
[8]
Weston J., Watkins C., “Support veclor machines for
multiclass”, Proceedings of ESANN.99, Belgium. 1999.
[9]
Bolat B. , Küçük Ü. , Yıldırım T. , “Aktif Öğrenen PNN
ile Konuşma/Müzik Sınıflandırma” . Akıllı Sistemlerde
Yenilikler ve Uygulamaları Sempozyumu, 187-189,
2004.
[10] Bolat B. , “Recognition of The Reed Instrument
Sounds By Using Statistical Neural Networks”.
Journal of Engineering and Natural SciencesMühendislik ve Fen Bilimleri Dergisi, 2005/2, 3642, 2005.
[11] Civalek Ö., “Dairesel Plakların Nöro-Fuzzy Tekniği ile
Analizi”, DEÜ Mühendislik Fakültesi Fen ve
Mühendislik Dergisi, Cilt. 1, No 2, 13-31, 1999.
[12] Güngör M., Fırat M., “Askı Madde Konsantrasyonu ve
Miktarının Yapay Sinir Ağları ile Belirlenmesi”, ĐMO
Teknik Dergi, 3267-3282, Yazı 219, 2004.
1004
Download