tc süleyman demirel üniversitesi fen bilimleri enstitüsü asenkron

advertisement
T.C.
SÜLEYMAN DEMİREL ÜNİVERSİTESİ
FEN BİLİMLERİ ENSTİTÜSÜ
ASENKRON MOTORLARDA
VERİ MADENCİLİĞİ İLE HATA TESPİTİ
Kıyas KAYAALP
Danışman: Yrd. Doç. Dr. Hakan ÇALIŞ
YÜKSEK LİSANS TEZİ
ELEKTRONİK BİLGİSAYAR EĞİTİMİ ANABİLİMDALI
ISPARTA – 2007
Fen Bilimleri Enstitüsü Müdürlüğüne
Bu çalışma jürimiz tarafından Elektronik Bilgisayar Eğitimi ANABİLİM DALI'nda
oybirliği ile YÜKSEK LİSANS TEZİ olarak kabul edilmiştir.
Başkan : Yrd. Doç. Dr. Abdülkadir ÇAKIR
(İmza)
SDÜ Tek. Eği. Fak. Elektronik Bilgisayar Eğitimi
Üye
: Yrd. Doç. Dr. Oğuz ÇOLAK
(İmza)
SDÜ Tek. Eği. Fak. Makine Eğitimi
Üye
: Yrd. Doç. Dr. Hakan ÇALIŞ
(İmza)
SDÜ Tek. Eği. Fak. Elektronik Bilgisayar Eğitimi
ONAY
Bu tez .../.../20.. tarihinde yapılan tez savunma sınavı sonucunda, yukarıdaki jüri
üyeleri tarafından kabul edilmiştir.
..../...../20...
Prof. Dr. Fatma GÖKTEPE
Enstitü Müdürü
İÇİNDEKİLER
Sayfa
İÇİNDEKİLER………………………………………………………………………..i
ÖZET………………………………………………………………………………...iii
ABSTRACT…………………………………..……………………………………..iv
TEŞEKKÜR………………………………………………………………………..…v
ŞEKİLLER DİZİNİ………………………………………………………………….vi
ÇİZELGELER DİZİNİ……………………………………………………………..viii
SİMGELER VE KISALTMALAR DİZİNİ…………………………………………ix
1. GİRİŞ………………………………………………………………………………1
1.1. Veri Madenciliğine Genel Bir Bakış……………………………………………..1
1.2. Veri Madenciliği Teknikleri……………………………………………………..2
1.3. Karar Ağaçları………………………………………..…………………………..2
1.4. Tez Hakkında…………………………………………………………………….3
2. KAYNAK ÖZETLERİ…………………………………………………………….7
3. MATERYAL VE YÖNTEM……………………………………………………..11
3.1. Materyal………………………………………..……………………………….11
3.2. Veri Madenciliği………………………………………………………………..12
3.2.1. Veri Madenciliğine Genel Bir Bakış………………………………………….12
3.2.2. Veri Madenciliğinin Gelişimini Etkileyen Faktörler…………………………13
3.2.3. Veri Madenciliğinin Kullanım Amacı………………………………………..14
3.2.4. Veri Madenciliği Uygulamaları Ve Kullanım Alanları………………………15
3.2.5. Veri Madenciliği Uygulamalarında Karşılaşılan Problemler………………...18
3.2.6. Veri Madenciliği Teknikleri………………………………………………….20
3.2.6.1. Sınıflama …………………………………………………………………...20
3.2.6.2. Kümeleme…………………………………………………………………..23
3.2.6.3. Birliktelik Kuralları ve Ardışık Örüntüler………………………………….24
3.2.6.4. Tezde Kullanılan Veri Madenciliği Tekniği………………………………..24
3.2.7. Veri Madenciliği Yazılımları…………………………………………………27
3.3.Veri Madenciliği Süreci…………………………………………………………29
3.3.1. Problemin Tanımlanması……………………………………………………..30
3.3.2. Verilerin Hazırlanması (Veri Önişleme) ……………………………………..30
i
3.3.3. Modelin Kurulması ve Değerlendirilmesi……………………………………32
3.3.4. Modelin Kullanılması………………………………………………….……..34
3.3.5. Modelin İzlenmesi……………………………………………………………34
3.4. Yöntem………………………………………………………………………….34
3.4.1. Problemin Tanımlanması……………………………………………………..34
3.4.2. Kullanılan Yazılım……………………………………………………………35
3.4.3. Uygulamada Veri Madenciliği Süreci………………………………………..39
3.4.4. Veri Hazırlama………………………………………………………………..40
3.4.5. Modelleme……………………………………………………………………43
4. ARAŞTIRMA BULGULARI VE TARTIŞMA………………………………….45
4.1. Frekans Spektrum Analizi………………………………………………………45
4.2. Veri Madenciliği ile Hata Analizi ……………………………………………...57
5. SONUÇ…………………………………………………………………………...77
6. KAYNAKLAR…………………………………………………………………...80
EK-1…………………………………………………………………………………84
ÖZGEÇMİŞ…………………………………………………………………………86
ii
ÖZET
Yüksek Lisans Tezi
ASENKRON MOTORLARDA VERİ MADENCİLİĞİ İLE HATA TESPİTİ
Kıyas KAYAALP
Süleyman Demirel Üniversitesi Fen Bilimleri Enstitüsü
Elektronik Bilgisayar Eğitimi Anabilim Dalı
Jüri: Yrd. Doç. Dr. Abdülkadir ÇAKIR
Yrd. Doç. Dr. Hakan ÇALIŞ (Danışman)
Yrd. Doç. Dr. Oğuz ÇOLAK
Asenkron motorlar endüstride en yaygın kullanılan motor tipidir. Asenkron
motorlarda oluşan hataların erken safhada tespit edilmesi maliyet açısından önemli
bir kazanç sağlamaktadır. Bu tezde veri madenciliği tekniği ile üç fazlı asenkron
motordaki sargı spirleri arasında oluşabilecek kısa devre veya yalıtım bozuklukları
ve motor milinde oluşabilecek mekanik dengesizlik hatalarının tespiti amaçlanmıştır.
Veri madenciliği büyük miktarlardaki verinin içinden anlamlı ve yararlı, ilişki ve
kuralların bilgisayar programları aracılığıyla aranması ve analizidir. Bu amaçla
WEKA veri madenciliği yazılımı kullanılmıştır. WEKA’ya 3 faz akım ve gerilim ile
sol ve sağ band için band geçiren filtre uygulanmış akım değerleri giriş parametresi
olarak verilmiştir. Bu giriş parametrelerine WEKA’da sınıflandırma tekniklerinden
karar ağacı algoritmaları uygulanmıştır. Uygulama sonucunda RepTree karar
ağacının ürettiği kuralların geçerliliği ispatlanmıştır. Elde edilen bu kurallara göre
asenkron motorlarda yukarıda adı geçen hataların bulunması için tek faz akımı yeterli
olmaktadır.
ANAHTAR KELİMELER: Asenkron motor, veri madenciliği, hata tespiti, karar
ağaçları.
2007, 85 sayfa
iii
ABSTRACT
M.Sc. Thesis
FAULT DETECTION IN INDUCTION MOTORS USING DATA MINING
Kıyas KAYAALP
Süleyman Demirel University Graduate School of Applied and Natural Sciences
Department of Electronics Computer Education
Thesis Committee: Asst. Prof. Abdülkadir ÇAKIR
Asst. Prof. Hakan ÇALIŞ (Supervisor)
Asst. Prof. Oğuz ÇOLAK
Induction motors are the most common motor types used in industry. The detection
of the induction motors in early stage provides an important outcome in terms of
cost. In this thesis, detection of the short circuit or insulating faults in the turns of the
stator winding and mechanical unbalances in the three phase induction motors are
aimed by using data mining technique. Data mining is the analyzing and searching of
the rules and obtaining of the useful and meaningful relationships in a great quantity
of data by the help of computer programs. For this purpose, data mining software
known as WEKA is used in this work. Three phase currents, voltages, and filtered
side bands of the motor current signals around fundamental supply frequency are
applied as input parameters for WEKA program. Decision tree algorithms from
classification techniques in WEKA have been applied to these input parameters. In
the test results, the effectiveness of the rules produced by RepTree decision tree
algorithms is proved. According to those acquired rules, a single phase current signal
is adequate for the detection of above mentioned faults in induction motors.
Key Words: Induction motor, data mining, fault detection, decision trees.
2007, 85 pages
iv
TEŞEKKÜR
Bu çalışmanın gerçekleşmesinde katkılarından dolayı, aşağıda adı geçen kişilere
içtenlikle teşekkür ederim.
Bu çalışmanın ana fikrinin oluşmasında, tez çalışmasının gerçekleşmesi için gerekli
ortamın hazırlanmasında, çalışmanın sonuca ulaştırılmasında ve karşılaşılan
güçlüklerin aşılmasında tez danışmanım, çok kıymetli hocam Sayın Yrd. Doç. Dr.
Hakan ÇALIŞ yön gösterici olmuştur.
Sayın Öğr. Gör. Ecir Uğur KÜÇÜKSİLLE (Süleyman Demirel Üniversitesi Teknik
Eğitim Fakültesi Elektronik Bilgisayar Eğitimi Bölümü) Veri Madenciliği
çalışmalarında ve Sayın Arş. Gör. Yusuf Erkan GÖRGÜLÜ (Süleyman Demirel
Üniversitesi Teknik Eğitim Fakültesi Elektronik Bilgisayar Eğitimi Bölümü) tezin
anlatım dilinin düzeltilmesinde yardımcı olmuşlardır.
Tezde kullanılan veriler için Artesis Teknoloji Sistemleri A.Ş. firması yetkililerine
ayrıca teşekkürlerimi sunarım.
Her zaman yanımda olan çok değerli aileme, verdikleri destek, gösterdikleri sabır ve
anlayış için şükranlarımı sunuyorum.
Kıyas KAYAALP
ISPARTA, 2007
v
ŞEKİLLER DİZİNİ
Şekil 3.1. Futbol örneği için oluşan karar ağacı……………………………………..26
Şekil 3.2. WEKA programının genel kullanıcı arayüzü…………………………….36
Şekil 3.3. WEKA programının ön işleme panelinin ekran görünümü………………37
Şekil 3.4. WEKA programının sınıflandırma panelinin ekran görünümü………..…38
Şekil 3.5. Asenkron motorlarda hata tespiti için veri madenciliği süreci…………...39
Şekil 3.6. Band Geçiren Filtrelenmiş üç faz akım spektrumlarının 0-100 Hz
aralığı………………………………………………………………………..41
Şekil 3.7. Normal motor için 1. faz akımının zaman-genlik grafiği………………...42
Şekil 3.8. Normal motor için 1. faz akımının RMS değişim grafiği………………...42
Şekil 4.1. Normal, kısa devre ve mekanik dengesizliği bulunan motorların 1., 2.
ve 3. faz akımlarının zaman-genlik grafikleri a) 10 periyot b) 2 periyot…..46
Şekil 4.2. Normal, kısa devre ve mekanik dengesizlik hataları bulunan 3 faz stator
akımlarının genlik-frekans spektrumları….…………………..……………..47
Şekil 4.3. Normal, kısa devre ve mekanik dengesizlik hataları bulunan 3 faz stator
akımlarının frekans-genlik spektrumlarının 0-100 Hz aralığı….…………....47
Şekil 4.4. Sağ Band için band geçiren filtrenin kutup 0 diyagramı…………………49
Şekil 4.5. Sağ Band için Band Geçiren Filtrenin frekans cevabı……………………50
Şekil 4.6. Normal, kısa devre, mekanik dengesizlik durumları için filtrelenmiş
1. faz akımının zaman-genlik grafiği………....…………………………..…50
Şekil 4.7. Normal, kısa devre, mekanik dengesizlik durumları için 2. faz akımının
filtrelenmiş durumlarının zaman-genlik grafiği……………………………..51
Şekil 4.8. Normal, kısa devre, mekanik dengesizlik durumları için 3. faz akımının
filtrelenmiş durumlarının zaman-genlik grafiği……………………………..51
Şekil 4.9. Sadece Sağ bandı geçiren filtre çıkışındaki sinyalin faz akım
spektrumları 0-1000 Hz aralığı………………………………………….…..52
Şekil 4.10. Sadece Sağ bandı geçiren filtre çıkışındaki sinyalin faz akım
spektrumları 0-100 Hz aralığı…….……..…………………………………..52
Şekil 4.11. Sol Band için band geçiren filtrenin kutup 0 diyagramı………………...53
Şekil 4.12. Sol Band için Band Geçiren filtrenin frekans cevabı…………………...54
vi
Şekil 4.13. Normal, kısa devre, mekanik dengesizlik durumları için filtrelenmiş
1. faz akımının zaman-genlik grafiği…………………..……………………54
Şekil 4.14. Normal, kısa devre, mekanik dengesizlik durumları için filtrelenmiş
2. faz akımının zaman-genlik grafiği………………………………………..55
Şekil 4.15. Normal, kısa devre, mekanik dengesizlik durumları için filtrelenmiş
3. faz akımının zaman-genlik grafiği………………………………………..55
Şekil 4.16. Sadece Sol bandı geçiren filtre çıkışındaki sinyalin faz akım
spektrumları 0-1000 Hz aralığı ……………………………………………..56
Şekil 4.17. Sadece Sol bandı geçiren filtre çıkışındaki sinyalin faz akım
spektrumları 0-100 Hz aralığı……………..………………………………...56
Şekil 4.18. 3 faz akım verilerine göre RepTree karar ağacının otomatik olarak
oluşturduğu sınıflandırma modeli …..………………………………………65
Şekil 4.19. 3 faz akım verilerine göre RepTree karar ağacı algoritması
sonucunun ekran görüntüsü…..……………………………………………..66
Şekil 4.20. 3 faz akım verilerine göre M5P-M4.0 karar ağacının otomatik olarak
oluşturduğu sınıflandırma modeli…..……………………………………….68
Şekil 4.21. 3 faz akım verilerine göre M5P-M4.0 karar ağacı algoritması
sonucunun ekran görüntüsü…..……………………..………………………69
Şekil 4.22. 3 faz akım verilerine göre RepTree karar ağacının otomatik olarak
oluşturduğu sınıflandırma modeli (1800 veri) …..……………………….…72
Şekil 4.23. 3 faz akım verilerine göre RepTree karar ağacının otomatik olarak
oluşturduğu sınıflandırma modeli (900 veri) …..…………………………...72
Şekil 4.24. 3 faz akım verilerine göre RepTree karar ağacının otomatik olarak
oluşturduğu sınıflandırma modeli (450 veri) …..…………………………...73
Şekil 4.25. 3 faz akım verilerine göre RepTree karar ağacının otomatik olarak
oluşturduğu sınıflandırma modeli (225 veri) …..…………………………...73
Şekil 4.26. 3 faz akım verilerine göre RepTree karar ağacının otomatik olarak
oluşturduğu sınıflandırma modeli (150 veri) …..…………………………...75
Şekil 4.27. 3 faz akım verilerine göre RepTree karar ağacının otomatik olarak
oluşturduğu sınıflandırma modeli (75 veri) …..…………………………….76
vii
ÇİZELGELER DİZİNİ
Çizelge 3.1. Veri madenciliği uygulama alanları………………………....................18
Çizelge 3.2. Futbol örneği için hedef olmayan nitelikler…………............................25
Çizelge 3.3. Futbol örneği için öğrenme verisi…………...........................................26
Çizelge 3.4. Veri Madenciliğinde kullanılan bazı yazılımlar ve özellikleri………...27
Çizelge 3.5. Verilerin alındığı 3 faz sincap kafes asenkron motorun özellikleri……35
Çizelge 4.1. 3 faz akım verilerine göre karar ağaçlarının ürettiği sonuç değerleri….59
Çizelge 4.2. 3 faz akım ve gerilim verilerine göre karar ağaçlarının ürettiği sonuç
değerleri……………………………………………………………………..60
Çizelge 4.3. 3 faz akım ve sol band için band geçiren filtre uygulanmış akım
verilerine göre karar ağaçlarının ürettiği sonuç değerleri………………..….61
Çizelge 4.4. 3 faz akım ve sağ band için band geçiren filtre uygulanmış akım
verilerine göre karar ağaçlarının ürettiği sonuç değerleri…………………...62
Çizelge 4.5. 3 faz akım, sol ve sağ band için band geçiren filtre uygulanmış akım
verilerine göre karar ağaçlarının ürettiği sonuç değerleri…………………...63
Çizelge 4.6. 3 faz akım ve gerilim ile sol ve sağ band için band geçiren filtre
uygulanmış akım verilerine göre karar ağaçlarının ürettiği sonuç değerleri...64
Çizelge 4.7. WEKA programına giriş olarak verilen verilerden 3 faz akım RMS
verilerinden rastgele seçilmiş örnek değerler…………..................................67
Çizelge 4.8. WEKA programına giriş olarak verilen 3 faz akımdan rastgele seçilmiş
1. faz akımına M5P-M4.0 karar ağacından elde edilen katsayıların
uygulanması ve elde edilen sonuçlar…………………………………..……70
Çizelge 4.9. WEKA programına giriş olarak verilen 3 faz akım RMS verilerinden
sadece 1. faz akımı için rastgele seçilmiş örnek değerler…………….…..…74
viii
SİMGELER VE KISALTMALAR DİZİNİ
DVM
Destek vektör makinesi
GP
Genetik Programlama
RMS
Root Mean Square ( Karelerinin ortalamasının karekökü )
VM
Veri madenciliği
WEKA
Waikato Environment for Knowledge Analysis
YSA
Yapay sinir ağları
ZSVM
Zaman serileri veri madenciliği
ix
1. GİRİŞ
Asenkron
motorlar
değişik
endüstriyel
uygulamalarda
yaygın
olarak
kullanılmaktadır. Bu motorlar sağlam yapıda olmalarına rağmen elverişsiz ortamlara
maruz kalmalarından dolayı hataları oluşmaktadır. Başlangıç seviyesindeki hatalar
erken bir safhada tespit edilemezse, hem kendisi hem de sistem çalışması zarar
görebilir, üretim kayıplarına neden olabilir. Son yirmi yılda çalışılan en önemli alan
motorun performans karakteristikleri ve asenkron motor hatalarının tespiti ve analizi
olmuştur. Doğru ve güvenilir hata tespit yönteminin uygulanması, iyi bir motor
performansı için motor hatalarının etki ve sebeplerinin iyi anlaşılması gerekir.
Asenkron motorlarda hata tespiti için değişik yöntemler kullanılmaktadır. Parametre
tahmini ve diğer model tabanlı teknikler sistemin matematiksel modeline
dayandığından, motor belli bir süre sonra aşındığından bu modeller motorun
durumunu tam olarak ifade etmeyebilir. Hata tespiti için kullanılan diğer bir yöntem
ise makine veya motorun bir eleman tarafından sürekli gözlemlenmesidir. Burada
sistemin matematiksel modeli bilinmeden gözlem yoluyla hata tespiti yapılabilir.
Fakat böyle bir yöntem hem zaman alıcı hem de pahalıdır. Akıllı bir hata tespiti için
yumuşak hesaplama ve işaret işleme tabanlı yöntemlerde literatürde yoğun olarak
kullanılmaya başlanmıştır.
Tezde asenkron motorlarda hata tespiti için literatürdeki tekniklerden farklı olarak
yeni bir alan olan Veri Madenciliği (VM) tekniği kullanılmıştır. Önerilen teknik ile
üç fazlı bir asenkron motordaki sargı spirleri arasında oluşabilecek kısa devre veya
yalıtım bozuklukları ve motor milinde oluşabilecek mekanik dengesizlik hatalarının
tespiti amaçlanmıştır.
1.5. Veri Madenciliğine Genel Bir Bakış
VM; verideki eğilimleri, ilişkileri ve profilleri belirlemek için veriyi sınıflandıran bir
analitik araç olup bu amaçla bilgisayar yazılımları geliştirilmiştir. VM yazılımları;
kümeleme, doğrusal regresyon, sinir ağları, Bayes ağları, görselleştirme ve ağaç
1
tabanlı modeller gibi birçok tekniği içerir. VM uygulamaların da önceleri sadece
istatistiksel yöntemler kullanılmıştır. Bununla birlikte, bugünün VM teknolojisinde
veri kümelerindeki eğilim ve ilişkileri kısa zamanda saptayabilmek için yüksek hızlı
bilgisayarlar kullanılmaktadır. Böylece VM, gizli eğilimleri minimum çaba ile çok
kısa bir sürede kolayca ortaya çıkarmaktadır.
1.6. Veri Madenciliği Teknikleri
VM teknikleri işlevlerine göre 3 temel grupta toplanır:
•
Sınıflama,
•
Kümeleme,
•
Birliktelik kuralları ve sıralı örüntüler.
Sınıflama, verinin önceden belirlenen çıktılara uygun olarak ayrıştırılmasını sağlayan
bir tekniktir. Çıktılar, önceden bilindiği için sınıflama, veri kümesini denetimli olarak
öğrenir.
Kümeleme, verideki benzer kayıtların gruplandırılmasını sağlayan bir tekniktir.
Birliktelik analizi, bir veri kümesindeki kayıtlar arasındaki bağlantıları arayan
denetimsiz VM tekniğidir. Birliktelik analizi çoğu zaman perakende sektöründe
süpermarket
müşterilerinin
satın
alma
davranışlarını
ortaya
koymak
için
kullanıldığından “pazar sepeti analizi” olarak da adlandırılır.
Bu tezde VM uygulamasında, denetimli bir sınıflandırma tekniği olan karar ağaçları
kullanılmıştır.
1.7. Karar Ağaçları
Temel sınıflandırma tekniklerinden biri olan karar ağaçları; verileri belli nitelik
değerlerine göre sınıflandırmaya yarar. Bunun için algoritmaya girdi olarak verilerin
2
belirlenen belli nitelikleri, çıktı olarak da verilerin belli bir niteliği verilir. Algoritma
bu çıktı niteliğindeki değerlere ulaşmak için hangi girdi nitelik değerlerinin olması
gerektiğini ağaç veri yapılarını kullanarak keşfeder.
1.8. Tez Hakkında
Hata tespit sistemlerinde; gözlem ile tespit, matematiksel modeller ve yapay zekâ
tekniklerinin birlikte yer aldığı yöntemler kullanılır. Matematiksel modeller motor
hakkında çok fazla bilgi gerektirdiklerinden hata tespiti için kullanılmaları, hem
hesaplama hem de önceden motor hakkında bilgi gerektirir. Asenkron motor
hatalarının belirlenmesi için sıcaklık ölçümü, rulman yağ analizi, titreşim analizi ve
radyo frekans yayılımı gibi teknikler kullanılır. Asenkron motorların hatalarının
belirlenmesi ve sınıflandırılması geleneksel olarak sağlıklı ve hatalı sinyal
spektrumlarının karşılaştırılması ile yapılabilir. Bu teknikler sıcaklık, hız ve titreşim
gibi parametrelerin ölçümüne ihtiyaç duyar. Fakat bunların ölçülmesi ekstra
algılayıcılar, düzenekler ve motora erişim için kablolar gibi maliyeti artırıcı unsurlar
gerektirir. İlave algılayıcı kullanmaksızın sistemde mevcut olan akım dönüştürücüleri
ile motor akımından hata tespitine dayalı durum izleme daha fazla ilgi çekmektedir.
Akım sinyalleri kullanılarak sağlam ve hatalı motor durumlarının birbirinden ayırt
edilebilmesi için veride mevcut olan farklı özelliklerin çıkarılması gerekir.
Tezde, sağlam durum için, sargı spirleri arasında kısa devre hatası ve motor milinde
mekanik dengesizlik hatası olan 3 durum için üç faz motor akım ve üç faz şebeke
gerilim bilgileri kullanılmıştır.
Veriler
ilk
önce
klasik
bir
yöntem
olan
frekans
spektrum
analizinde
değerlendirilmiştir. Frekans spektrum analizi filtreli ve filtresiz iki ayrı durum için
yeni oluşan yan band ve harmoniklerin tespiti için kullanılmıştır. Motor milindeki
mekanik dengesizlik hatası akım spektrumlarında şebeke frekansının etrafında yan
bandlar oluşturur. Bu bandlardaki genlik değişiminin algılanması ile hata tespiti
yapılabilir. İşlememiş ham üç faz akım ve üç faz gerilim verileri ile band geçiren
3
filtre çıkışındaki verilerin etkin değerleri (RMS) hesaplanmıştır. Hesaplanan RMS
değerleri VM yazılımının giriş parametrelerini oluşturmuştur.
Farklı algoritmalara sahip ve farklı işletim sistemlerinde çalışan birçok VM yazılımı
bulunmaktadır. Tezde WEKA VM yazılımı kullanılmıştır. WEKA (Waikato
Environment for Knowledge Analysis), Yeni Zelanda Waikato Üniversitesi’nde
geliştirilen bir VM ve makine öğrenmesi yazılımıdır.
WEKA programında kullanılacak verilerin bulunduğu dosyaların uzantıları .arrf
olması gerekmektedir. Bunun için veri dosyalarının uzantıları Cahit Arif Wizard
isimli program ile .arff’a dönüştürülmüştür (http://cahitarf.sourceforge.net/).
WEKA programına girdi olarak 6 farklı veri paketi kullanılmıştır. Bunlar;
•
3 faz motor akım değerleri,
•
3 faz motor akım ve gerilim değerleri,
•
3 faz motor akım ve sol band için band geçiren filtre uygulanmış motor akım
değerleri,
•
3 faz motor akım ve sağ band için band geçiren filtre uygulanmış motor akım
değerleri,
•
3 faz motor akım, sol ve sağ band için band geçiren filtre uygulanmış motor
akım değerleri,
•
3 faz motor akım ve gerilim ile sol ve sağ band için band geçiren filtre
uygulanmış motor akım değerleri.
WEKA programı birçok VM algoritmasına sahiptir. Tezde, denetimli sınıflandırma
biçimi olarak karar ağaçları algoritmaları kullanılmıştır. Karar ağaçları girdi olarak
verilerin belirlenen belli niteliklerini, çıktı olarak da verilerin belli bir niteliğini
kullanır. Algoritma bu çıktı niteliğindeki değerlere ulaşmak için hangi girdi nitelik
değerlerinin olması gerektiğini ağaç veri yapılarını kullanarak keşfeder. Yukarıda ki
şekliyle 3 faz akım ve gerilim ile sol ve sağ band için band geçiren filtre uygulanmış
akım verileri girdi değerlerini oluşturmaktadır. Aynı şekilde sağlam, sargı spirleri
4
arasında kısa devre hatası olan ve milinde mekanik dengesizlik hatası bulunan motor
durum bilgileri de çıktı değerlerini oluşturmaktadır.
Verilere Rules, Trees, Meta, Lazy, Functions gruplarının alt modüllerinden toplam
18 tane karar ağacı algoritması uygulanmıştır. Uygulanan karar ağaçlarından elde
edilen korelâsyon katsayıları ve mutlak hata değerleri tablolar halinde incelerek en
iyi çözümü Trees karar ağacının alt algoritmalarından RepTree ve M5P-M4.0
algoritmalarının sağladığı bulunmuştur.
Ayrıca WEKA’ya girdi olarak verilen 6 veri paketinden elde edilen sonuçlar
incelenmiş olup, sadece 3 faz akım verisinin VM’nde sınıflandırma için en iyi seçici
özelliğe sahip olduğu bulunmuştur.
Karar ağaçlarının girdi niteliğini oluşturan 2700 satırlık 3 faz akım ve sonuç
verilerinden rasgele olarak 15 satırı seçilmiştir. Seçilen bu satırlardaki verilerin
RepTree
ve
M5P-M4.0
algoritmalarının
ürettiği
kuralları,
gerçekleştirip
gerçekleştirmedikleri kontrol edilmiştir. RepTree karar ağacı algoritmasının ürettiği
kuralların %100 doğruluk derecesine sahip olduğu saptanmıştır.
Bu tez, asenkron motorlarda hata tespiti için literatürde çok az kullanılan VM
tekniğini sunmaktadır. Bu tezin amacı; VM teknikleri kullanılarak da asenkron
motorlarda hata tespitinin yapılabileceğini göstermektir.
Çalışma ile elde edilen avantajlar şunlardır;
•
Sadece 3 faz akım verileri ile asenkron motorlarda sargı spirleri arası kısa
devre ve motor milindeki mekanik dengesizlik hataları bulunabilmektedir.
•
Literatürde çok az kullanılmış olan VM ile motor hata tespitinin
yapılabildiğidir.
•
Motora ait ön bilgi, matematiksel modelleme gibi karmaşık hesaplama
gerektiren işlemler gerektirmez. Ayrıca hata sınıflandırmasında kullanılmak
üzere belli bir eşik değeri tespit edilmesini sağlamıştır.
5
Tezin ilk bölümünde tez çalışmasının amacı, kullanılan yöntem, elde edilen sonuçlar
ve katkılar ifade edilmiştir. İkinci bölümünde ise, asenkron motor hatalarının, hangi
yöntemler kullanılarak bulunduğundan bahsedilmiştir. Üçüncü bölümde tezde
kullanılan VM yönteminin tanımı, kullanım alanları, VM teknikleri, karar ağacı
algoritmaları, verilerin elde edilmesi, verilerin hazırlanması, kullanılan VM yazılımı
ve tezde kullanılan VM süreci ifade edilmiştir. Dördüncü bölümde, verilerin frekans
spektrum analizi ve VM yöntemleri ile incelenmiştir. Beşinci bölümde ise, elde
edilen sonuçların asenkron motor hatalarının bulunmasında yeni bir yaklaşım
olabileceği söylenmiştir.
6
2. KAYNAK ÖZETLERİ
Asenkron
motorlar
değişik
endüstriyel
uygulamalarda
yaygın
olarak
kullanılmaktadırlar. Değişen çalışma ortamları ve dinamik yükler motorlarda hatalara
sebep olurlar. Bu nedenle sistemlerin ani duraklamalarının önlenmesi hem maliyet,
hem güvenirlik için önemlidir. Asenkron motorlarda hataların oluşmadan önce
belirlenmesi için uzun yıllardır birçok çalışma yapılmış ve günümüzde de yapılmaya
devam etmektedir.
Gao vd. (2001), son yıllarda birçok alanda uygulanmaya başlanan ve yeni bir teknik
olan yumuşak hesaplama tekniği hakkında bilgi vermişlerdir. Gao vd. çalışmalarında,
temel motor hata tespit sistemleri ile bulanık mantık, yapay sinir ağları (YSA),
genetik algoritmalar kullanılarak yapılan motor hata tespit sistemleri hakkında bilgi
vermişlerdir. Yumuşak hesaplama tekniklerinin (bulanık mantık, yapay sinir ağları,
genetik algoritmalar, yapay sinir ağları ile bulanık mantığın beraber kullanımı),
basitleştirilmiş şekillerle çalışma mantıkları anlatılmış, bu konuda yapılan
araştırmaların avantaj ve dezavantajlarından bahsedilmiştir. Hata tespitinde yumuşak
hesaplama olarak adlandırılan bu yeni yaklaşımlar, geliştirilmiş çözümler sunmasına
rağmen tamamen klasik metotların yerini alamadığını, bahsedilen tekniklerin bir
veya birkaçının birlikte kullanılması gerektiğini ifade etmişlerdir.
Povinelli vd. (2002), geleneksel frekans düzlemindeki Fourier analizi gerektirmeyen
yeni bir yaklaşımla, asenkron motorlardaki hataları belirlemek için bir çalışma
yapmışlardır. Bu teknik ile asenkron motorlarda ayarlanabilir hız sürücülü
sistemlerde hata tespiti ve tahmini üzerinde çalışmışlardır. Çalışmada 208 volt, 60
Hz, 4 kutuplu, 1.2 Hp’lik, 3 fazlı sincap kafes bir motor kullanılmıştır. Sincap kafes
asenkron motorlarda çeşitli rotor çubuk kırıklarını tanımlamak ve ayırt etmek için
Zaman Serileri Veri Madenciliği (ZSVM) tekniğini ve Evre Uzayı modelini
kullanmışlardır. Evre Uzayından elde edilen zaman düzlemindeki motor dönüş
profilleri ve ilk fark faz dönüşümleri ile sağlıklı, 3, 6, 9 adet kırık rotor çubuğunun
hata tespitinin nasıl yapıldığı göstermişlerdir. Bu yaklaşım, asenkron motorların
7
ayarlanabilir hız sürücü devrelerine entegre edilerek motorlardaki kırık rotor çubuğu
hatalarının tespitinde kullanılabileceğini ifade etmişlerdir.
Ayaz vd. (2002), 5 Hp’lik asenkron motorun rulmanlarında yedi aşamada, y a p a y
bir hata oluşturarak motor akım, titreşim ve hız verilerini toplamışlardır. Motor
titreşim işaretlerine dalgacık dönüşümü uygulayarak, frekans bandlarına ayırarak ve
rulman hatasını karakterize eden özelliğin 2-4 kHz’lik frekans aralığında yer aldığı
saptamışlardır. Ayrıca yapılan istatistiksel analizler sonucunda hata için kritik bir
standard sapma değeri belirlenerek rulman hatasının 4. aşamada belirgin hale
geldiği görülmüşlerdir. Yapılan yeni bir tanım ile de rulman sağlamlığını yüzde
cinsinden bir büyüklükle ifade etmişlerdir.
Kowalski vd. (2003), asenkron motorlarda rotor ve stator hatalarının tespiti için
yapay sinir ağlarını kullanmışlardır. Bu çalışmada çok katmanlı ve kendi kendini
organize eden Kohonen yapay sinir ağları kullanılmıştır. Stator akım ve titreşim
sinyal spektrum analiz değerleri yapay sinir ağlarının öğrenme ve test aşamalarında
kullanılmıştır. Kohonen YSA başlangıçtaki motor hatalarının sınıflandırılmasında
kullanılmıştır. Tek gizli katmanlı ve birkaç nöron içeren basit yapıdaki pratikte ki
gerçekleştirilmesi kolay olan YSA ile bahsedilen hatalar tespit edilebilmiştir.
Bangura vd. (2003), ZSVM metodu ile ayarlanabilir hız sürücülü asenkron
motorlarda statik, dinamik eksantriklik ile rotor hatalarının tespiti ve teşhisini
benzetim sonucu elde edilen verileri kullanarak göstermişlerdir. Sonlu elemanlar
veya durum uzayı analizi ile yapılan benzetimde elde edilen faz akımları ve tork
sinyallerinde hata ile ilgili gizli olan belirteçler ZSVM kullanılarak tespit edilmiştir.
%10 ile %30 arasındaki eksantriklik hatası 1, 3, 6 ve 9 kırık çubuk hatası olan 1,2
Hp’lik 4 kutuplu bir asenkron motor üzerinde test edilen algoritma hem hata çeşidini
ayırt edebilme hem de hata miktarını sayısallaştırabilmektedir.
Bae vd. (2005), 4 kutuplu, 0.5 Hp’lik motor stator akım bilgilerini kullanmışlardır.
Akım sinyallerinin analizi için zaman-genlik düzlemi yerine frekans-genlik
düzlemindeki analizi kullanmışlardır. Bu çalışmada kırık rotor çubuğu, rulman ve
8
eksantriklik hataları incelenmiştir. Kırık rotor ve eksantriklik hataları dalgacık
analizinde aynı sonucu doğurduğundan bunları birbirinden ayırt etmek için Fourier
analizi yapılmıştır.
Aydın vd. (2005), tek fazlı sincap kafesli asenkron motorların sarım, sürtünme,
eksantriklik ve kırık rotor çubuğu hatalarının tespiti için yumuşak hesaplama tabanlı
bir teknik üzerinde çalışmışlardır. Sarım ve sürtünme durumlarının sınıflandırılması
için ileri beslemeli YSA kullanılmıştır. Eksantriklik ve kırık rotor çubuğu hatalarının
bulunması için bulanık mantık kullanılmıştır. Tek fazlı asenkron motorun stator
akımı ve rotor hızı kullanılarak YSA’nın girişlerini, stator akımının Fourier
dönüşümleri de bulanık mantık modelinin girişlerini oluşturmuştur. Bulanık mantık
ile değerlendirilen akım verilerinin spektrum analizi ile elde edilen yan bantlarda ki
genlik değişimi, kırık rotor çubuk ve eksantriklik hatalarının tespiti için
kullanılmıştır.
Nandi vd. (2005), asenkron motorların hatalarının tespitinde genelde termal ölçümler
ve kimyasal analizler gibi farklı tekniklerle birlikte, hatanın derecesini ve özelliğini
bulmak içinde esas karar merci yine insan olmak şartıyla uzman sistemler, yapay
sinir ağları, bulanık mantık tabanlı sistemler kullanıldığından söz etmişlerdir. Bu
makalede daha önce yapılan rotor, stator hataları, eksenel kaçıklık hataları ve
eksantriklik hatalarının bulunması için yapılan araştırmalar değerlendirilmiştir.
Motor akım sinyalinin analizi hata tespitinde en çok tercih edilen bir teknik
olduğunu, teorik analiz ve hatalı makinenin modellenmesinin hata belirtecinin
kaynağının hatadan mı yoksa harmoniklerden mi kaynaklandığını ayırt edilebilmek
için gerekli olduğunu ifade etmişlerdir.
Zhang vd. (2005), genetik programlama (GP), otomatik olarak bilgisayar programları
tarafından oluşturulan doğrusal olmayan bir süreçtir. Bu çalışmada 2 farklı asenkron
motordan alınan sağlam ve hatalı veriler GP ile hataların tespiti için kullanılmıştır.
Ayrıca destek vektör makinesi (DVM) olarak adlandırılan yaklaşım istatiksel bir
öğrenme algoritmasıdır. DVM ve YSA’da asenkron motorlar da hata belirteçlerini
bulmak için kullanılmıştır. Çalışmada kullanılan veriler ile hata sınıflandırılması
9
yapmak için, GP/YSA ve GP/DVM birlikte kullanılmıştır. Buradan elde edilen GP
tabanlı hata sınıflandırma oranı %100 olarak elde edilmiştir. GP/YSA ve GP/DVM
yaklaşımlarından üretilen sınıflandırma kurallarının kolay anlaşılması gerçek
hayattaki uygulamalar için tercih edilebilir. GP ile kullanılan DVM ve YSA kendi
başlarına yaptıkları hata tespitlerinden daha iyi sonuçlar ortaya koydukları
görülmüştür.
Aydın vd. (2005), asenkron motorlarda stator sargı ve eksantriklik hatalarının tespiti
için ZSVM’ni kullanmışlardır. Bunun için motor stator akımı ve rotor hızını ZSVM
girişi olarak almışlardır. Stator sargı ve eksantrik dönme hataları, akım veya rotor
hızının etkin değerinde değişmelere sebep olduğundan kararlı durumdaki zamana ait
iki grafiğin çarpımı faz alanı için, giriş olarak alınmıştır. Yaptıkları deneylerde ¼ Hp
gücünde tek fazlı sincap kafesli bir asenkron motor kullanmışlardır. Deneyden elde
edilen verilerin yarısı eğitim için, diğer yarısı da test için kullanılmıştır. Eğitim ve
test verilerinden elde edilen sonuçların faz alanı grafiğinde yarıçap değerlerinde ki
değişim ile hata durumunu sınıflandırmışlardır. Ancak hata kaynağının stator
sargısındaki hatadan mı veya eksantriklik hatasından mı kaynaklandığını
belirtmemişlerdir. ZSVM yaklaşımı ile motor dinamikleri hakkında çok fazla bilgiye
sahip olmadan sadece akım ve hız değerleri ile hata tespitinin yapılabileceğini ifade
etmişlerdir.
Aydın vd. (2006), asenkron motorlarda kırık rotor çubuğu hatalarının tespiti için
YSA ve ZSVM içeren 2 ayrı teknik kullanmışlardır. 4 kutuplu ve 0,37 kW’lık 3 fazlı
sağlam ve hatalı asenkron motora ait veriler yedi farklı durumda alınmıştır. Birinci
yöntemde akımdan özellik çıkarmak amacıyla motor akım sinyal analizi ve bu
özelliklere göre hata durumlarını sınıflandırmak amacıyla YSA kullanılmıştır. İkinci
yöntemde kırık rotor çubuğu hatalarını belirlemek için ZSVM yöntemini
kullanmışlardır. Her iki yöntemin de en önemli avantajı hata tespiti için sadece akım
bilgisinin yeterli olduğunu ifade etmişlerdir.
10
3. MATERYAL VE YÖNTEM
3.1. Materyal
Üretimin sürekli yapıldığı endüstriyel tesislerde, uygulanan bakım türleri büyük
önem taşır. Üretimin aksamasına tahammülü olmayan bazı tesisler, ani hatalarla
karşılaşmamak, beklenmeyen üretim kayıplarını engellemek, bakım ve onarımı
planlanabilir hale getirmeye çalışırlar.
Yenilikçi bakım sistemleri, klasik bakım ve önleyici bakım sistemlerinde olmayan
birçok avantajı da beraberinde getirir. Bu yöntemleri kullanan endüstri tesisleri
makine hata oranlarında ortalama %55, bakım maliyetlerinde ise %50’leri aşan bir
düşüş gözlemlemişlerdir. Makine ömrü %20 ile %40 arasında artmıştır. Bununla
beraber verimlilikte %30, karda ise %60’lara varan bir artış kaydedilmiştir (Çeştepe
ve Eren, 2005).
Asenkron motorlar endüstrinin beygir gücü olduğu için, bunların hatalarının önceden
tespiti hayati önem taşımaktadır. Bu yüzden asenkron motorlarda hataların önceden
tespiti için birçok yöntem geliştirilmiş ve yeni yöntemler hala araştırılmaktadır. Bu
yöntemlerden bazıları şunlardır; Bulanık Mantık, Yapay Sinir Ağları, Genetik
Algoritmalar, Zaman Serileri Veri Madenciliği, vb.’dir. Bunların haricinde sadece
Veri Madenciliği ile yapılmış asenkron motorlarda hata tespit sistemleri yok denecek
kadar azdır.
Bu tez için veriler Artesis Teknoloji Sistemleri A.Ş. firmasından alınmıştır. Veriler
aynı motordan 3 durum için alınmıştır. Normal (Sağlam), sargı spirleri arasında kısa
devre ve motor milindeki mekanik dengesizlik durumları için üç faz akım ve gerilim
değerleridir. Verilerin Veri Madenciliği programında (tezde WEKA programı
kullanılmıştır) kullanılabilmesi için bazı ön işlemlerden geçirilmiştir. Bu işlemlerden
sonra
elde
edilen
yeni veriler WEKA
programında
farklı sınıflandırma
algoritmalarına uygulanmıştır. Elde edilen değerler karşılaştırılarak en uygun çözüm
bulunmuştur.
11
3.2. Veri Madenciliği
3.2.1. Veri Madenciliğine Genel Bir Bakış
Bilgisayar sistemleri her geçen gün hem daha ucuzluyor, hem de güçleri artıyor.
İşlemciler gittikçe hızlanıyor, disklerin kapasiteleri artıyor. Artık bilgisayarlar daha
büyük miktardaki veriyi saklayabiliyor ve daha kısa sürede işleyebiliyor. Bunun
yanında bilgisayar ağlarındaki ilerleme ile bu veriye başka bilgisayarlardan da hızla
ulaşabilmek mümkün olabilmektedir. Bilgisayarların ucuzlaması ile sayısal teknoloji
daha yaygın olarak kullanılıyor. Veri doğrudan sayısal olarak toplanıyor ve
saklanıyor. Bunun sonucu olarak da ayrıntılı ve doğru bilgiye ulaşabiliniyor
(Alpaydın, 2000).
Örneğin eskiden süper marketteki kasa basit bir toplama makinesinden ibaretti.
Müşterinin o anda satın almış olduğu malların toplamını hesaplamak için kullanılırdı.
Günümüzde ise kasa yerine kullanılan satış noktası terminalleri sayesinde bu
hareketin bütün detayları saklanabiliyor. Saklanan bu binlerce malın ve binlerce
müşterinin hareket bilgileri sayesinde her malın zaman içindeki hareketlerine ve eğer
müşteriler bir müşteri numarası ile kodlanmışsa bir müşterinin zaman içindeki
verilerine ulaşmak ve analiz etmek mümkün olabilmektedir. Bütün bunlar
marketlerde kullanılan barkot, bilgisayar destekli veri toplama ve işleme cihazları
sayesinde mümkün olmaktadır (Aydoğan, 2003).
Verilen market örneğinde olduğu gibi ticari, tıp, askeri, iletişim, vb. birçok alanda
benzer teknolojilerin kullanılması ile veri hacminin yaklaşık olarak her yirmi ayda iki
katına çıktığı tahmin edilmektedir (Frawley vd., 1991).
Veri hacminin hangi boyutlara ulaşabileceği ve bunların işlenmesinin ne kadar güç
olduğu kolayca anlaşılabilmektedir. Süper market örneği incelendiğinde, veri analizi
yaparak her mal için bir sonraki ayın satış tahminleri çıkarılabilir; müşteriler satın
aldıkları mallara bağlı olarak gruplanabilir; yeni bir ürün için potansiyel müşteriler
belirlenebilir;
müşterilerin
zaman
içindeki
12
hareketleri
incelenerek
onların
davranışları ile ilgili tahminler yapılabilir. Binlerce malın ve müşterinin olabileceği
düşünülürse bu analizin gözle ve elle yapılamayacağı, otomatik olarak yapılmasının
gerektiği ortaya çıkar. Veri madenciliği burada devreye girer; veri madenciliği büyük
miktarda veri içinden gelecekle ilgili tahmin yapmamızı sağlayacak bağıntı ve
kuralların aranmasıdır (Aydoğan, 2003).
Yani, veri madenciliği, büyük miktarlardaki verinin içinden geleceğin tahmin
edilmesinde yardımcı olacak anlamlı ve yararlı bağlantı ve kuralların bilgisayar
programlarının aracılığıyla aranması ve analizidir. Ayrıca Veri Madenciliği, çok
büyük miktardaki verilerin içindeki ilişkileri inceleyerek aralarındaki bağlantıyı
bulmaya yardımcı olan veri analizi tekniğidir (Akpınar, 2000).
Bir başka deyişle, veri madenciliği; verideki eğilimleri, ilişkileri ve profilleri
belirlemek için veriyi sınıflandıran bir analitik araç ve bilgisayar yazılım paketidir.
Spesifik veri madenciliği yazılımları; kümeleme, doğrusal regresyon, sinir ağları,
Bayes ağları, görselleştirme ve ağaç tabanlı modeller gibi pek çok modeli içerir. Veri
madenciliği uygulamalarında yıllar boyu istatistiksel yöntemler kullanılmıştır.
Bununla birlikte, bugünün veri madenciliği teknolojisinde eski yöntemlerin tersine
büyük veri kümelerindeki trend ve ilişkileri kısa zamanda saptayabilmek için yüksek
hızlı bilgisayarlar kullanılmaktadır. Böylece veri madenciliği, gizli trendleri
minimum çaba ve emekle ortaya çıkarmaktadır (Akbulut, 2006).
3.2.2. Veri Madenciliğinin Gelişimini Etkileyen Faktörler
Temel olarak veri madenciliğini 5 ana faktör etkiler (Akpınar, 2000):
1. Veri: Veri madenciliğinin bu kadar gelişmesindeki en önemli faktördür. Son yirmi
yılda sayısal verinin hızla artması, veri madenciliğindeki gelişmeleri hızlandırmıştır.
Bu kadar fazla veriye bilgisayar ağları üzerinden erişilmektedir. Diğer taraftan bu
verilerle uğraşan bilim adamları, mühendisler ve istatistikçilerin sayısı hala aynıdır.
O yüzden, verileri analiz etme yöntemleri ve teknikleri geliştirilmektedir.
13
2. Donanım: Veri madenciliği, sayısal ve istatistiksel olarak büyük veri kümeleri
üzerinde yoğun işlemler yapmayı gerektirir. Gelişen bellek ve işlem hızı kapasitesi
sayesinde, birkaç yıl önce madencilik yapılamayan veriler üzerinde çalışmayı
mümkün hale getirmiştir.
3. Bilgisayar ağları: Yeni nesil İnternet, çok yüksek hızları kullanmamızı
sağlamaktadır. Böyle bir bilgisayar ağı ortamı oluştuktan sonra, dağıtık verileri
analiz etmek ve farklı algoritmaları kullanmak mümkün olacaktır. Bundan 10 yıl
önceki bilgisayar ağları teknolojisinde hayal edilemeyenler artık kullanılabiliyor.
Buna bağlı olarak, veri madenciliğine uygun ağların tasarımı da yapılmaktadır.
4. Bilimsel hesaplamalar: Günümüz bilim adamları ve mühendisleri, simülasyonu,
bilimin üçüncü yolu olarak görmekteler. Veri madenciliği ve bilgi keşfi, teori, deney
ve simülasyonu birbirine bağlamada önemli bir rol almaktadır.
5. Ticari eğilimler: Günümüzde, işletmeler rekabet ortamında varlıklarını
koruyabilmek için daha hızlı hareket etmeli, daha yüksek kalitede hizmet sunmalı,
bütün bunları yaparken de minimum maliyeti ve en az insan gücünü göz önünde
bulundurmalıdır. Bu tip hedef ve kısıtların yer aldığı iş dünyasında veri madenciliği,
temel teknolojilerden biri haline gelmiştir. Çünkü veri madenciliği sayesinde
müşterilerin ve müşteri faaliyetlerinin yarattığı fırsatlar daha kolay tespit
edilebilmekte ve riskler daha açık görülebilmektedir.
3.2.3. Veri Madenciliğinin Kullanım Amacı
İşletmeler, geçmişte yaptıkları işlemleri, sakladıkları veriler yardımıyla gözden
geçirip analiz etme ve değerlendirme şansına sahiptirler. Bu değerlendirme
aşamasında karşılaşılan ilk problem, veri yığınının büyüklüğünün artmasıyla birlikte,
işlem yapmanın zorlaşması olmaktadır. Özellikle geçmişe dönük verilerin ve şu anda
işlem gören ya da yeni giriş yapılan verilerin aynı ortamda bulunduğu durumlarda
ciddi performans problemleri yaşanabilir. Bu konuya çözüm olarak veri ambarları
kullanılabilir. Veri ambarlarının işlevlerinden biri, operasyonel veriler ile artık
14
kullanımda olmayan fakat ilerde fayda sağlanılabilecek, geçmişe ait verilerin
bulunduğu ortamları ya da bu verileri depolayan yazılımları birbirinden ayırmaktır.
Bu işlem hem teknik açıdan performansı arttırmakta, hem de geçmiş verilerin düzenli
bir formatta depolanmalarını sağlamaktadır (Nath, 2003).
Depolanan bu veriler üzerinde analiz yapılıp işletme açısından faydalı bilgiler ortaya
çıkarılması
amacına
yönelik
olarak
veri
madenciliği
uygulamaları
kullanılabilmektedir. Veri havuzunu analiz etmenin tek yöntemi veri madenciliği
olmamakla birlikte, insan müdahalesine duyulan ihtiyacın en az olduğu ve kendi
kendini modifiye edebilme kapasitesine sahip bir analiz şekli istendiğinde veri
madenciliği yazılımları ihtiyacı karşılayacaktır (Nath, 2003).
Veri madenciliği, analitik bir teknik değil, veri analizine bir yaklaşımdır. Diğer veri
analiz yaklaşımlarından farklılıklarından biri, araştırmacının çoğu zaman çok genel
bir araştırma sorusu çevresinde, keşfe yönelik bir tarzda işlem yapmasıdır. Veri
madenciliğinin bu keşfe yönelik doğası sebebiyle, elimizdeki veri grubu için bir
teknik seçerken diğer analiz yaklaşımlarına oranla daha az yol gösterici vardır. Veri
madenciliği uygulamasının içerdiği istatistiksel teknikler, çoğunlukla genel
kullanıma uygun olarak modifiye edilmiş ve böylece uygulama farklı veri grupları ve
birçok değişken tipi üzerinde kullanılabilir hale gelmiştir (Hair vd.,1998).
3.2.4. Veri Madenciliği Uygulamaları ve Kullanım Alanları
Veri madenciliğinde araştırma çok farklı disiplinlerin içinde uygulanmaktadır. Veri
tabanını yöneten araştırmacılar veri madenciliğinin avantajını sorgu işleminden
almaktadır. İlgi çeken alanlardan biri de sorgu işlemini genişletmek ve veri
madenciliğini kolaylaştırmaktır. Veri depolama başka bir veri yönetim teknolojisidir
ve bu ayrı veri kaynaklarını tamamlamakta, veriyi kolay bir şekilde organize
edebilmektedir (Kalıkov, 2006).
15
Veri madenciliğinin asıl amacı, veri yığınlarından anlamlı bilgiler elde etmek ve
bunu eyleme dönüştürecek kararlar için kullanmaktır. Örnek birkaç kullanım alanı
aşağıdadır:
İşletme alanındaki uygulamalar:
Müşterilerin rakiplerine gitmelerini önlemek için bir şirket Veri Madenciliğine
başvurabilir. Burada Veri Madenciliğinin amacı müşterilerin özelliklerini elde etmek
ve rakip şirketlere gidebilecek müşterileri tespit etmek. Sonra da VM sonuçlarından
faydalanarak onları kaybetmemek için strateji geliştirilebilir.
Ürün ve hizmetlerin tercih edilme sebeplerini ve hangi özelliklerin müşterileri ne
kadar etkilediğini belirleme.
Banka müşterilerinin kredi durumları ve ödemeleri incelenerek aralarında riskli olan
müşterilerin tespit edilmesi ve aynı risk grubuna düşebilecek diğer müşterilerin
önceden tahmin edilebilmesi.
Eğitim alanındaki uygulamalar:
Öğrencileri performanslarına göre branşlara ayırma ve kişi-branş uyumunun
arttırılması.
Öğrencilerin performans ve memnuniyetlerinin arttırılması.
Tıp alanındaki uygulamalar:
Bir ilacın hangi yaş grup hastalarında nasıl etki yaratacağı konusunda tahminde
bulunabilme.
Yeni bulunan kanser tedavi yöntemi için en uygun adayı belirleme.
16
Spor alanındaki uygulamalar:
Bir basketbol takımına alınacak oyuncunun gelecekteki performansı ve takıma
sağlayacağı yararları tahmin edilebilme.
Kütüphanecilik alanındaki uygulamalar:
Bir müşterinin aldığı kitabı ne zaman getireceği ve bir sonraki gelişinde hangi kitabı
seçeceği konusunda tahminler yapılabilme.
Turizm alanındaki uygulamalar:
Bir bölgeye turistlerin niçin geldiğini tespit ederek reklâm kampanyası düzenlemek
ve bir sonraki sezonda turist sayısını arttırmak.
Web alanındaki uygulamalar:
Kullanıcıların profilini belirleyip onlara uygun ürünlerin reklâm kampanyalarını
sayfalara koyma.
Geçmişteki ve şu anki veriler analiz edilerek geleceğe yönelik tahminlerde
bulunulabilir. Bu durum özellikle karlılık, ciro, pazar payı, hava durumu gibi
analizlerde çok rahat kullanılabilir.
Çizelge 3.1.’de 2003 yılında veri madenciliğinin sektörler bazında kullanımına
ilişkin bir araştırmanın sonuçları yer almaktadır. Bu çizelgede araştırmaya katılan
toplam 421 şirketin 51 adedinin bankacılık alanında veri madenciliğini kullandığı
görülmektedir (Akbulut, 2006).
17
Çizelge 3.1. Veri madenciliği uygulama alanları
3.2.5. Veri Madenciliği Uygulamalarında Karşılaşılan Problemler
VM büyük hacimli gerçek dünya verileriyle uğraştığı için, bu büyük hacimli veriler
VM’de büyük sorunlar oluşturur. Bundan dolayı mesela küçük veri setleriyle ve
yapay hazırlanmış verilerle doğru çalışan sistemler büyük hacimli, eksik, gürültülü,
NULL değerli, artık, dinamik verilerle yanlış çalışabilir. Bundan dolayı bu sorunların
aşılması gerekmektedir.
18
Veri madenciliği girdi olarak kullanılacak ham veriyi veritabanlarından alır. Bu da
veritabanlarının dinamik, eksiksiz, geniş ve net veri içermemesi durumunda sorunlar
doğurur (Aydoğan, 2003).
Diğer sorunlar da verinin konu ile uyumsuzluğundan doğabilir. Sınıflandırmak
gerekirse başlıca sorunlar aşağıdaki gibidir:
1. Sınırlı bilgi: Veritabanları genel olarak veri madenciliği dışındaki amaçlar için
tasarlanmışlardır. Bu yüzden, öğrenme görevini kolaylaştıracak bazı özellikler
bulunmayabilir.
2. Gürültü ve kayıp değerler: Veri girişi veya veri toplanması esnasında oluşan
sistem dışı hatalara gürültü denir. Veri toplanması esnasında oluşan hatalara
ölçümden kaynaklanan hatalar da dâhil olmaktadır. Bu hataların sonucu olarak
VM’de birçok niteliğin değeri yanlış olabilir.
3. Belirsizlik: Yanlışlıkların şiddeti ve verideki gürültünün derecesi ile ilgilidir. Veri
tahmini, bir keşif sisteminde önemli bir husustur.
4. Ebat, güncellemeler ve konu dışı sahalar: Veri tabanlarındaki bilgiler, veri
eklendikçe ya
da silindikçe
değişebilir. Veri madenciliği perspektifinden
bakıldığında, kuralların hala aynı kalıp kalmadığı ve istikrarlılığı problemi ortaya
çıkar. Öğrenme sistemi, kimi verilerin zamanla değişmesine ve keşif sisteminin
verinin zamansızlığına karşın zaman duyarlı olmalıdır.
5. Artık veri: Artık veri, problemde istenilen sonucu elde etmek için kullanılan
örneklem kümesindeki gereksiz niteliklerdir.
Artık nitelikleri elemek için geliştirilmiş algoritmalar, özellik seçimi olarak
adlandırılır. Özellik seçimi arama uzayını küçültür ve sınıflama işleminin kalitesini
de artırır.
19
3.2.6. Veri Madenciliği Teknikleri
Veri madenciliği teknikleri işlevlerine göre 3 temel grupta toplanır (Akbulut, 2006):
•
Sınıflama,
•
Kümeleme,
•
Birliktelik kuralları ve sıralı örüntüler.
3.2.6.1. Sınıflama
Sınıflama, verinin önceden belirlenen çıktılara uygun olarak ayrıştırılmasını sağlayan
bir tekniktir. Çıktılar, önceden bilindiği için sınıflama, veri kümesini denetimli olarak
öğrenir (Akbulut, 2006).
Örneğin; A finans hizmetleri şirketi; müşterilerinin yeni bir yatırım fırsatıyla
ilgilenip ilgilenmediğini öğrenmek istemektedir. Daha önceden benzer bir ürün
satmıştır ve geçmiş veriler hangi müşterilerin önceki teklife cevap verdiğini
göstermektedir. Amaç; bu teklife cevap veren müşterilerin özelliklerini belirlemek ve
böylece pazarlama ve satış çalışmalarını daha etkin yürütmektir.
Müşteri kayıtlarında müşterinin önceki teklife cevap verip vermediğini gösteren
“evet”/ “hayır” şeklinde bir alan bulunur. Bu alan “hedef ” ya da “bağımlı” değişken
olarak adlandırılır. Amaç, müşterilerin diğer niteliklerinin (gelir düzeyi, iş türü, yaş,
medeni durum, kaç yıldır müşteri olduğu, satın aldığı diğer ürün ve yatırım türleri)
hedef değişken üzerindeki etkilerini analiz etmektir. Analizde yer alan diğer
nitelikler “bağımsız” ya da “tahminci” değişken adını alır.
Temel sınıflama algoritmaları aşağıdadır:
•
Diskriminant analizi,
•
Naive Bayes,
•
Karar ağaçları,
20
•
Sinir ağları,
•
Kaba kümeler,
•
Genetik algoritma,
•
Regresyon analizi.
1. Diskriminant analizi
Diskriminant analizi, bir dizi gözlemi önceden tanımlanmış sınıflara atayan bir
tekniktir. Model, ait oldukları sınıf bilinen gözlem kümesi üzerine kurulur. Bu küme,
öğrenme kümesi olarak da adlandırılır. Öğrenme kümesine dayalı olarak,
diskriminant fonksiyonu olarak bilinen doğrusal fonksiyonların bir kümesi
oluşturulur. Diskriminant fonksiyonu, yeni gözlemlerin ait olduğu sınıfı belirlemek
için kullanılır. Yeni bir gözlem söz konusu olduğu için tüm diskriminant
fonksiyonları hesaplanır ve yeni gözlem diskriminant fonksiyonunun değerinin en
yüksek olduğu sınıfa atanır (Huberty, 1994).
2. Naive Bayes
Naive Bayes, hedef değişkenle bağımsız değişkenler arasındaki ilişkiyi analiz eden
tahminci ve tanımlayıcı bir sınıflama algoritmasıdır (Hudairy, 2004).
Naive Bayes, sürekli veri ile çalışmaz. Bu nedenle sürekli değerleri içeren bağımlı ya
da
bağımsız değişkenler kategorik hale getirilmelidir.
Örneğin; bağımsız
değişkenlerden biri yaş ise, sürekli değerler “<20” “21–30”, “31–40” gibi yaş
aralıklarına dönüştürülmelidir.
Naive Bayes, modelin öğrenilmesi esnasında, her çıktının öğrenme kümesinde kaç
kere meydana geldiğini hesaplar. Bulunan bu değer, öncelikli olasılık olarak
adlandırılır. Örneğin; bir banka kredi kartı başvurularını “iyi” ve “kötü” risk
sınıflarında gruplandırmak istemektedir. İyi risk çıktısı toplam 5 vaka içinde 2 kere
meydana geldiyse iyi risk için öncelikli olasılık 0,4’tür. Bu durum, “Kredi kartı için
başvuran biri hakkında hiçbir şey bilinmiyorsa, bu kişi 0,4 olasılıkla iyi risk
21
grubundadır” olarak yorumlanır Naive Bayes aynı zamanda her bağımsız
değişken/bağımlı değişken kombinasyonunun meydana gelme sıklığını bulur. Bu
sıklıklar öncelikli olasılıklarla birleştirilmek suretiyle tahminde kullanılır.
3. Karar ağaçları
Karar ağaçları, yaygın olarak kullanılan sınıflama algoritmalarından birisidir. Karar
ağacı yapılarında, her düğüm bir nitelik üzerinde gerçekleştirilen testi, her dal bu
testin çıktısını, her yaprak düğüm ise sınıfları temsil eder. En üstteki düğüm kök
düğüm olarak adlandırılır. Karar ağaçları, kök düğümden yaprak düğüme doğru
çalışır (Wei vd., 2002).
En yaygın kullanılan karar ağacı algoritmaları;
•
CHAID (Chi-Squared Automatic Interaction Detector , Kass 1980),
•
C&RT (Classification and Regression Trees, Breiman ve Friedman, 1984),
•
ID3 (Induction of Decision Trees, Quinlan, 1986),
•
C4.5 (Quinlan, 1993).
4. Sinir Ağları
Sinir ağları, tanımlayıcı ve tahmin edici veri madenciliği algoritmalarındandır. İnsan
beyninin fizyolojisini taklit ederler. Komplike ve belirsiz veriden bilgi üretirler.
Keşfettikleri örüntü ve trendler, insanlar ya da bilgisayarlarca kolay keşfedilemez.
Bu tür karmaşık problemlerde birbirleriyle etkileşimli yüzlerce değişken bulunur
(Aryeetey, 2003).
Bu teknik, veritabanındaki örüntüleri, sınıflandırma ve tahminde kullanılmak üzere
genelleştirir. Sinir ağları algoritmaları sadece sayısal veriler üzerinde çalışırlar.
22
5. Kaba kümeler
Kaba küme teorisi 1970’li yıllarda Pawlak tarafından geliştirilmiştir. Kaba küme
teorisinde bir yaklaştırma uzayı ve bir kümenin alt ve üst yaklaştırmaları vardır.
Yaklaştırma uzayı, ilgilenilen alanı ayrı kategorilerde sınıflandırır. Alt yakınlaştırma
belirli bir altkümeye ait olduğu kesin olarak bilinen nesnelerin tanımıdır. Üst
yakınlaştırma ise alt kümeye ait olması olası nesnelerin tanımıdır. Alt ve üst sınırlar
arasında tanımlanan herhangi bir nesne ise “kaba küme” olarak adlandırılır (Pawlak,
2002).
6. Genetik algoritma
Algoritma ilk olarak popülâsyon adı verilen bir çözüm kümesi (öğrenme veri
kümesi) ile başlatılır. Bir popülâsyondan alınan sonuçlar bir öncekinden daha iyi
olacağı beklenen yeni bir popülâsyon oluşturmak için kullanılır. Evrim süreci (yeni
popülâsyonlar yapma iterasyonu) tamamlandığında bağımlılık kuralları veya sınıf
modelleri ortaya konmuş olur (Shah vd., 2004).
7. Regresyon analizi
Regresyon analizi, bir ya da daha fazla bağımsız değişken ile hedef değişken
arasındaki
ilişkiyi
matematiksel
olarak
modelleyen
bir
yöntemdir.
Veri
madenciliğinde yaygın olarak kullanılan regresyon modellerinden doğrusal
regresyonda tahmin edilecek olan hedef değişken sürekli değer alırken; lojistik
regresyonda hedef değişken kesikli bir değer almaktadır. Doğrusal regresyonda hedef
değişkenin değeri; lojistik regresyonda ise hedef değişkenin alabileceği değerlerden
birinin gerçekleşme olasılığı tahmin edilmektedir (Hui vd., 2000).
3.2.6.2. Kümeleme
Kümeleme, verideki benzer kayıtların gruplandırılmasını sağlayan bir tekniktir.
Kümelemede, genellikle k-ortalamalar algoritması ya da Kohonen şebekesi gibi
23
istatistiksel yöntemler kullanılmaktadır. Hangi yöntem kullanılırsa kullanılsın süreç
aynı şekilde işler. Her kayıt var olan kümelerle karşılaştırılır. Bir kayıt kendisine en
yakın kümeye atanır ve bu kümeyi tanımlayan değeri değiştirir. Optimum çözüm
bulununcaya kadar kayıtlar yeniden atanır ve küme merkezleri ayarlanır (Hui vd.,
2000).
3.2.6.3. Birliktelik Kuralları ve Ardışık Örüntüler
Birliktelik analizi, bir veri kümesindeki kayıtlar arasındaki bağlantıları arayan
denetimsiz veri madenciliği şeklidir. Birliktelik analizi çoğu zaman perakende
sektöründe süpermarket müşterilerinin satın alma davranışlarını ortaya koymak için
kullanıldığından “pazar sepeti analizi” olarak da adlandırılır (Bland, 2002).
Birliktelik kurallarına ait bir örnek: “Düşük yağlı peynir ve yağsız süt alan müşteriler
%85 olasılıkla diyet süt alırlar.”
Ardışık analiz ise birbiriyle ilişkisi olan ancak birbirini izleyen dönemlerde
gerçekleşen ilişkilerin tanımlanmasında kullanılır. Aşağıda ardışık analize ait
örnekler yer almaktadır.
•
“Çadır alan müşterilerin %10’u bir ay içerisinde sırt çantası almaktadır.”
•
“A hissesi %15 artarsa üç gün içinde B hissesi %60 olasılıkla artacaktır.”
3.2.6.4. Tezde Kullanılan Veri Madenciliği Tekniği
Yukarıda anlatılan tekniklerden, tez kapsamında karar ağaçları kullanıldığından, bu
gruba giren sınıflandırma algoritmaları detaylı bir şekilde anlatılmıştır.
Karar Ağaçları, verileri belli nitelik değerlerine göre sınıflandırmaya yarar. Bunun
için algoritmaya girdi olarak verilerin belirlenen belli nitelikleri, çıktı olarak da
verilerin belli bir niteliği verilir ve algoritma bu çıktı niteliğindeki değerlere ulaşmak
24
için hangi girdi nitelik değerlerinin olması gerektiğini ağaç veri yapıları kullanarak
keşfeder.
Tezde karar ağaçlarının kullanılmasının sebebi; eldeki değerlerle en iyi sonucun,
yukarıda verilen tanıma en uygun çözüm olmasıdır. Bunun için 3 faz akım ve gerilim
ile sol ve sağ band için band geçiren filtre uygulanmış akım değerleri algoritmaya
girdi bilgisi olarak alınmıştır. Sağlam motor (1), sargı spirleri arasında kısa devre
hatası bulunan motor (2) ve milinde mekanik dengesizlik hatası bulunan motor (3)
değerleri de çıktı olarak değerlendirilmiştir. Eldeki bu girdi parametrelerine göre
WEKA’da bulunan karar ağaçları algoritmaları ile çıktı niteliğindeki değerlere nasıl
ulaşıldığı keşfedilmeye çalışılmıştır.
Ayrıca, karar ağacı, gürültülü veride etkili çalışabildiği için sınıfların ayırıcı
özelliklerini keşfeder. Karar ağacı algoritmalarını bir probleme uygulayabilmek için
aşağıdaki koşulların sağlanması gerekir;
•
Olayların özelliklerle ifade edilebilmesi gerekir. Nesnelerin belli sayıda
özellik değerleriyle ifade edilebilmesi gerekir. Örneğin; soğuk, sıcak,...vb.
•
Sınıfları belirleyebilmek için gereken ayırıcı özelliklerin olması gerekir.
Örnek olarak futbol oynamak isteyen kişiler için hava koşulları kayıtlarıyla
ilgilenilsin. Hedef nitelik olan futbol oynama durumu iki değer alabilsin. Bunlar
oynanabilir ve oynanamaz olsun. Çizelge 3.2.’deki veriler bu örnek için verilmiş
nitelik ve bunların alabileceği olası değerler olsun.
Çizelge 3.2. Futbol örneği için hedef olmayan nitelikler
NİTELİK
OLASI DEĞERLER
Hava durumu
Güneşli, Bulutlu, Yağmurlu
Sıcaklık
Sürekli
Nem
Sürekli
Rüzgâr
Var, Yok
25
Çizelge 3.3. Futbol örneği için öğrenme verisi
Hava durumu
Sıcaklık Nem
Rüzgâr
Futbol Oynama Durumu
Güneşli
29
85
Yok
Oynanamaz
Güneşli
27
90
Var
Oynanamaz
Bulutlu
28
78
Yok
Oynanabilir
Yağmurlu
21
96
Yok
Oynanabilir
Yağmurlu
20
80
Yok
Oynanabilir
Yağmurlu
18
70
Var
Oynanamaz
Bulutlu
18
65
Var
Oynanabilir
Güneşli
22
95
Yok
Oynanamaz
Güneşli
21
70
Yok
Oynanabilir
Yağmurlu
24
80
Yok
Oynanabilir
Güneşli
24
70
Var
Oynanabilir
Bulutlu
22
90
Var
Oynanabilir
Bulutlu
27
75
Yok
Oynanabilir
Yağmurlu
22
80
Var
Oynanamaz
Çizelge 3.2.’deki nitelikler ve Çizelge 3.3.’deki öğrenme verileri kullanıldığında
ortaya Şekil 3.1.’deki karar ağacı çıkar.
Şekil 3.1. Futbol örneği için oluşan karar ağacı
26
Şekil 3.1.’deki karar ağacına göre, havanın bulutlu olduğu zamanlarda diğer şartlara
bakılmaksızın futbol oynanabilir. Eğer hava güneşli ise o zaman nem değerine bakılır
ve nem değeride 75’den büyük ise futbol oynanmaz ama nem değeri 75 veya 75’den
küçük ise futbol oynanabilir. Eğer hava yağmurlu ise o zaman da rüzgâra bakılır.
Rüzgâr varsa futbol oynanmaz, yoksa futbol oynanabilir.
3.2.7. Veri Madenciliği Yazılımları
Farklı algoritmaları bünyesinde bulunduran ve farklı işletim sistemleri üzerinde
çalışabilen birçok veri madenciliği yazılımı bulunmaktadır. Çizelge 3.4.’de, bu
yazılımlardan bazıları, üzerinde çalıştıkları platform ve fonksiyonel özellikleri ile
birlikte gösterilmektedir.
Çizelge 3.4. Veri Madenciliğinde kullanılan bazı yazılımlar ve özellikleri
IBM
Ürün Adı
Intelligent
Miner
Oracle
Darwin
AIX 4.1,
Platform
NVS,
AS/400,
Windows
Windows
SAS
Enterprise
SPSS
WEKA
Windows,
Windows,
Windows,
Macintosh,
Macintosh,
Macintosh,
Unix
Unix
Unix
x
x
Miner
Karar Ağacı
x
x
x
Sinir Ağları
x
x
x
Zaman Serileri
x
Tahmin
x
Kümeleme
x
x
Birliktelik
x
x
x
x
Görselleştirme
x
x
x
x
x
x
x
x
x
27
x
x
x
1. Intelligent Miner
Eşleştirme, sınıflama, tahmin modelleme, gruplama, sıralı desen analizi, regresyon
analizi gibi fonksiyonları içeren IBM firmasının geliştirdiği bir yazılımdır. Ayrıca
yapay sinir ağları algoritmaları, istatistik metotları, veri hazırlama ve görsel gösterim
araçları gibi ek özellikler içerir.
2. Darwin
Darwin Oracle firmasının VM aracıdır. Darwin regresyon ağaçları, karar ağaçları,
kümeleme, yapay sinir ağları, Bayesian öğrenme, k-yakınlığında komşuluk gibi
birçok algoritmayı destekleyen bir VM aracıdır. Darwin kullanımı kolay bir ara yüze
sahiptir. Darwin VM algoritmalarından CART, StarTree, StarNet ve StarMatch’i
kullanır (Aydoğan, 2003).
3. Enterprise Miner
SAS firmasının VM aracıdır. Enterprise Miner karar ağaçları, yapay sinir ağları,
regresyon analizi, kümeleme, zaman serileri, ilişkilendirme, vb. VM sorgularını ele
alabilmektedir. Grafiksel arayüzü sayesinde kullanım kolaylığı sağlar ve kullanıcılar
uygulamanın karmaşıklığından habersiz bir şekilde sadece girdi ve çıktılara
yoğunlaşabilirler (Aydoğan, 2003).
4. SPSS
İlk sürümü 1968 yılında piyasaya sürülmüş istatistiksel analize yönelik bir bilgisayar
programıdır. Günümüzde en son versiyonu olan SPSS 15.0 kullanımdadır. Özellikle
Sosyal Bilimlerde, pazar araştırmalarında, sağlık araştırmalarında başta anket
şirketleri, hükümetler ve eğitim kurumları olmak üzere pek çok kurum tarafından
kullanılan bir VM yazılımıdır.
28
Kullanımı grafiksel bir kullanıcı ara yüzüne bağlı olup, açılır menüler yardımıyla
kolaylaştırılmıştır. Ayrıca makro dilleri yardımıyla kullanıcı kendi amaçları
doğrultusunda programı yönlendirebilmektedir. SPSS programının Windows, Mac
OS ve UNIX işletim sistemleri için farklı sürümleri mevcuttur. Windows sürümü
daha sık güncellenmekte ve diğer versiyonlara göre daha fazla özellik içermektedir
(http://tr.wikipedia.org/wiki/SPSS).
5. WEKA
Yeni Zelanda Waikito Üniversitesinde, obje yönelimli programlama dillerinden biri
olan Java ile geliştirilmiş ve halen yeni sürümleri geliştirilmeye devam eden açık
kaynak kodlu bir VM yazılımdır. WEKA’nın Java ile geliştirilmiş olması, Linux,
Unix, Windows ve Macintosh gibi başlıca işletim sistemi platformlarında
kullanılabilirliğini sağlamıştır. Ayrıca WEKA programı internet üzerinden bedelsiz
olarak dağıtılması nedeniyle tezde kullanılmıştır. (http://www.cs.waikato.ac.nz/ml/
weka/index_downloading.html)
Yukarıdaki programların haricinde ayrıca özel amaçlar için tasarlanmış VM
uygulama programları bulunmaktadır. Bunlardan bazıları; Clementine (Kimya), Data
Logic/R (Ticaret), INLEN, KDW (Knowledge Discowery Workbench), SKICAT
(Sky Image Classification & Archiving Tool) (Astronomi), R-MINI (Finansal),
TASA
(Telecommunication
Network
Alarm
Sequence
Analyzer)
(Telekomünikasyon), GCLUTO (Graphical CLUstering TOolkit).
3.3.Veri Madenciliği Süreci
Ne kadar etkin olursa olsun hiç bir veri madenciliği algoritmasının, üzerinde
inceleme yapılan işin ve verilerin özelliklerinin bilinmemesi durumunda fayda
sağlaması mümkün değildir. Bu nedenle yukarıda tanımlanan tüm aşamalardan önce,
iş ve veri özelliklerinin öğrenilmesi-anlaşılması başarının ilk şartı olacaktır. Başarılı
bir veri madenciliği projesinde izlenmesi gereken adımlar aşağıdadır (Shearer, 2000);
29
1. Problemin tanımlanması,
2. Verilerin hazırlanması,
3. Modelin kurulması ve değerlendirilmesi,
4. Modelin kullanılması,
5. Modelin izlenmesi.
3.3.1. Problemin Tanımlanması
Veri madenciliği çalışmalarında başarılı olmanın en önemli şartı, projenin hangi
işletme amacı için yapılacağının ve elde edilecek sonuçların başarı düzeylerinin nasıl
ölçüleceğinin tanımlanmasıdır. Ayrıca yanlış tahminlerde katlanılacak olan
maliyetlere ve doğru tahminlerde kazanılacak faydalara ilişkin tahminlere de bu
aşamada yer verilmelidir. Bu aşamada mevcut iş probleminin nasıl bir sonuç
üretilmesi durumunda çözüleceğinin, üretilecek olan sonucun fayda-maliyet
analizinin başka bir ifadeyle üretilen bilginin işletme için değerinin doğru analiz
edilmesi gerekmektedir (Akbulut, 2006).
Analistin, işletmede üretilen sayısal verilerin boyutlarını, proje için yeterlilik
düzeyini ve iş süreçlerini iyi analiz etmesi gerekmektedir.
3.3.2. Verilerin Hazırlanması (Veri Önişleme)
Veri madenciliğinin en önemli aşamalarından biri olan verinin hazırlanması aşaması,
analistin toplam zaman ve enerjisinin %50-%85’ini harcamasına neden olmaktadır.
Veri kalitesi, veri madenciliğinde anahtar bir konudur. Veri madenciliğinde
güvenilirliğin artırılması için, veri ön işleme yapılmalıdır. Aksi halde hatalı girdi
verileri kullanıcıyı hatalı çıktıya götürecektir. Veri ön işleme, çoğu durumlarda yarı
otomatik olan ve yukarıda da belirtildiği gibi zaman isteyen bir veri madenciliği
aşamasıdır. Verilerin sayısındaki artış ve buna bağlı olarak çok büyük sayıda
30
verilerin ön işlemden geçirilmesinin gerekliliği, otomatik veri ön işleme için etkin
teknikleri önemli hale getirmiştir (Oğuzlar, 2003).
Veri ön işleme teknikleri şu şekilde sıralanabilir:
1. Veri Temizleme
2. Veri Birleştirme
3. Veri Dönüştürme
4. Veri İndirgeme
Veri önişleme tekniklerinden kısaca bahsetmek gerekirse;
1. Veri Temizleme
Veri temizleme, eksik verilerin tamamlanması, aykırı değerlerin tespit edilmesi
amacıyla gürültünün düzeltilmesi ve verilerdeki tutarsızlıkların giderilmesi gibi
işlemleri gerektirmektedir.
2. Veri Birleştirme
Veri madenciliğinde bazen farklı veri tabanlarındaki verilerin birleştirilmesi
gerekebilir.
Farklı
veri
tabanlarındaki
verilerin
tek
bir
veri
tabanında
birleştirilmesiyle şema birleştirme hataları oluşur. Örneğin, bir veri tabanında girişler
“tüketici-ID” şeklinde yapılmışken, bir diğerinde “tüketici-numarası” şeklinde
olabilir. Bu tip şema birleştirme hatalarından kaçınmak için meta veriler kullanılır.
3. Veri Dönüştürme
Veri dönüştürme ile veriler, veri madenciliği için uygun formlara dönüştürülürler.
Veri dönüştürme; düzeltme, birleştirme, genelleştirme ve normalleştirme gibi değişik
işlemlerden biri veya bir kaçını içerebilir. Veri normalleştirme en sık kullanılan veri
dönüştürme işlemlerinden birisidir.
31
4. Veri İndirgeme
Veri indirgeme teknikleri, daha küçük hacimli olarak ve veri kümesinin indirgenmiş
bir örneğinin elde edilmesi amacıyla uygulanır. Bu sayede elde edilen indirgenmiş
veri kümesine veri madenciliği teknikleri uygulanarak daha etkin sonuçlar elde
edilebilir.
Veri indirgeme yöntemleri ise aşağıdaki biçimde özetlenebilir:
1. Veri Birleştirme veya Veri Küpü
2. Boyut indirgeme
3. Veri Sıkıştırma
4. Kesikli hale getirme
3.3.3. Modelin Kurulması ve Değerlendirilmesi
Tanımlanan problem için en uygun modelin bulunabilmesi, olabildiğince çok sayıda
modelin kurularak denenmesi ile mümkündür. Bu nedenle veri hazırlama ve model
kurma aşamaları, en iyi olduğu düşünülen modele varılıncaya kadar yinelenen bir
süreçtir.
Model kuruluş süreci denetimli ve denetimsiz öğrenimin kullanıldığı modellere göre
farklılık göstermektedir (Witten ve Frank, 2000).
Örnekten öğrenme olarak da isimlendirilen denetimli öğrenimde, bir denetçi
tarafından ilgili sınıflar önceden belirlenen bir kritere göre ayrılarak, her sınıf için
çeşitli örnekler verilir. Sistemin amacı verilen örneklerden hareket ederek her bir
sınıfa ilişkin özelliklerin bulunmasıdır.
Öğrenme süreci tamamlandığında, tanımlanan kurallar verilen yeni örneklere
uygulanır ve yeni örneklerin hangi sınıfa ait olduğu kurulan model tarafından
belirlenir.
32
Denetimsiz öğrenmede, kümeleme analizinde olduğu gibi ilgili örneklerin
gözlenmesi ve bu örneklerin özellikleri arasındaki benzerliklerden hareket ederek
sınıfların tanımlanması amaçlanmaktadır.
Denetimli öğrenimde seçilen algoritmaya uygun olarak ilgili veriler hazırlandıktan
sonra, ilk aşamada verinin bir kısmı modelin öğrenimi, diğer kısmı ise modelin
geçerliliğinin test edilmesi için ayrılır. Modelin öğrenimi, öğrenim kümesi
kullanılarak gerçekleştirildikten sonra, test kümesi ile modelin doğruluk derecesi
belirlenir (Akbulut, 2006).
Bir modelin doğruluğunun test edilmesinde kullanılan en basit yöntem basit
geçerlilik testidir. Bu yöntemde tipik olarak verilerin %5 ile %33 arasındaki bir kısmı
test
verileri
olarak
ayrılır
ve
kalan
kısım
üzerinde
modelin
öğrenimi
gerçekleştirildikten sonra, bu veriler üzerinde test işlemi yapılır. Bir sınıflama
modelinde yanlış olarak sınıflanan olay sayısının, tüm olay sayısına bölünmesi ile
hata oranı, doğru olarak sınıflanan olay sayısının tüm olay sayısına bölünmesi ile ise
doğruluk oranı hesaplanır (Akpınar, 2000).
Değerlendirme kriterlerinden en önemlisi, modelin anlaşılabilirliğidir. Bazı
uygulamalarda doğruluk oranlarındaki küçük artışlar çok önemli olsa da, birçok
işletme uygulamasında ilgili kararın niçin verildiğinin yorumlanabilmesi çok daha
büyük önem taşıyabilir. Çok ender olarak yorumlanamayacak kadar karmaşıklaşsalar
da, genel olarak karar ağacı ve kural temelli sistemler model tahmininin altında yatan
nedenleri çok iyi ortaya koyabilmektedir.
Kurulan modelin doğruluk derecesi ne denli yüksek olursa olsun, gerçek dünyayı tam
anlamı ile modellediğini garanti edebilmek mümkün değildir. Yapılan testler
sonucunda geçerli bir modelin doğru olmamasındaki başlıca nedenler, model
kuruluşunda kabul edilen varsayımlar ve modelde kullanılan verilerin doğru
olmamasıdır.
33
3.3.4. Modelin Kullanılması
Kurulan ve geçerliliği kabul edilen model doğrudan bir uygulama olabileceği gibi,
bir başka uygulamanın alt parçası olarak kullanılabilir. Kurulan modeller risk analizi,
kredi değerlendirme, dolandırıcılık tespiti gibi işletme uygulamalarında doğrudan
kullanılabileceği gibi, promosyon planlaması simülasyonuna entegre edilebilir veya
tahmini envanter düzeyleri yeniden sipariş noktasının altına düştüğünde, otomatik
olarak sipariş verilmesini sağlayacak bir uygulamanın içine gömülebilir (Shearer,
2000).
3.3.5. Modelin İzlenmesi
Zaman içerisinde bütün sistemlerin özelliklerinde ve dolayısıyla ürettikleri verilerde
ortaya çıkan değişiklikler, kurulan modellerin sürekli olarak izlenmesini ve
gerekiyorsa yeniden düzenlenmesini gerektirecektir. Tahmin edilen ve gözlenen
değişkenler arasındaki farklılığı gösteren grafikler model sonuçlarının izlenmesinde
kullanılan yararlı bir yöntemdir (Shearer, 2000).
3.4. Yöntem
3.4.1. Problemin Tanımlanması
Bu tezin amacı, işletmelerde m a k s i m u m
verimlilik s a ğ l a n m a s ı ,
ürün
kalitesinin artırılması ve çalışma zaman kayıplarının önlenmesini
sağlamak için atılması gereken ilk adım işletmelerdeki süreçlerin gerçek zamanlı
olarak sürekli izlenmesi, ikinci adım ise bu süreçlerin izlenmesi ile elde edilen
verilerin, veri madenciliği gibi tahmin ve sınıflama kabiliyetine sahip bir araç ile
analiz edilmesidir.
Bu bize üretimi durdurmadan, belirli aralıklarla işletme duruşlarına gidilerek makine
ve ekipmanlardan verileri alarak, oluşturulan veri madenciliği sistemi ile ortaya
çıkabilecek olan hataların önceden tespit edilmesini sağlayacaktır.
34
Bu çalışma için veriler Artesis Teknoloji Sistemleri A.Ş. firmasından alınmıştır.
Veriler aynı motordan 3 durum için alınmıştır. Normal (Sağlam), sargı spirleri
arasında kısa devre hatası ve milinde mekanik dengesizlik hatası durumları için üç
faz akım ve gerilim değerleridir. Verilerin alındığı motorun özelikleri Çizelge 3.5.’de
verilmiştir.
Çizelge 3.5. Verilerin alındığı 3 faz sincap kafes asenkron motorun özellikleri
Özellik
Değer
Gücü (kVA)
1.2
Gerilin (V)
220
Frekans (Hz)
50
Devir Sayısı (d/dk)
1475
Stator Rezistansı rs (ohm)
4.85
Xls (ohm)
0.274
Xlr (ohm)
0.274
rr (ohm)
3.805
J (kg.m2)
0.031
3.4.2. Kullanılan Yazılım
WEKA (Waikato Environment for Knowledge Analysis ), Yeni Zelanda Waikato
Üniversitesi’nde geliştirilen bir veri madenciliği ve makine öğrenmesi yazılımıdır.
WEKA yazılımı nesneye yönelik programlama dillerinden olan Java ile
geliştirilmiştir. Java birçok değişik öğrenme algoritmaları için düzenli bir platform
sağlamaktadır. WEKA’nın en güçlü özelliği birçok sınıflandırma tekniğini
içermesidir. Diğer bir özelliği de uygulamaların komut girilerek gerçekleştirilmesine
imkân tanımasıdır. Şekil 3.2.’de WEKA programının genel kullanıcı ara yüzü
görülmektedir.
35
Şekil 3.2. WEKA programının genel kullanıcı arayüzü
WEKA’da; Preprocess (önişleme), Classify (sınıflama), Cluster (kümeleme),
Associate (birliktelik kuralları), Select Attribute (nitelik seçme) ve Visualize
(görselleştirme) panelleri bulunmaktadır.
36
Ön işleme paneli: Bilgi keşfinin başlangıç noktasıdır. Veri dosyaları bu panelden
yüklenir. WEKA’ya Excel ve Access ortamından ve herhangi bir internet
sayfasından dosya yüklemek mümkündür. Şekil 3.3.’de WEKA programının ön
işleme panelinin ekran görüntüsü verilmiştir.
Şekil 3.3. WEKA programının ön işleme panelinin ekran görünümü
Bu ekranda verilerin minimum, maksimum, ortalama ve standart sapma değerleri ve
verilerin dağılımları sağ alt köşede görülmektedir.
37
Sınıflandırma
algoritmalarının
paneli:
Veri
kümesi
çalıştırıldığı
paneldir.
üzerinde
Şekil
WEKA’nın
3.4.’de
WEKA
sınıflandırma
programının
sınıflandırma panelinin ekran görüntüsü verilmiştir.
Şekil 3.4. WEKA programının sınıflandırma panelinin ekran görünümü
Sınıflandırma paneli, karar ağaçlarından kurallara; fonksiyonlardan Bayes ağlarına
birçok sınıflandırma algoritmasını içermektedir. Kurulacak modeli belirlemek için
farklı algoritmalar veri üzerinde çalıştırılarak doğrulukları karşılaştırılmalıdır.
Bu panelde çapraz geçerleme (cross validation) ya da yüzde ayırma (percentage split)
seçeneklerini kullanarak kurulan modellerin doğruluğunu ölçmek mümkündür.
Çapraz geçerleme veri kümesinin eş büyüklükte (program varsayılan değer olarak 10
katman kullanmaktadır) katmana ayırarak; her iterasyonda n-1 parçayı modelin
öğrenilmesinde 1 parçayı ise modelin testinde kullanan bir yöntemdir. Yüzde ayırma
yönteminde ise veri kümesinin belirli bir yüzdesi (program varsayılan değer olarak
%66 kullanmaktadır) modelin öğrenilmesine kalan kısmı ise modelin testine
ayrılmaktadır.
38
Kümeleme paneli: Bu panelde veritabanı üzerinde WEKA’daki kümeleme
algoritmaları çalıştırılır.
Birliktelik Kuralları paneli: Bu panelde veri kümesine birliktelik kuralları uygulanır.
Görselleştirme paneli: Bu panel ile farklı nitelikler arasındaki ilişkileri grafik olarak
görüntülemek mümkündür.
3.4.3. Uygulamada Veri Madenciliği Süreci
Asenkron motorlarda hata tespiti veri madenciliği sürecinin aşamaları Şekil 3.5.’de
verilmiştir.
Şekil 3.5. Asenkron motorlarda hata tespiti için veri madenciliği süreci
39
Şekil 3.5.’de de görüleceği üzere ilk önce VM’de kullanılacak veriler veri örnekleme
işlemi ile toplanır. Veriler sistematik olarak, aynı şartlarda belli bir yük altında,
motor çalıştırılıp geçici durumları bittikten ve sistem kararlı duruma geldikten sonra
alınmaya başlanmıştır. Veriler 10000 nokta/saniye hızında 6 saniye süresince 3 faz
akım ve gerilim değerleri olarak alınmıştır. Daha sonra veriler WEKA programında
işlenmek üzere hazırlanır. Hazırlanan verileri işlemek için bir model kurulur (tezde
karar ağaçları kullanılarak model kurulmuştur), kurulan modele veriler uygulanır ve
elde edilen sonuçlar değerlendirilir.
3.4.4. Veri Hazırlama
Veri kalitesi, veri madenciliğinde anahtar bir konudur. Veri madenciliğinde
güvenilirliğin artırılması için, veri ön işleme yapılmalıdır. Aksi halde hatalı girdi
verileri kullanıcıyı hatalı çıktıya götürecektir. Veri madenciliğinin en önemli
aşamalarından biri olan verinin hazırlanması aşaması, analistin toplam zaman ve
enerjisinin %50-%85’ini harcamasına neden olmaktadır. Bu yüzden bu aşama
yapılırken çok dikkatli olunmalıdır. Çünkü yanlış hazırlanan veriler, sonuçlarında
yanlış çıkmasına neden olacaktır. Tezde veri hazırlama işlemi olarak,
•
3 faz akım değerlerine sol ve sağ band için band geçiren filtre uygulanması,
•
3 faz akım ve gerilim ile sol ve sağ band için band geçiren filtre uygulanmış
akım değerlerinin RMS değerlerinin hesaplanması,
•
Veri dosyalarının uzantılarının .arff olarak hazırlanmasıdır.
1. Band Geçiren Filtre Uygulaması
Band Geçiren Filtre ile hatalı durumların genlik-frekans düzleminde görülüp,
görülemeyeceği araştırılmıştır. Şekil 3.6.’da band geçiren bir filtrenin frekans-genlik
değişimi gösterilmektedir. Buradaki ok işaretleri de, işaretli olan frekans değerlerinde
normalden farklı bir değişim olduğunu göstermektedir. Filtre çıkışından elde edilen
zaman-genlik değerleri bir Excel dosyası olarak kaydedilmiştir.
40
Şekil 3.6. Band Geçiren Filtrelenmiş üç faz akım spektrumlarının 0-100 Hz aralığı
2. RMS Değerlerinin Hesaplanması
Burada, ilk önce filtresiz durumdaki verilerin RMS değerleri hesaplanacaktır. RMS
hesaplama işlemi Matlab programı ile gerçekleştirilmiştir. RMS hesaplama işlemi
aşağıdaki program parçası ile yapılmıştır.
function [sonuc]=rmsbul(x)
for i=1:1:299
t=0;
y=x((i*200-199):i:i*200);
t=y.*y;
sonuc(i)=sqrt(sum(t)/200);
end
41
Zaman düzlemindeki sinyal 10 kHz örnekleme frekansı ile 6 sn süresince
toplandığından, her bir kanal için 60 bin veri elde edilmiştir. Buna göre bir periyotluk
veride 50 Hz şebeke frekansında 200 adet örnek vardır. Bu sebeple toplam periyot
sayısı 300 olarak bulunmuştur. Bu yüzden döngü 1-299 arasındadır. RMS alma
işlemi 3 faz akım ve gerilim ile sol ve sağ band için band geçiren filtre uygulanmış
akım değerlerine ayrı ayrı uygulanmıştır.
Şekil 3.7. Normal motor için 1. faz akımının zaman-genlik grafiği
Şekil 3.8. Normal motor için 1. faz akımının RMS değişim grafiği
Şekil 3.7. ve Şekil 3.8.’de sırasıyla normal motor için 1. faz akımının anlık
değerlerinin değişimi ve RMS değerlerinin değişim grafikleri gösterilmiştir. RMS
42
hesaplama
işleminin
nedeni;
hatadan
kaynaklanan
genlik
değişimlerinin
izlenebilmesi içindir.
RMS alınmadan önce herhangi bir durumdaki (normal, kısa devre ve mekanik
dengesizlik), tek faz akım veya gerilim verileri 180000 adet iken RMS hesaplama
işleminden sonra bu sayı 900’e dönüştürülmüştür. Elde edilen bu değerler Excel
dosyası olarak kaydedilmiştir.
3. .arff Dosyalarının Hazırlanması
WEKA uygulamalarında veri girişi olarak .arff dosya biçimi kullanılmaktadır. Eldeki
verileri WEKA programına girdi değeri olarak vermek için aşağıdaki işlemler sırayla
yapılmıştır;
•
Excel’de bulunan veriler ilk önce düzenli hale getirilir,
•
Sonra Excel sayfaları Access’de açılarak veritabanı dosyası olarak kaydedilir,
•
Cahit Arf Wizard programı ile de Access’deki veri tabanı dosyaları .arff
uzantılı dosyalara dönüştürülür.
3.4.5. Modelleme
Verilerin hazırlanmasından sonraki adım modelleme adımıdır. Bu adımda farklı
karar ağaç algoritmaları veri kümesi üzerinde denenerek doğruluğu en yüksek olan
model seçilir. Bu uygulamada, model kurma aşamasında WEKA VM yazılımı
kullanılmıştır.
Burada karar ağaçları olarak M5Rules, Decision Table, Conjuctive Rule, RepTree,
M5P-M 4.0, Decision Stump, Regression By Discretization, Bagging, Additive
Regression, LWL, Kstar, Ibk, SMOreg, Simple Linear Regression, RBF Network,
Pace Regression, Multilayer Perceptron, Linear Regression modelleri kullanılmıştır.
Bu karar ağaçlarına girdi verisi olarak aşağıdaki veri paketleri ayrı ayrı
uygulanmıştır.
43
•
3 faz motor akım değerleri,
•
3 faz motor akım ve gerilim değerleri,
•
3 faz motor akım ve sol band için band geçiren filtre uygulanmış akım
değerleri,
•
3 faz motor akım ve sağ band için band geçiren filtre uygulanmış akım
değerleri,
•
3 faz motor akım, sol ve sağ band için band geçiren filtre uygulanmış akım
değerleri,
•
3 faz motor akım ve gerilim ile sol ve sağ band için band geçiren filtre
uygulanmış akım değerleri.
Kurulan modele uygulanan veriler ile elde edilen sonuçlar bir sonraki bölümde
değerlendirilmiştir.
44
4. ARAŞTIRMA BULGULARI VE TARTIŞMA
Bu bölümde, tezde kullanılan asenkron motor frekans spektrum analizi ile hata
tespitinin, VM ile hata tespitinin nasıl yapıldığından ve bu iki uygulamadan elde
edilen sonuçlardan söz edilmiştir. Frekans spektrum analizinde, yüksek genlikli
şebeke frekansı ile düşük genlikli yan bandları ayırt edebilmek için dar aralıklı bir
band geçiren filtre tasarlanarak, motor milindeki mekanik dengesizlik hatası tespit
edilmiştir. VM ile de, sınıflandırma tekniklerinden birkaç karar ağacı uygulanarak
motor milindeki mekanik dengesizlik ve sargı spirleri arasındaki kısa devre hatası
tespit edilmiştir.
Asenkron motor hataları genel olarak stator sargılarında oluşan hatalar, sincap kafesli
motorlarda
rotorda
oluşan
mekanik
hatalar
ve
rulman
hataları
olarak
sınıflandırılabilir. Endüstride en yaygın olarak kullanılan motorlar olmaları
nedeniyle,
özellikle
büyük
güçlü
asenkron
motorların
hatalarının
motor
onarılamayacak duruma gelmeden önce belirlenmesi önem kazanmıştır.
Tezde kullanılan motor akım ve gerilim değerleri sağlam, sargı spirleri arasında kısa
devre olan ve mekanik dengesizliği bulunan 3 fazlı sincap kafesli asenkron motordan
alınmıştır. İlerleyen kısımlarda sağlam motor verileri için “NORMAL”, sargı spirleri
arasındaki kısa devre olan motor verileri için “KISA DEVRE” ve mekanik
dengesizlik motor verileri için “MEK. DENGSZ.” ifadeleri kullanılmıştır.
Asenkron motorların hatalarının belirlenmesi ve sınıflandırılmasında genel olarak
stator akımının frekans spektrumu hatasız bir motordan elde edilen frekans
spektrumu ile karşılaştırılarak yapılmaktadır.
4.1. Frekans Spektrum Analizi
Bu amaçla ilk önce 3 faz motor akımları kullanılarak kısa devre ve mekanik
dengesizlik gibi hatalarının araştırılması için Matlab programında spektrum analizi
yapılmıştır.
45
Akım verilerinin daha iyi görülebilmesi için sadece 10 periyotluk ve 2 periyotluk
kısımları Şekil 4.1.’de gösterilmiştir. Grafiklerdeki siyah renk sağlam motoru,
kırmızı renk kısa devre hatası bulunan motoru ve mavi renkte mekanik dengesizlik
bulunan motoru göstermektedir. Grafiklerde görülen ilk farklılık, normal motor ile
hatalı motor akım verileri arasındaki genlik değişimidir.
(a)
(b)
Şekil 4.1. Normal, kısa devre ve mekanik dengesizliği bulunan motorların 1., 2. ve 3.
faz akımlarının zaman-genlik grafikleri a) 10 periyot b) 2 periyot
Hata tespiti ve sınıflandırması için geleneksel yöntemle stator akımının frekans
spektrumları Şekil 4.2.’de her bir faz için ayrı ayrı verilmiştir.
46
Şekil 4.2. Normal, kısa devre ve mekanik dengesizlik hataları bulunan 3 faz stator
akımlarının genlik-frekans spektrumları
Şekil 4.2.’de gösterilen faz akımlarının frekans spektrumu 0-1000 Hz aralığındadır.
Şebeke frekansının sağında ve solunda farklı genlik değerleri görülmektedir.
Bunların daha iyi görülmesi için frekans spektrumu 0-100 Hz aralığında Şekil 4.3.’de
gösterilmiştir.
Şekil 4.3. Normal, kısa devre ve mekanik dengesizlik hataları bulunan 3 faz stator
akımlarının frekans-genlik spektrumlarının 0-100 Hz aralığı
47
Şekil 4.3.’de mekanik dengesizlik hatası bulunan motor faz akımlarının genliğinin
70-80 Hz ve 20-30 Hz arasında diğer motor faz akımlarının genliklerinden farklı bir
tepe değerine sahip olduğu görülmektedir. Bu durum rotorda oluşan mekanik
dengesizliğin rotor dönüş hızında şebeke frekansını modüle etmesi ile oluşan bir
etkidir. Bu sebeple şebeke frekansının sağında ve solunda rotor hızı ile orantılı yan
bandlar oluşur.
Yüksek genlikli şebeke frekansı ile düşük genlikli yan bandları ayırt edebilmek için
dar aralıklı bir band geçiren filtre ile filtrelenmiştir. Çünkü band geçiren filtre, sadece
belirli frekans aralığını geçirir, diğerlerini söndürür. 70-80 Hz aralığındaki sağ band
için ve 20-30 Hz aralığındaki sol band için 2 ayrı band geçiren filtre tasarlanmıştır.
Band geçiren filtrenin transfer fonksiyonu için aşağıdaki kısa Matlab programı
kullanılmıştır.
w=[0.01451 0.01531];
[b,a]=butter(3,w);
sys=tf(b,a);
Filtrenin transfer fonksiyonu ise aşağıdaki gibidir;
1.98e-009 s^6 - 5.939e-009 s^4 + 5.939e-009 s^2 - 1.98e-009
--------------------------------------------------------------------------------------s^6 - 5.988 s^5 + 14.95 s^4 - 19.91 s^3 + 14.92 s^2 - 5.968 s + 0.995
Sağ band için 3. dereceden butterworth tipi sayısal band geçiren filtre kullanılmıştır.
Filtrede pencere genişliği 4 Hz, normalizasyon fs/2 olarak alınmıştır. (fs: örnekleme
frekansı (10/2=5 kHz))
48
Şekil 4.4. Sağ Band için band geçiren filtrenin kutup 0 diyagramı
Şekil 4.4.’deki kutup 0 diyagramında Filtre Kutupları birim çember üzerindedir.
Buradan filtrenin kararlılığı anlaşılmaktadır. Eğer Filtre Kutupları birim çember
dışında olsalardı uygulanan filtre kararsız olurdu.
49
Şekil 4.5. Sağ Band için Band Geçiren Filtrenin frekans cevabı
Şekil 4.5.’deki kazanç-frekans ve faz açısı-frekans değişimlerinden band geçiren
filtre karakteristiği olduğu gözlemlenmiştir. Şekil 4.5.’de Kazanç Genliği(dB)Normalize Frekans(rad) grafiğinde kırmızı çember içine alınan bölge band geçiren
filtrenin ilgili aralığı geçirdiğini göstermektedir.
Şekil 4.6. Normal, kısa devre, mekanik dengesizlik durumları için filtrelenmiş 1. faz
akımının zaman-genlik grafiği
50
Şekil 4.7. Normal, kısa devre, mekanik dengesizlik durumları için 2. faz akımının
filtrelenmiş durumlarının zaman-genlik grafiği
Şekil 4.8. Normal, kısa devre, mekanik dengesizlik durumları için 3. faz akımının
filtrelenmiş durumlarının zaman-genlik grafiği
Şekil 4.6., 4.7. ve 4.8. normal, kısa devre, mekanik dengesizlik durumları için 3 faz
akımının filtrelenmiş hallerini göstermektedir.
51
Şekil 4.9. Sadece Sağ bandı geçiren filtre çıkışındaki sinyalin faz akım spektrumları
0-1000 Hz aralığı
Şekil 4.10. Sadece Sağ bandı geçiren filtre çıkışındaki sinyalin faz akım spektrumları
0-100 Hz aralığı
50 Hz’lik temel bileşene göre sağ band daha ayırt edici bir şekilde genliği tespit
edilebilmektedir.
52
Sol band için yine sağ banda olduğu gibi band geçiren filtre olarak butter tipi filtre
kullanılmıştır. Filtrede pencere genişliği 4 Hz, normalizasyon fs/2 olarak alınmıştır.
(fs: örnekleme frekansı (10/2=5 kHz))
Şekil 4.11. Sol Band için band geçiren filtrenin kutup 0 diyagramı
Şekil 4.11.’deki kutup 0 diyagramında Filtre Kutupları birim çember üzerindedir.
Buradan filtrenin kararlılığı anlaşılmaktadır. Eğer Filtre Kutupları birim çember
dışında olsalardı uygulanan filtre kararsız olurdu.
53
Şekil 4.12. Sol Band için Band Geçiren filtrenin frekans cevabı
Şekil 4.12.’deki kazanç-frekans ve faz açısı-frekans değişimlerinden band geçiren
filtre karakteristiği olduğu gözlemlenmiştir. Şekil 4.12.’deki Kazanç Genliği (dB)Normalize Frekans (rad) grafiğinde kırmızı çember içine alınan bölge, band geçiren
filtrenin ilgili aralığı geçirdiğini göstermektedir.
Şekil 4.13. Normal, kısa devre, mekanik dengesizlik durumları için filtrelenmiş 1. faz
akımının zaman-genlik grafiği
54
Şekil 4.14. Normal, kısa devre, mekanik dengesizlik durumları için filtrelenmiş 2. faz
akımının zaman-genlik grafiği
Şekil 4.15. Normal, kısa devre, mekanik dengesizlik durumları için filtrelenmiş 3. faz
akımının zaman-genlik grafiği
Şekil 4.13., 4.14. ve 4.15. normal, kısa devre, mekanik dengesizlik durumları için 3
faz akımının filtrelenmiş durumlarını göstermektedir
55
Şekil 4.16. Sadece Sol bandı geçiren filtre çıkışındaki sinyalin faz akım spektrumları
0-1000 Hz aralığı
Şekil 4.17. Sadece Sol bandı geçiren filtre çıkışındaki sinyalin faz akım spektrumları
0-100 Hz aralığı
50 Hz’lik temel bileşene göre, sol band daha ayırt edici bir şekilde genliği tespit
edebilmektedir.
56
Yapılan frekans spektrum analizlerinde kısa devre hatasından kaynaklanan genlik
değişimi frekans düzleminde görülmemektedir. Fakat zaman düzleminde genlik
değişimi ve faz değişimi belirgin şekilde görülmektedir.
4.2. Veri Madenciliği ile Hata Analizi
Filtreli ve filtresiz sinyal değerlerinin RMS değerlerinin bulunması için aşağıdaki
kısa Matlab programı kullanılmıştır.
function [sonuc]=rmsbul(x)
for i=1:1:299
t=0;
y=x((i*200-199):i:i*200);
t=y.*y;
sonuc(i)=sqrt(sum(t)/200);
end
Zaman düzlemindeki sinyal 10 kHz örnekleme frekansı ile 6 sn süresince
toplandığından, her bir kanal için 60 bin veri elde edilmiştir. Buna göre bir periyotluk
veride 50 Hz şebeke frekansında 200 adet örnek vardır. Bu sebeple toplam periyot
sayısı 300 olarak bulunmuştur. Bu yüzden döngü 1-299 arasındadır.
Filtreli ve filtresiz verilerin VM ile çözümlenmesi için bazı adımlardan geçmesi
gerekmektedir. Veriler Excel’de düzenlikten sonra, Access’te veri tabanına
aktarılmıştır. VM işlemi için WEKA programı kullanılmıştır. Bu programda
kullanılacak veriler .arff uzantılı dosyalarda bulunmak zorundadır. Bunun için veri
tabanındaki dosyaların uzantısı Cahit Arf Wizard programı ile .arff olarak
değiştirilmiştir. WEKA için hazırlanan dosyaların bir örneği EK-1’de verilmiştir.
WEKA uygulamaları için 6 adet dosya hazırlanmıştır;
•
3 faz motor akım değerleri,
•
3 faz motor akım ve gerilim değerleri,
•
3 faz motor akım ve sol band için band geçiren filtre uygulanmış akım
değerleri,
57
•
3 faz motor akım ve sağ band için band geçiren filtre uygulanmış akım
değerleri,
•
3 faz motor akım, sol ve sağ band için band geçiren filtre uygulanmış akım
değerleri,
•
3 faz motor akım ve gerilim ile sol ve sağ band için band geçiren filtre
uygulanmış akım değerleri.
Karar ağaçları, verileri belli nitelik değerlerine göre sınıflandırmaya yaradığından
dolayı kullanılmıştır. Bunun için algoritmaya girdi olarak verilerin belirlenen belli
nitelikleri, çıktı olarak da verilerin belli bir niteliği verilir. Algoritma bu çıktı
niteliğindeki değerlere ulaşmak için hangi girdi nitelik değerlerinin olması
gerektiğini ağaç veri yapılarını kullanarak keşfeder. EK-1’de verilen örnek .arff
dosyasında da görülebileceği gibi 3 faz akım ve 3 faz gerilimin RMS değerleri giriş
olarak alınmıştır. 1 değeri sağlam motoru, 2 değeri kısa devre hatası bulunan motoru
ve 3 değeri de mekanik dengesizlik hatası bulunan motoru temsil etmektedir.
Aşağıdaki 3 satır EK-1’de verilen .arff dosyasından alınmıştır. Bu satırlardaki ilk 3
değer 3 faz gerilim RMS değerini, ikinci 3 değer 3 faz akım RMS değerini ve son
değerde motorun durumunu temsil etmektedir.
217.5731, 221.5576, 223.5613, 1.9757, 1.8311, 1.8326, 1.0
220.1463, 221.6926, 220.4362, 2.0595, 1.7336, 1.9997, 2.0
221.7459, 213.7593, 227.2815, 1.8339, 1.7337, 2.117, 3.0
Hazırlanan bu 6 dosyaya WEKA programında sırayla farklı karar ağaç algoritmaları
uygulanmıştır. Uygulanan karar ağacı algoritmaları şunlardır.
-
Rules: M5Rules, Decision Table, Conjuctive Rule,
-
Trees: RepTree, M5P-M 4.0, Decision Stump,
-
Meta: Regression By Discretization, Bagging, Additive Regression,
-
Lazy: LWL, Kstar, Ibk,
-
Functions: SMOreg, Simple Linear Regression, RBF Network, Pace
Regression, Multilayer Perceptron, Linear Regression
58
WEKA programında kuralların oluşturulmasında verilerin %80’i öğrenme verisi ve
%20’si test verisi olarak seçilmiştir.
WEKA’ya sadece 3 faz akım RMS verileri giriş olarak verildiği zaman, karar
ağaçlarından elde edilen değerler Çizelge 4.1.’de verilmiştir. Çizelgedeki Correlation
coefficient (Korelâsyon katsayısı) değeri 1’e ne kadar yakın ise karar ağacının
ürettiği kurallar o derece doğrudur. Aynı şekilde Mean Absolute Error (Mutlak hata
değeri) değerinin de 0’a yakın olması istenir.
Çizelge 4.1. 3 faz akım verilerine göre karar ağaçlarının ürettiği sonuç değerleri
Correlation
Mean absolute
coefficient
error
M5 Rules
0.95
0.0039
Decision Table
0.97
0.03
Conjuctive Rule
0.85
0.34
RepTree
1
0
M5P- M4.0
1
0.0008
Decision Stump
0.85
0.34
Regression By Disc.
0.76
0.45
Bagging
0.87
0.38
Additive Regression
0.90
0.25
LWL
0.99
0.001
KStar
0.95
0.04
Ibk
0.94
0.0032
SMOreg
0.98
0.04
Simple Linear Reg.
0.98
0.04
RBF Network
0.85
0.25
Pace Regression
0.98
0.05
Multilayer Perceptron
0.94
0.002
Linear Regression
0.98
0.04
Functions
Lazy
Meta
Trees
Rules
Karar Ağaçları
59
Çizelge 4.1.’de RepTree ve M5P-M4.0 karar ağaçlarının korelâsyon katsayısı 1
diğerlerininki de 1’e yakın değerler çıkmıştır. Korelasyon katsayısı 1’e ne kadar
yakın olursa üretilen kurallar o derece doğruydu. İkinci kriter olarak ise mutlak hata
değerine bakılırsa yine RepTree ve M5P-M4.0 karar ağaçlarının ürettikleri değerler 0
ve 0’a çok yakın değerlerdir. Akım verilerine göre en iyi kural çıkaran karar ağaçları
RepTree ve M5P-M4.0’dır.
Çizelge 4.2. 3 faz akım ve gerilim verilerine göre karar ağaçlarının ürettiği sonuç
değerleri
Correlation
Mean absolute
coefficient
error
M5 Rules
0.95
0.0039
Decision Table
0.98
0.003
Conjuctive Rule
0.85
0.34
RepTree
1
0
M5P- M4.0
1
0.0008
Decision Stump
0.85
0.34
Regression By Disc.
0.76
0.45
Bagging
0.87
0.38
Additive Regression
0.90
0.25
LWL
0.99
0.001
KStar
0.95
0.04
Ibk
0.94
0.0032
SMOreg
0.98
0.04
Simple Linear Reg.
0.98
0.04
RBF Network
0.87
0.12
Pace Regression
0.98
0.05
Multilayer Perceptron
0.94
0.002
Linear Regression
0.98
0.04
Functions
Lazy
Meta
Trees
Rules
Karar Ağaçları
60
Çizelge 4.3. 3 faz akım ve sol band için band geçiren filtre uygulanmış akım
verilerine göre karar ağaçlarının ürettiği sonuç değerleri
Correlation
Mean absolute
coefficient
error
M5 Rules
0.95
0.0039
Decision Table
0.93
0.024
Conjuctive Rule
0.85
0.34
RepTree
1
0
M5P- M4.0
1
0.0008
Decision Stump
0.85
0.34
Regression By Disc.
0.76
0.45
Bagging
0.87
0.38
Additive Regression
0.90
0.25
LWL
0.99
0.001
KStar
0.95
0.04
Ibk
0.94
0.0032
SMOreg
0.98
0.04
Simple Linear Reg.
0.98
0.04
RBF Network
0.85
0.25
Pace Regression
0.98
0.05
Multilayer Perceptron
0.97
0.06
Linear Regression
0.98
0.04
Functions
Lazy
Meta
Trees
Rules
Karar Ağaçları
61
Çizelge 4.4. 3 faz akım ve sağ band için band geçiren filtre uygulanmış akım
verilerine göre karar ağaçlarının ürettiği sonuç değerleri
Correlation
Mean absolute
coefficient
error
M5 Rules
0.95
0.0039
Decision Table
0.97
0.03
Conjuctive Rule
0.85
0.34
RepTree
1
0
M5P- M4.0
1
0.0008
Decision Stump
0.82
0.40
Regression By Disc.
0.76
0.45
Bagging
0.87
0.38
Additive Regression
0.90
0.25
LWL
0.99
0.001
KStar
0.92
0.059
Ibk
0.94
0.0032
SMOreg
0.98
0.04
Simple Linear Reg.
0.98
0.04
RBF Network
0.85
0.25
Pace Regression
0.98
0.05
Multilayer Perceptron
0.94
0.002
Linear Regression
0.98
0.04
Functions
Lazy
Meta
Trees
Rules
Karar Ağaçları
62
Çizelge 4.5. 3 faz akım, sol ve sağ band için band geçiren filtre uygulanmış akım
verilerine göre karar ağaçlarının ürettiği sonuç değerleri
Correlation
Mean absolute
coefficient
error
M5 Rules
0.96
0.039
Decision Table
0.97
0.03
Conjuctive Rule
0.85
0.34
RepTree
1
0
M5P- M4.0
1
0.0008
Decision Stump
0.85
0.34
Regression By Disc.
0.76
0.45
Bagging
0.87
0.38
Additive Regression
0.90
0.25
LWL
0.99
0.001
KStar
0.95
0.04
Ibk
0.94
0.0032
SMOreg
0.98
0.04
Simple Linear Reg.
0.98
0.04
RBF Network
0.85
0.25
Pace Regression
0.98
0.05
Multilayer Perceptron
0.94
0.002
Linear Regression
0.98
0.04
Functions
Lazy
Meta
Trees
Rules
Karar Ağaçları
63
Çizelge 4.6. 3 faz akım ve gerilim ile sol ve sağ band için band geçiren filtre
uygulanmış akım verilerine göre karar ağaçlarının ürettiği sonuç değerleri
Correlation
Mean absolute
coefficient
error
M5 Rules
0.95
0.0039
Decision Table
0.97
0.03
Conjuctive Rule
0.85
0.34
RepTree
1
0
M5P- M4.0
1
0.0008
Decision Stump
0.85
0.34
Regression By Disc.
0.76
0.45
Bagging
0.87
0.38
Additive Regression
0.90
0.25
LWL
0.97
0.01
KStar
0.95
0.04
Ibk
0.94
0.0032
SMOreg
0.98
0.04
Simple Linear Reg.
0.98
0.04
RBF Network
0.85
0.25
Pace Regression
0.98
0.05
Multilayer Perceptron
0.94
0.002
Linear Regression
0.98
0.04
Functions
Lazy
Meta
Trees
Rules
Karar Ağaçları
Çizelge 4.1., Çizelge 4.2., Çizelge 4.3., Çizelge 4.4., Çizelge 4.5. ve Çizelge 4.6.
incelendiğinde üretilen değerlerin hepsinde birbirine çok yakın olduğu görülmüştür.
Yukarıdaki çizelgelere bakılarak 3 faz akım, 3 faz gerilim, band geçiren filtre
uygulanmış sol band 3 faz akım ve band geçiren filtre uygulanmış sağ band 3 faz
akım verilerine birlikte ve ayrı ayrı VM uygulanmıştır. Ama çıkan sonuçlar çok
benzer olduğundan dolayı sadece 3 faz akım verileriyle VM uygulaması yapmak
yeterlidir.
64
Karar ağaçlarından elde edilen değerlere göre RepTree ve M5P-M4.0 karar
ağaçlarında, korelasyon katsayısı 1 ve mutlak hata değeri 0 veya sıfıra çok yakın
değerler almıştır. Bunun için Reptree ve M5P-M4.0 karar ağaçlarının ürettiği kurallar
incelenmiştir.
Şekil 4.18. 3 faz akım verilerine göre RepTree karar ağacının otomatik olarak
oluşturduğu sınıflandırma modeli
Şekil 4.18.’de görülen RepTree karar ağacına 2700 satırlık veri girişi yapılmıştır ve
üretilen kurallar ise şöyledir;
•
Eğer ı_2 değeri 1.79’a eşit veya büyükse 1. durum,
(1. Kural)
•
Eğer ı_2 değeri 1.79’dan küçükse I1’e bakılır
(2. Kural)
o Eğer ı_1 değeri 1.96’ya eşit veya büyükse 2. durum,
(3. Kural)
o Eğer ı_1 değeri 1.96’dan küçükse 3. durum
(4. Kural)
meydana gelir. Burada ı_1 değeri 1. faz akımını ve ı_2 değeri 2. faz akımını
göstermektedir. 1. durum motorda hata olmadığını, 2. durum motor sargı spirleri
arasında kısa devre olduğunu ve 3. durum ise motorda mekanik dengesizlik hatasının
olduğunu göstermektedir.
65
Şekil 4.19. 3 faz akım verilerine göre RepTree karar ağacı algoritması sonucunun
ekran görüntüsü
Şekil 4.18.’e göre çıkarılan kurallar ayrıca, Şekil 4.19.’da da kırmızı renkte çerçeve
içine alınan bölümden de rahatlıkla çıkarılabilir. Kırmızı çerçeve içindeki bölüm 3
faz akım verilerine göre RepTree karar ağacının otomatik olarak oluşturduğu
kurallardır. Kırmızı çerçeve içindeki lacivert renkli çemberlerin içindeki sayısal
ifadeler (1, 2, 3) ise sırasıyla 1. durumu (sağlam motor), 2. durumu (sargı spirleri
arasında kısa devre hatası bulunan motoru) ve 3. durumu (milinde mekanik
dengesizlik hatası bulunan motoru) göstermektedir.
66
Çizelge 4.7. WEKA programına giriş olarak verilen 3 faz akım RMS verilerinden
rastgele seçilmiş örnek değerler
I1
I2
I3
Sonuç
1
1.9499
1.8453
1.8257
1.0
2
1.9341
1.8321
1.8517
1.0
3
1.8311
1.6824
2.1064
3.0
4
2.0636
1.7305
1.9948
2.0
5
2.07
1.731
1.9908
2.0
6
1.8223
1.6871
2.108
3.0
7
2.0731
1.7322
1.9851
2.0
8
1.9319
1.8344
1.8468
1.0
9
1.9341
1.8321
1.8517
1.0
10
1.8161
1.8008
2.1008
1.0
11
1.8479
1.7134
2.1436
3.0
12
1.8573
1.7031
2.1403
3.0
13
1.8658
1.6949
2.1277
3.0
14
1.9757
1.8311
1.8326
1.0
15
1.9336
1.827
1.8536
1.0
Çizelge 4.7.’deki 1.satırdaki değerlere bakıldığında I2 akımının değeri (1.8453)
1.79’dan büyük olduğu için sonucun 1.Kurala göre 1 nolu durumun çıkması gerekir,
sonuçta zaten 1’dir. (DOĞRU)
Çizelge 4.7.’deki 7. satırdaki değerlere bakıldığında I2 akımının değeri (1.7322)
1.79’dan küçük olduğu için I1 akımına bakılır (2.Kural), I1 akımının değeri (2.0731)
1.96’dan büyük olduğu için sonucun 3.Kurala göre 2. durumun çıkması gerekir,
zaten sonuçta 2’dir. (DOĞRU)
Çizelge 4.7.’deki 13. satırdaki değerlere bakıldığında ise I2 akımının değeri (1.6949)
1.79’dan küçük olduğu için I1 akımına bakılır (2.Kural), I1 akımının değeri (1.8658)
1.96’dan küçük olduğu için sonucun 3.Kurala göre 3. durumun çıkması gerekir, zaten
sonuçta 3’tür. (DOĞRU)
67
RepTree karar ağacının ürettiği kurallar WEKA programına giriş olarak verilen 3 faz
akım değerlerine uygulandığında geçerli olduğu görülmüştür. Yukarıdaki örnek
satırlar ile bu kuralların doğruluğu görülmektedir.
Şekil 4.20. 3 faz akım verilerine göre M5P-M4.0 karar ağacının otomatik olarak
oluşturduğu sınıflandırma modeli
Şekil 4.20.’de M5P-M4.0 karar ağacının otomatik olarak oluşturduğu sınıflandırma
modeline göre 3 durum oluşmaktadır. Oluşturulan bu sınıflandırma durumları LM 1,
LM 2 ve LM 3 olarak Şekil 4.20.’de görülmektedir. M5P-M4.0 karar ağacı sadece
1. faz akımını kullanarak bir sınıflandırma gerçekleştirmiştir.
68
Şekil 4.21. 3 faz akım verilerine göre M5P-M4.0 karar ağacı algoritması sonucunun
ekran görüntüsü
Şekil 4.20.’de M5P-M4.0 karar ağacının otomatik olarak oluşturduğu sınıflandırma
modelindeki kurallar ayrıca, Şekil 4.21.’de verilen M5P-M4.0 karar ağacı algoritması
sonucunun
ekran
görüntüsündeki
kırmızı
çerçeve
içindeki
bölümde
de
görülebilmektedir. Lacivert çerçeve içindeki ifadeler (LM 1, LM 2, LM 3)’de
sınıflandırma durumlarını göstermektedir.
M5P-M4.0 karar ağacından elde edilen sınıflandırma modeli ile kullanıcı direkt
olarak sağlam ve hatalı motorları birbirinden ayırt edememektedir. Çünkü M5P-M4.0
karar ağacının ürettiği sınıflandırma modelinde, sınıflandırma işlemi için aşağıdaki
denklemler otomatik olarak elde edilmiştir;
•
LM 1 durumu: sonuc = -0.0727 * I1 + 3.1253
•
LM 2 durumu: sonuc = 0.1011 * I1 + 0.8117
69
LM 3 durumu: sonuc = 0.1011 * I1 + 1.7872
•
Otomatik olarak M5P-M4.0 karar ağacının ürettiği bu kurallarda 1. faz akımı (I1)
ayrıca üretilen katsayılarla çarpılarak ve toplanarak sınıflandırma yapılıyor.
Çizelge 4.8. WEKA programına giriş olarak verilen 3 faz akımdan rastgele seçilmiş
1. faz akımına M5P-M4.0 karar ağacından elde edilen katsayıların uygulanması ve
elde edilen sonuçlar
I1
LM 1
LM 2
LM 3
Sonuç
1
1.9499
2.98
1.01
1.98
1
2
1.9341
2.98
1.01
1.98
1
3
1.8311
2.99
1.00
1.97
3
4
2.0636
2.98
1.02
2.00
2
5
2.07
2.97
1.02
2.00
2
6
1.8223
2.99
1.00
1.97
3
7
2.0731
2.97
1.02
2.00
2
8
1.9319
2.98
1.01
1.98
1
9
1.9341
2.98
1.01
1.98
1
10
1.9406
2.98
1.01
1.98
1
11
1.8479
2.99
1.00
1.97
3
12
1.8573
2.99
1.00
1.97
3
13
1.8658
2.99
1.00
1.98
3
14
1.9757
2.98
1.01
1.99
1
15
1.9336
2.98
1.01
1.98
1
Çizelge 4.8.’de 1.faz akımına M5P-M4.0 karar ağacından elde edilen katsayı
değerleri uygulandığında elde edilen sonuçlar görülmektedir. Çizelge 4.8.’de 3., 6.,
11., 12. ve 13. satırdaki LM 1 sütunundaki değerlerin aynı (2.99) olduğu ve sonuç
sütununda ise bu satırlara karşılık 3 nolu sonuç değerinin olduğu görülmektedir. Yani
M5P-M4.0 karar ağacından elde edilen LM 1 durumu motorun 3 nolu (Mekanik
dengesizlik hatası) durumunu ifade etmektedir.
70
Aynı çizelgede 1., 2., 8., 9., 10., 14. ve 15. satırlardaki LM 2 sütunundaki değerlerin
1.01 olduğu ve sonuç sütunundaki değerin ise 1 olduğu görülmektedir. Buna göre
M5P-M4.0 karar ağacından elde edilen LM 2 durumu motorun 1 nolu (sağlam)
durumunu ifade etmektedir.
Çizelge 4.8.’de 4., 5. ve 7. satırlardaki LM 3 sütunundaki değerlerin aynı (2.00)
olduğu ve sonuç sütunundaki değerin ise 2 olduğu görülmektedir. Buna göre M5PM4.0 karar ağacından elde edilen LM 3 durumu motorun 2 nolu (sargı spirleri
arasında kısa devre hatası) durumunu ifade etmektedir.
Elde edilen bu sınıflandırma kurallarının geçerliliği Çizelge 4.8.‘deki verilerle test
edildiğinde M5P-M4.0 karar ağacının da iyi bir sınıflandırma yaptığı görülmektedir.
Ama kullanıcı oluşturulan LM 1, LM 2 ve LM 3 durumlarının sağlam motorumu
yoksa hatalı motor durumlarını mı ifade ettiğini tam olarak bulamamaktadır. Ayrıca
kullanıcı otomatik olarak üretilen katsayı değerlerini 1. faz akımı ile çarpmak ve
toplamak zorundadır. Buradan elde edilecek sonuçlar ayrıca incelenecek ve bu
değerlere göre sağlam ve hatalı durumlar ancak birbirinden ayrıştırılabilecektir.
Ama RepTree karar ağacından elde edilen kurallarda ise hiç hesaplama yapmadan
sadece akım değerlerine bakılarak sağlam ve hatalı durumlar birbirinden kolayca
ayırt edilebilmekteydi. RepTree ve M5P-M4.0 karar ağaçları iyi bir sınıflandırma
yapmalarına rağmen RepTree karar ağacının ürettiği kurallar kolay anlaşılabilir ve
ekstra hesaplama işlemleri gerektirmemektedir. Böylece RepTree karar ağacının
daha kullanışlı olduğu görülmektedir.
Daha az veri ile VM’nin amacı, online durum izleme için az veri ile karar verme,
kısa işlem süresi veya örnekleme zamanı için tercih edilebilir. Bu yüzden 2700 veri
ile elde edilen sonuçların daha az veri ile yine aynı durumu sağlayıp sağlamadığını
kontrol etmek için VM’ne uygulanan giriş verileri azaltıldığı zaman şu sonuçlara
ulaşılmıştır.
71
Şekil 4.22. 3 faz akım verilerine göre RepTree karar ağacının otomatik olarak
oluşturduğu sınıflandırma modeli (1800 veri)
Şekil 4.22.’de RepTree karar ağacına giriş olarak 1800 satırlık 3 faz akım verisi
uygulanmıştır. Elde edilen karar ağacı Şekil 4.18’de ki giriş olarak 2700 satırlık 3 faz
akım verisi uygulanmış karar ağacı ile aynı sonucu vermiştir.
Şekil 4.23. 3 faz akım verilerine göre RepTree karar ağacının otomatik olarak
oluşturduğu sınıflandırma modeli (900 veri)
Şekil 4.23.’de RepTree karar ağacına giriş olarak sadece 900 satırlık 3 faz akım
verisi uygulanmıştır. Şekil 4.18. (2700 veri) ve Şekil 4.22. (1800 veri)’deki karar
ağaçlarında bulunan kurallardan tek fark ise sadece 1. faz akımının ayırt edici değeri
olan 1.96’nın 1.95 olarak değişmesidir.
72
Şekil 4.24. 3 faz akım verilerine göre RepTree karar ağacının otomatik olarak
oluşturduğu sınıflandırma modeli (450 veri)
Şekil 4.24.’de RepTree karar ağacının sadece 450 adet 3 faz akım giriş verisine göre
otomatik olarak oluşturduğu kurallar görülmektedir. Giriş veri sayısı %50 azaltıldığı
halde Şekil 4.23.’de ki kurallar ile Şekil 4.24.’de ki kurallar aynıdır.
Şekil 4.25. 3 faz akım verilerine göre RepTree karar ağacının otomatik olarak
oluşturduğu sınıflandırma modeli (225 veri)
Şekil 4.25.’de RepTree karar ağacı algoritmasına sadece 225 adet 3 faz akım verisi
girdi olarak verilmiş ve bunun sonucunda otomatik olarak üretilen kurallar
görülmektedir. Burada diğer RepTree karar ağacı algoritmalarının sonucundan farklı
olarak sadece 1. faz akımı ile sınıflandırma yapıldığı görülmektedir.
73
Şekil 4.25.’de görülen RepTree karar ağacına 225 satırlık veri girişi yapılmıştır ve
üretilen kurallar ise şöyledir;
•
Eğer ı_1 değeri 1.9’dan küçükse 3. durum,
(1. Kural)
•
Eğer ı_1 değeri 1.9’a eşit veya büyükse tekrar I1’e bakılır
(2. Kural)
o Eğer ı_1 değeri 2.01’e eşit veya büyükse 2. durum,
(3. Kural)
o Eğer ı_1 değeri 2.01’den küçükse 1. durum
(4. Kural)
meydana gelir. Burada ı_1 değeri 1. faz akımını göstermektedir. 1.durum motorda
hata olmadığını, 2. durum motorun spirleri arasında kısa devre hatasının olduğunu ve
3. durum ise motor milinde mekanik dengesizlik hatasının olduğunu göstermektedir.
Çizelge 4.9. WEKA programına giriş olarak verilen 3 faz akım RMS verilerinden
sadece 1. faz akımı için rastgele seçilmiş örnek değerler
I1
Sonuç
1
1.9499
1.0
2
1.9341
1.0
3
1.8311
3.0
4
2.0636
2.0
5
2.07
2.0
6
1.8223
3.0
7
2.0731
2.0
8
1.9319
1.0
9
1.9341
1.0
10
1.9261
1.0
11
1.8479
3.0
12
1.8573
3.0
13
1.8658
3.0
14
1.9757
1.0
15
1.9336
1.0
Çizelge 4.9.’da WEKA programına giriş olarak verilen 3 faz akım RMS verilerinden
sadece 1. faz akımı için rastgele seçilmiş örnek değerler görülmektedir.
74
Çizelge 4.9.’da 3.satırdaki I1 sütunundaki değere bakıldığında I1 akımının değeri
(1.8311) 1.9’dan küçük olduğu için sonucun 1.Kurala göre 3 nolu durumun çıkması
gerekir, sonuçta zaten 3’tür. (DOĞRU)
Çizelge 4.9.’da 7.satırdaki I1 sütunundaki değere bakıldığında I1 akımının değeri
(2.0731) 1.9’dan büyük olduğu için sonucun 2.Kurala göre tekrar I1 akımının değeri
kontrol edilir. I1 akımının değeri (2.0731) 2.01’den büyük olduğu için 3.Kurala göre
2 nolu durumun çıkması gerekir, sonuçta zaten 2’dir. (DOĞRU)
Çizelge 4.9.’da 14.satırdaki I1 sütunundaki değere bakıldığında I1 akımının değeri
(1.9757) 1.9’dan büyük olduğu için sonucun 2.Kurala göre tekrar I1 akımının değeri
kontrol edilir. I1 akımının değeri (1.9757) 2.01’den küçük olduğu için 4.Kurala göre
1 nolu durumun çıkması gerekir, sonuçta zaten 1’dir. (DOĞRU)
Çizelge 4.9.’da verilen diğer değerlerde kontrol edilirse hepsinde de doğru çıktığı
görülmektedir. Bu da RepTree karar ağacının sadece 1. faz akımına göre yaptığı
sınıflandırmanın doğru olduğunu göstermektedir. Artık sadece 1. faz akımına
bakılarak motorun sağlam veya hatalı olduğu ve hatalı ise hangi hatanın olduğu tespit
edilebilmektedir.
Şekil 4.26. 3 faz akım verilerine göre RepTree karar ağacının otomatik olarak
oluşturduğu sınıflandırma modeli (150 veri)
Sadece 150 adet 3 faz akım verisi kullanılarak RepTree karar ağacı algoritmasının
ürettiği sınıflandırma modeli Şekil 4.26.’da görülmektedir. Şekil 4.25.’de ve Şekil
75
4.26’da elde edilen sınıflandırma modelleri aynı olduğu için üretilen kurallarda
aynıdır. Böylece Şekil 4.25.’deki kural yapısında geçerli olan kuralların daha az veri
girişi ile de elde edilebildiği görülmektedir.
Şekil 4.27. 3 faz akım verilerine göre RepTree karar ağacının otomatik olarak
oluşturduğu sınıflandırma modeli (75 veri)
Şekil 4.27.’de 75 adet 3 faz akım verisi kullanılarak RepTree karar ağacı
algoritmasının ürettiği sınıflandırma modeli görülmektedir. Şekil 4.25., Şekil 4.26 ve
Şekil 4.27.’den elde edilen sınıflandırma modelleri aynı olduğu için üretilen
kurallarda aynıdır. Böylece Şekil 4.25.’deki kural yapısında geçerli olan kuralların
daha az veri girişi ile de elde edilebildiği görülmektedir.
RepTree karar ağacı algoritmasına en az 75 adet 3 faz akım verisi girdi olarak
verildiğinde sadece 1. faz akımına göre sağlam, hatalı motor ve hatalı motor
durumlarının birbirinden ayırt edilebildiği kurallar otomatik olarak oluşturuluyor. Bu
kurallara göre kullanıcı sadece 1. faz akımına bakarak;
•
motor sağlam,
•
sargı spirleri arasında kısa devre hatası var,
•
motor milinde dengesizlik hatası var.
sonuçlarına ulaşabilir.
76
5. SONUÇ
Asenkron
motorlar
değişik
endüstriyel
uygulamalarda
yaygın
olarak
kullanılmaktadır. Bu motorlar sağlam yapıda olmalarına rağmen elverişsiz ortamlara
maruz kalmalarından dolayı hatalar oluşmaktadır. Başlangıç seviyesindeki hatalar
erken bir safhada tespit edilemezse, hem kendisi hem de sistemin çalışması zarar
görebilir ve üretim kayıplarına neden olabilir. Son yirmi yılda çalışılan en önemli
alan motorun performans karakteristikleri ve asenkron motor hatalarının tespiti ve
analizi olmuştur.
Asenkron motorlarda hata tespiti için değişik yöntemler kullanılmaktadır. Parametre
tahmini ve diğer model tabanlı teknikler sistemin matematiksel modeline
dayandığından, motor belli bir süre sonra aşındığından bu modeller motorun
durumunu tam olarak ifade etmeyebilir. Hata tespiti için kullanılan diğer bir yöntem
ise makine veya motorun bir eleman tarafından sürekli gözlemlenmesidir. Burada
sistemin matematiksel modeli bilinmeden gözlem yoluyla hata tespiti yapılabilir.
Fakat böyle bir yöntem hem zaman alıcı hem de pahalıdır. Akıllı bir hata tespiti için
yumuşak hesaplama ve işaret işleme tabanlı yöntemlerde literatürde yoğun olarak
kullanılmaya başlanmıştır. Tezde asenkron motorlarda hata tespiti için literatürdeki
tekniklerden farklı olarak yeni bir alan olan VM tekniği kullanılmıştır.
Veri hacmi arttıkça bunların işlenmesi ve istenilen bilgilere ulaşmak oldukça
güçleşecektir. VM burada devreye girer; VM büyük miktarda veri içinden gelecekle
ilgili tahmin yapmamızı sağlayacak bağıntı ve kuralların aranmasıdır. Yani, VM
büyük miktarlardaki verinin içinden anlamlı ve yararlı ilişki ve kuralların bilgisayar
programları aracılığıyla aranması ve analizidir. VM’nde ne kadar çok veri
kullanılırsa, sistemin tüm sürecini kapsayacak veri kümesi ile daha geçerli kurallar
çıkarılabilir.
Bu amaçla piyasada birçok VM yazılımı mevcuttur. Tezde, Java dili kullanılarak
geliştirilmiş, içinde birçok öğrenme algoritması bulunan, tüm işletim sistemlerinde
çalışabilen açık kaynak kodlu WEKA VM yazılımı kullanılmıştır.
77
Tezde, üç fazlı bir asenkron motorun sargı spirleri arasında oluşabilecek kısa devre
veya yalıtım bozuklukları ile motor milinde oluşabilecek mekanik dengesizlik
hataları, üç faz akım ve gerilim bilgilerinin RMS değerlerindeki değişim, VM ile
izlenerek tespit edilmiştir.
Motor faz akım spektrumunda yan band olarak görülen bileşenlerin genlik değişimi
bir band geçiren filtre ile izlenmiştir. Filtre belirli frekans aralığını geçirip ilgili
bileşenin dışındaki tüm genlik değerlerini söndürdüğü için VM ile hata tespitinde
geçerli sonuç alınamamıştır. Bu yüzden spektrum analizi sadece mekanik
dengesizliğinin tespitinde sonuç verirken VM ile her iki hata durumu da tespit
edilebilmektedir.
VM tekniklerinden biri olan sınıflandırma tekniği, verinin önceden belirlenen
çıktılara uygun olarak ayrıştırılmasını sağlayan bir tekniktir. Çıktılar, önceden
bilindiği için sınıflama, veri kümesini denetimli olarak öğrenir. Temel sınıflandırma
tekniklerinden biri olan karar ağaçları da; verileri belli nitelik değerlerine göre
sınıflandırmaya yarar. WEKA yazılımında birçok karar ağacı algoritması
bulunmaktadır. Hazırlanan veri paketleri WEKA’daki karar ağaçları ile analiz
edilmiştir. En iyi sonucu RepTree ve M5P-M4.0 karar ağaçları vermiştir. M5P-M4.0
karar ağacı çok iyi bir sınıflama yapmasına rağmen kullanıcıyı tam olarak
bilgilendirmemektedir. Ancak RepTree karar ağacından elde edilen kurallar ile
kullanıcı elindeki verilere bakarak, motor hatalarının tespitini ve sınıflandırmasını
yapabilmektedir. Ayrıca kullanıcı bu karara sadece tek bir faz akımı ve belli bir
miktardaki veriye bakarak varabilmektedir.
Hem sargı spirleri arasında kısa devre hem de mekanik dengesizlik gibi aynı anda
motorda birden fazla hata varsa, bu gibi durumlarda VM’ne bilgiler girilirken,
gerekli hata kodlama işlemi yapılır ve bu gibi durumlardaki hatalarda tespit
edilebilir.
VM ile durum izleme sisteminin avantajları;
•
motor ait ön bilgi gerektirmez,
78
•
Matematiksel modelleme gibi karmaşık hesaplama gerektiren işlemlere
ihtiyaç duyulmaz,
•
Ayrıca hata sınıflandırmasında kullanılmak üzere belli bir eşik değeri
tespit edilmesini sağlar.
Bu yüzden VM klasik yöntemlerin önüne geçmiştir. Bu avantajlardan yararlanarak,
frekans düzlemindeki genlik değerleri her bir şart için VM sürecine verilerek,
izlenecek parametrenin genlik eşik değerleri tespit edilebilir. RMS’deki artışın
hatadan mı, yoksa motor yük değişiminden veya diğer sebeplerden mi olduğunu ayırt
edebilmek için motor hızı veya şebeke gerilimi RMS değerleri gibi ilave sinyallerde
kontrol edilmelidir.
Tezde kullanılan VM yaklaşımı ile asenkron motorlarda hata tespiti için yeni bir
çözüm sunulmaktadır. Ancak, temel niteliğindeki bu çalışma farklı güç ve farklı
marka motorlardan alınan verilerle test edilmelidir. Yine asenkron motorların diğer
hatalarının da VM ile çözümünün yapılabilirliği araştırılmalıdır. Gelecek
çalışmalarda VM’den elde edilen algoritmaların DSP sürücülerine entegre
edilebilirliği araştırılabilir.
79
6. KAYNAKLAR
Akbulut, S., 2006. Veri Madenciliği Teknikleri ile Bir Kozmetik Markanın Ayrılan
Müşteri Analizi ve Müşteri Segmentasyonu. G.Ü. Fen Bilimleri Enstitüsü,
Yüksek Lisans Tezi, 91s, Ankara.
Akpınar, H., 2000. Veri Tabanlarında Bilgi Keşfi ve Veri Madenciliği. http://www - .
isletme.istanbul.edu.tr/dergi/nisan2000/1.htm Erişim Tarihi: 20.04.2007
Alpaydın, E., 2000. Zeki Veri Madenciliği:
Ulaşma
Yöntemleri,
Ham
Veriden
Altın
Bilgiye
www.cmpe.boun.edu.tr/~ethem/files/papers/veri-
maden_2k- notlar.doc Erişim Tarihi: 11.05.2007.
Aryeetey, K., 2003. Data Analysis and Predictive Modelling Using The Variable
Precision Rough Set Approach. M. Sc. Thesis, Faculty of Graduate Study
and Research of University of Regina, 87p, Canada.
Ayaz, E., Şeker, S., 2002. İleri İşaret İşleme Yöntemleri ile Elektrik Motorlarında
Rulman Arıza Tanısı. İTÜ Dergisi/d, 1 (1), 23-34.
Aydın, İ., Karaköse, M., Akın, E., 2005. Asenkron Motorlarda Hata Teşhisi için
Yeni Bir Yumuşak Hesaplama Yaklaşımı. Otomatik Kontrol Ulusal
Toplantısı, TOK’05, 375-380.
Aydın, İ., Karaköse, M., Akın, E., 2005. Zaman Serileri Veri Madenciliği Tekniği
Kullanılarak Asenkron Motorlarda Sarım ve Sürtünme Hatalarının Teşhisi.
11. Elektrik Elektronik Bilgisayar Mühendisliği Ulusal Kongresi, 124-127.
Aydın, İ., Karaköse, M., Akın, E., 2006. Asenkron Motorlarda Arıza Teşhisi için
Zaman Serileri Veri Madenciliği ve Yapay Sinir Ağı Tekniklerinin
Kullanımı. Otomatik Kontrol Ulusal Toplantısı, TOK’06, 153-158.
80
Aydoğan, F., 2003. E-Ticarette Veri Madenciliği Yaklaşımlarıyla Müşteriye Hizmet
Sunan Akıllı Modüllerin Tasarımı ve Gerçekleştirimi. H.Ü. Fen Bilimleri
Enstitüsü, Yüksek Lisans Tezi, 179s, Ankara.
Bae, H., Kim, S., Kim, Y., Lee, S, 2005. Application of Time-Series Data Mining for
Fault Diagnosis of Induction Motors. Springer-Verlag Berlin Heildberger,
1085-1094.
Bangura, J., Povinelli, R., Demerdash, N., Brown, R., 2003. Diagnostics of
Eccentricities and Bar/End-Ring Connector Breakages in Polyphase
Induction Motors Through a Combination of Time-Series Data Mining and
Time-Stepping Coupled FE–State-Space Techniques. IEEE Transactions on
Industry Applications, 39 (4), 1005-1013.
Bland, C., 2002. The Discovery of Multiple Level Profile Association Rules. Ph. D.
Thesis, Graduate School of Computer and Information Science of University
of Missisipi, 123p, Missisipi.
Çeştepe, E., Eren, A., 2005. Dedektif Multimetre Arıza Erken Uyarı Sistemlerinde
Uygulanabilecek En Kolay ve En Ekonomik Çözüm. 3E Dergisi, 128, 24-27.
Frawley, W. J., Piatetsky-Shapiro, G., Matheus, C. J., 1991. Knowledge Discovery
D atabases: An Overview, in Knowledge Discovery in Databases.
Cambridge, MA: AAAI/M1T, 1-27.
Gao, X., S. Ovaska. 2001. Soft Computing Methods in Motor Fault Diagnosis.
Applied Soft Computing, 1, 73-81.
Hair, J., Ronald, L., Rolph, E., Black, W., 1998. Multivariate Data Analysis. New
Jersey: Prentice Hall.
81
Huberty, C., 1994. Applied Discriminant Analysis. John Wiley & Sons Inc., Canada,
25-35.
Hudairy, H., 2004. Data Mining and Decision Making Support in The Governmental
Sector. M. Sc. Thesis, Faculty of Graduate School of The University of
Louisville, 100p, Kentucky.
Hui, S., Jha, G., 2000. Application Data Mining for Customer Service Support.
Information and Management, 38, 1-13.
Kalıkov, A., 2006. Veri Madenciliği ve Bir E-Ticaret Uygulaması. G.Ü. Fen
Bilimleri Enstitüsü, Yüksek Lisans Tezi, 94s, Ankara.
Kowalski, C., Kowalska, T., 2003. Neural Networks Application for Induction Motor
Faults Diagnosis. Mathematics and Computers in Simulation, 63, 435–448.
Nandi, S., Toliyat, H., Li,X., 2005. Condition Monitoring and Fault Diagnosis of
Electrical Motors. IEEE Transactions on Energy Conversion, 20 (4), 719-729.
Nath, S., 2003. Data Warehousing and Mining: Customer Churn Analysis in the
wireless Industry. M. Sc. Thesis, Florida Atlantic University, 68p, Boca
Raton, Florida.
Oğuzlar, A., 2003. Veri Önişleme. Erciyes Üniversitesi İktisadi ve İdari Bilimler
Fakültesi Dergisi, 21, 67-76.
Pawlak, Z., 2002. Rough Sets, Decision Algorithms and Bayes Theorem. Europen
Journal of Operation Research, 136, 181-189.
82
Povinelli, R., Bangura, J.,Demerdash, N., Brown, R.,2002. Diagnostics of Bar and
End-Ring Connector Breakage Faults in Polyphase Induction Motors
Through a Novel Dual Track of Time-Series Data Mining and Time-Stepping
Coupled FE-State Space Modeling. IEEE Transactions on Energy
Conversion, 17 (1), 39-46.
Shah. S., Kursak. A., 2004. Data Mining and Genetic Algorithms Based Gene / SNP
Selection. Artificial Intelligence in Medicine, 31, 183 -196.
Shearer, C., 2000. The Crisp-DM Model: The New Blueprint for Data Mining.
Journal of Data Warehousing, 5 (4), 13-23.
Wei, C., Chiu T., 2002. Turning Telecommunications Call Details to Churn
Prediction: A Data Mining Approach. Expert Systems with Applications, 23,
93-102.
Witten I., Frank E., 2000. Data Mining: Practical Machine Learning Tools and
Techniques With Java Implementations. Morgan Kaufmann Publishers, San
Fransisco, 120-129, 267-277.
Zhang, L., Jack, L., Nandi, A., 2005. Fault Detection Using Genetic Programming.
Mechanical Systems and Signal Processing, 19, 271–289.
83
EK-1
WEKA programına giriş olarak verilen .arff dosyasının içeriği.
% Created by Cahit Arf at 18 Nis 2007 13:30:08
@RELATION noname
@ATTRIBUTE v_1 real
@ATTRIBUTE v_2 real
@ATTRIBUTE v_3 real
@ATTRIBUTE ı_1 real
@ATTRIBUTE ı_2 real
@ATTRIBUTE ı_3 real
@ATTRIBUTE sonuc real
@DATA
217.5731,221.5576,223.5613,1.9757,1.8311,1.8326,1.0
217.6274,221.0508,223.9795,1.9723,1.8332,1.8272,1.0
217.7997,220.4641,224.3251,1.9689,1.8391,1.8264,1.0
218.0769,219.9271,224.4891,1.9611,1.8409,1.8233,1.0
218.5142,219.427,224.6064,1.9571,1.8451,1.8259,1.0
218.9925,218.9756,224.5166,1.9499,1.8453,1.8257,1.0
219.554,218.6104,224.3348,1.946,1.8472,1.8306,1.0
220.1177,218.3508,224.0108,1.9406,1.8448,1.8321,1.0
220.6191,218.2279,223.5553,1.9373,1.8441,1.8363,1.0
221.0814,218.2519,223.0381,1.9347,1.8415,1.8384,1.0
221.4678,218.4402,222.4567,1.9349,1.8402,1.8443,1.0
221.734,218.7459,221.9115,1.9319,1.8344,1.8468,1.0
221.8663,219.1553,221.4081,1.9341,1.8321,1.8517,1.0
221.8666,219.6116,220.9599,1.9336,1.827,1.8536,1.0
221.7361,220.104,220.6171,1.9382,1.8247,1.8595,1.0
221.4394,220.6523,220.3218,1.9406,1.8205,1.8621,1.0
.
.
.
.
221.6162,219.5433,221.104,2.0415,1.7465,1.9944,2.0
221.5222,220.0388,220.7683,2.0442,1.7419,1.9969,2.0
221.2424,220.6336,220.4772,2.0491,1.7395,2.0011,2.0
220.7324,221.2282,220.3383,2.0532,1.7348,1.9996,2.0
220.1463,221.6926,220.4362,2.0595,1.7336,1.9997,2.0
219.5802,222.0542,220.734,2.0636,1.7305,1.9948,2.0
219.0303,222.3368,221.0477,2.07,1.731,1.9908,2.0
218.4202,222.5204,221.4797,2.0731,1.7322,1.9851,2.0
217.8681,222.4612,222.0391,2.078,1.736,1.9809,2.0
217.5595,222.3035,222.7031,2.0794,1.7396,1.9743,2.0
84
217.3544,222.0067,223.3116,2.083,1.7457,1.9713,2.0
217.18,221.5412,223.9053,2.0792,1.7493,1.9648,2.0
217.2205,220.8884,224.4014,2.0757,1.7549,1.962,2.0
217.4268,220.2323,224.7593,2.0677,1.7575,1.9579,2.0
217.8024,219.6937,224.9432,2.0628,1.7628,1.9591,2.0
218.1762,219.1413,225.0124,2.0549,1.7635,1.9581,2.0
218.7126,218.6204,224.9513,2.0498,1.7658,1.9622,2.0
219.3597,218.266,224.6769,2.0438,1.7652,1.9647,2.0
219.9597,218.0793,224.3179,2.0407,1.7649,1.9695,2.0
220.45,217.9761,223.8578,2.0371,1.7613,1.9722,2.0
220.949,217.9908,223.2915,2.036,1.7599,1.9776,2.0
221.3415,218.2871,222.6476,2.0351,1.7554,1.9804,2.0
221.5507,218.7068,222.0055,2.0377,1.7524,1.9863,2.0
221.5827,219.1814,221.525,2.0386,1.7474,1.9898,2.0
221.4804,220.245,220.6716,2.0464,1.7398,1.9972,2.0
221.0552,220.863,220.4424,2.0527,1.7384,2.0007,2.0
220.5766,221.3988,220.4075,2.0572,1.7349,1.9992,2.0
220.0296,221.8139,220.5276,2.0629,1.7336,1.9981,2.0
219.4209,222.2233,220.6648,2.0668,1.7306,1.9935,2.0
218.7404,222.4568,221.0348,2.0716,1.7319,1.9891,2.0
218.2221,222.524,221.5526,2.0763,1.7332,1.9826,2.0
217.823,222.5019,222.1404,2.0791,1.7381,1.9782,2.0
217.4783,222.2738,222.7225,2.0809,1.7415,1.9722,2.0
.
.
.
.
.
220.0651,214.3002,228.4867,1.8181,1.6987,2.0641,3.0
220.7068,214.0496,228.2559,1.8381,1.7348,2.1072,3.0
221.2984,213.8349,227.8658,1.811,1.6993,2.0717,3.0
221.7459,213.7593,227.2815,1.8339,1.7337,2.117,3.0
222.1963,213.8841,226.749,1.8083,1.6981,2.08,3.0
222.5378,214.2808,226.1417,1.8336,1.7287,2.1264,3.0
222.6653,214.6974,225.598,1.8116,1.6947,2.0918,3.0
222.6144,215.1459,225.0962,1.8394,1.7211,2.1365,3.0
222.5404,215.6683,224.6651,1.8161,1.6908,2.1008,3.0
222.282,216.3035,224.386,1.8479,1.7134,2.1436,3.0
221.7975,216.8366,224.1733,1.8223,1.6871,2.108,3.0
220.6868,217.7849,224.3503,1.8311,1.6824,2.1064,3.0
220.0563,218.1936,224.6839,1.8658,1.6949,2.1277,3.0
219.3962,218.3195,225.0848,1.838,1.6786,2.0987,3.0
218.9093,218.3027,225.5948,1.8711,1.6949,2.1101,3.0
218.5402,218.2216,226.2154,1.8437,1.6801,2.0894,3.0
218.2364,217.9797,226.8824,1.8727,1.702,2.0949,3.0
218.0113,217.4345,227.4259,1.8464,1.686,2.0816,3.0
218.0441,216.8722,227.8833,1.863,1.7104,2.081,3.0
218.2579,216.3335,228.3875,1.8427,1.6935,2.0763,3.0
85
ÖZGEÇMİŞ
Adı Soyadı
: Kıyas KAYAALP
Doğum Yeri ve Yılı : Isparta, 1976
Medeni Hali
: Evli
Yabancı Dili
: İngilizce
Eğitim Durumu (Kurum ve Yıl)
Lise
: Isparta Teknik Lisesi, 1994
Lisans
: Marmara Üniversitesi Teknik Eğitim Fakültesi, Elektronik
Bilgisayar Eğitimi, 1999
Çalıştığı Kurum/Kurumlar ve Yıl
1999-2000
Isparta Anadolu Teknik, Teknik ve Endüstri Meslek Lisesi, Bilgisayar
Öğretmeni
2000-2001
Isparta Anadolu Teknik, Teknik ve Endüstri Meslek Lisesi, Bilgisayar
Bölümü Şefi
2001-
Süleyman Demirel Üniversitesi, Uluborlu Selahattin Karasoy Meslek
Yüksekokulu Öğretim Görevlisi
86
Download