düşük karmaşıklıklı öznitelikler kullanılarak solunum sesi içerisindeki

advertisement
DÜŞÜK KARMAŞIKLIKLI ÖZNİTELİKLER
KULLANILARAK SOLUNUM SESİ İÇERİSİNDEKİ
KALP SESLERİNİN YERLERİNİN OLASILIKSAL
MODELLEME İLE KESTİRİMİ
Hamed SHAMSI
Doktora Tezi
Elektrik ve Elektronik Mühendisliği Anabilim Dalı
Haberleşme Bilim Dalı
Yrd. Doç. Dr. İ. Yücel ÖZBEK
2015
Her hakkı saklıdır
ATATÜRK ÜNİVERSİTESİ
FEN BİLİMLERİ ENSTİTÜSÜ
DOKTORA TEZİ
DÜŞÜK KARMAŞIKLIKLI ÖZNİTELİKLER KULLANILARAK
SOLUNUM SESİ İÇERİSİNDEKİ KALP SESLERİNİN
YERLERİNİN OLASILIKSAL MODELLEME İLE KESTİRİMİ
Hamed SHAMSI
ELEKTRİK ve ELEKTRONİK MÜHENDİSLİĞİ ANABİLİM DALI
Haberleşme Bilim Dalı
ERZURUM
2015
Her hakkı saklıdır
T.C.
ATATÜRK ÜNİVERSİTESİ
FEN BİLİMLERİ ENSTİTÜSÜ
TEZ ONAY FORMU
DÜŞÜK KARMAŞIKLIKLI ÖZNİTELİKLER KULLANILARAK SOLUNUM
SESİ İÇERİSİNDEKİ KALP SESLERİNİN YERLERİNİN OLASILIKSAL
MODELLEME İLE KESTİRİMİ
Yrd. Doç. Dr. İ. Yücel ÖZBEK danışmanlığında, Hamed SHAMSI tarafından
hazırlanan bu çalışma 08/01/2015 tarihinde aşağıdaki jüri tarafından Elektrik ve
Elektronik Mühendisliği Anabilim Dalı - Haberleşme Bilim Dalı’nda Doktora tezi
olarak oybirliği ile kabul edilmiştir.
Başkan : Doç. Dr. Uğur Cem HASAR
İmza
:
Üye
:Yrd. Doç Dr. İ. Yücel ÖZBEK
İmza
:
Üye
: Yrd. Doç Dr. Emin Argun ORAL
İmza
:
Üye
: Yrd. Doç Dr. Tolga AYDIN
İmza
:
Üye
: Yrd. Doç Dr. Bülent ÇAVUŞOĞLU
İmza
:
Yukarıdaki sonuç;
Enstitü Yönetim Kurulu ........./......../…….. tarih ve . . . . . ./ . . . . . . . . . . . . . . nolu
kararı ile onaylanmıştır.
Prof. Dr. İhsan EFEOĞLU
Enstitü Müdürü
Not: Bu tezde kullanılan özgün ve başka kaynaklardan yapılan bildirişlerin, çizelge, şekil ve fotoğrafların kaynak
olarak kullanımı, 5846 sayılı Fikir ve Sanat Eserleri Kanunundaki hükümlere tabidir.
ÖZET
Doktora Tezi
DÜŞÜK KARMAŞIKLIKLI ÖZNİTELİKLER KULLANILARAK SOLUNUM
SESİ İÇERİSİNDEKİ KALP SESLERİNİN YERLERİNİN OLASILIKSAL
MODELLEME İLE KESTİRİMİ
Hamed SHASMI
Atatürk Üniversitesi
Fen Bilimleri Enstitüsü
Elektrik-Elektronik Mühendisliği Anabilim Dalı
Haberleşme Bilim Dalı
Danışman: Yrd. Doç. Dr. İ. Yücel ÖZBEK
Bilgisayar yardımı ile kalp seslerinin yerlerinin ortam gürültüsü veya akciğer sesleri
içerisinde tespit edilmesi kalp ve akciğer sesi sinyallerinin işlenmesi uygulamalarında
en temel adımlardan biridir. Bu tezin temel amacı solunum sesi içerisindeki kalp
seslerinin yerlerini bulmaktadır. Bu amaç doğrultusunda tez üç bölümden oluşmaktadır.
Tezin ilk bölümünde kalp seslerinin yerlerini bulmak için entropi sınırına dayalı yeni bir
öznitelik önerilmektedir. Önerilen özniteliğin kalp seslerinin yerlerini bulmada oldukça
başarılı olduğu ve işlem yükü açısından oldukça düşük işlem yüküne sahip olduğu
gösterilmiştir. Bu tezin ikinci bölümünde kalp seslerinin sınırlarını bulmak için öğrenme
kabiliyeti olan ve bulanık c-ortalama (FCM) algoritmasına dayalı yeni bir algoritma
önerilmektedir. Bu algoritma zamansal bulanık c-ortalama (TFCM) olarak
adlandırılmaktadır. TFCM algoritması herhangi bir çerçevenin sınıfı hakkında karar
verirken yalnızca o çerçeveye değil, o çerçevenin etrafındaki çerçevelere de bakarak
karar verme işlemini gerçekleştirmektedir. Bu tezin üçüncü bölümünde kalp seslerinin
yerlerini bulma işleminin etiketlendirilmiş eğitim verisi kullanılarak nasıl daha
iyileştirilebileceği anlatılmaktadır. Bu bölümde önerilen yöntem olabilirlik oranı testi
(LRT) ve etkili bir uyarlama işlemine dayanmaktadır. Önerilen yöntemde LRT iki
hipotez kullanmaktadır. Bu hipotezlerden ilki analiz edilen çerçevenin kalp sesi diğeri
ise kalp sesi olmadığını savunmaktadır ve bu iki hipotez Gauss karışım modeli (GKM)
ile modellenmektedir. Her bir modelin parametre kümesi elde bulunun etiketlendirilmiş
eğitim verisi kullanılarak kestirilmektedir.
2015, 80 sayfa
Anahtar Kelimeler: Soluk sesi, kalp sesi, entropi özniteliği, logaritmik enerji
özniteliği, entropi sınırı, bulanık c-ortalamalar, olabilirlik oranı testi.
i
ABSTRACT
Ph. D. Thesis
ESTIMATION OF HEART SOUND LOCATIONS IN RESPIRATORY SOUND
BASED ON PROBABILISTIC MODELING WITH LOW- COMPLEXITY
FEATURES
Hamed SHAMSI
Atatürk University
Faculty of Engineering
Department of Electrical and Electronic Engineering
Department of Telecommunication
Supervisor: Assist. Prof. Dr. İ. Yücel ÖZBEK
Heart sound detection and segmentation in ambient noise or respiratory sound is a basic
step for various heart and lung sound signal processing applications. The goal of this
thesis is detecting of the heart sound (HS) with lung sound and the lung sound only
(non-HS) segments in a respiratory signal. For this purpose, the thesis consists of three
parts. In the first part of the thesis, the location of the heart sounds is find using a new
feature. The proposed feature in heart sound detection task have a good performance in
heart sound boundary detection and its computational cost is much lower. In the second
part of this thesis we proposed a new method which it have an efficient learning
mechanism. This method is named as temporal fuzzy c-means. The TFCM algorithm
uses the temporal information from both the current and the neighboring frames in
decision making. In the third part of this thesis, we describe how classification results
are improved by using training labeled data. The proposed method is based on
likelihood ratio test combined with an efficient adaptation procedure. The proposed
method uses two hypotheses. The first hypothesis, is contains only the lung sound and
the alternative hypothesis is contains the heart sound with the lung sound and these
hypothesis are modelled by Gaussian mixture models. The model parameters are
estimated using the set of labelled training data.
2015, 80 pages
Keywords: Respiratory sound, heart sound, entropy feature, logarithm energy feature,
entropy bound, fuzzy c-means, likelihood ratio test.
ii
TEŞEKKÜR
Doktora tez çalışmamın yürütülmesinde tecrübelerini ve bilgilerini esirgemeyen çok
değerli hocam Sayın Yrd. Doç. Dr. İ. Yücel ÖZBEK’e çok teşekkür ederim. Ayrıca tez
çalışması süresince bana vermiş oldukları her türlü destek den dolayı, Sayın Yrd. Doç.
Dr. Bülent ÇAVUŞOĞLU’a ve Sayın Yrd. Doç. Dr. Emin Argun ORAL’a çok teşekkür
ederim. Tez süresince ve özellikle tezin Türkçe olarak yazılmasında yardımcı olan Fatih
ÇAĞLAR, Sema COŞĞUN ve M. Alptekin ENGİN’a çok teşekkür ediyorum.
Hayatim boyunca yardımları, sabırları ve iyilikleri için babama, anneme ve değerli
kardeşlerime teşekkür ederim.
Bu tezi sevgili eşim Samane ve biricik oğlum Emir Hesam’a armağan ediyorum.
Hamed SHAMSI
Ocak, 2015
iii
İÇİNDEKİLER
ÖZET.................................................................................................................................. i
ABSTRACT ...................................................................................................................... ii
TEŞEKKÜR .....................................................................................................................iii
SİMGELER ve KISALTMALAR DİZİNİ ...................................................................... vi
ŞEKİLLER DİZİNİ......................................................................................................... vii
ÇİZELGELER DİZİNİ .................................................................................................... ix
1. GİRİŞ ....................................................................................................................... 1
2. KURAMSAL TEMELLER ................................................................................... 3
3. MATERYAL ve YÖNTEM ................................................................................... 8
3.1. Solunum sesi içerisindeki kalp seslerinin entropi sınırı ile tespiti ........................ 8
3.1.1. Problem tanımı ve önceki çalışmalar ................................................................. 8
3.1.2. Olasılık Yoğunluk Fonksiyonunun Kestirimi .................................................... 9
3.1.3. Entropi kestirimi ............................................................................................... 10
3.1.4. Önerilen yöntem ............................................................................................... 12
3.1.4.a. Üst sınır elde edilmesi ................................................................................... 12
3.1.4.b. Önerilen karar mekanizması .......................................................................... 14
3.1.5. KDE ve GE sonuçlarının hesaplama karmaşıklığının analitik hesaplanması .. 15
3.1.6. Hesaplama karmaşıklığı ................................................................................... 16
3.2. Zamansal Bulanık C-Ortalamalar Dayalı Kalp Sesi Lokalizasyonu ................... 18
3.2.1. Giriş ve önceki çalışmalar ................................................................................ 19
3.2.2. Özellik çıkarma ve düzgünleştirme .................................................................. 20
3.2.2.a. Logaritmik enerji özelliği .............................................................................. 20
3.2.2.b. Entropi özniteliği ........................................................................................... 20
3.2.2.c. Öznitelik değerlerinin düzgünleştirilme işlemi ............................................. 21
3.2.3. FCM lokalizasyon metodu ............................................................................... 21
3.2.4. TFCM lokalizasyon metodu ............................................................................. 22
3.2.5. Önerilen yöntemin ilklendirilmesi ve sonuç kararları ...................................... 23
3.3. Olabilirlik Oranı Testi (LRT) ile Birlikte Maksimum a Posterior Adaptasyon
Esas Alan Yöntem .............................................................................................. 25
3.3.1. Öznitelik çıkarma ............................................................................................. 26
3.3.2. Olasılık modellerin tanımlanması .................................................................... 28
iv
3.3.3. Başlangıç model parametrelerinin belirlenmesi ............................................... 30
3.3.4. LRT ile kalp sesine ait kısımları tespit etme .................................................... 30
3.3.5. EM-MAP’e dayalı başlangıç parametrelerinin çevrimiçi adaptasyonu ........... 32
4. ARAŞTIRMA BULGULARI .............................................................................. 38
4.1. Veri tabanı ........................................................................................................... 38
4.2. Veri tabanının etiketlenmesi ................................................................................ 38
4.3. Performans değerlendirmeleri ölçütleri ............................................................... 39
4.3.1. Ortalama hata ölçütleri ..................................................................................... 39
4.3.2. Hata algılama denge grafiği (DET) .................................................................. 40
4.3.3. Geçen süre ........................................................................................................ 41
4.3.4. Önemlilik testi .................................................................................................. 41
4.4. Entropi Sınırına Dayalı Yöntemin Deneysel Sonuçları ve Tartışması ................ 42
4.4.1.
,
ve
arasındaki ilişki .................................................... 42
4.4.1.a.
ve
arasındaki ilişki ............................................................... 42
4.4.1.b.
ve
enropilerin korelasyon ve varyans analizi ...................... 46
4.4.2. Önerilen yöntem ve diğer yöntemlerin karşılaştırılması .................................. 48
4.5. Zamansal Bulanık C-Ortalamalar Yönteminin Deneysel Sonuçları ve
Tartışması............................................................................................................ 52
4.5.1. Özellik karşılaştırması sonuçları ...................................................................... 52
4.5.2. Yöntem karşılaştırması sonuçları ..................................................................... 56
4.6. Olabilirlik Oranı Testi (LRT) ile Birlikte Maksimum a Posterior Adaptasyon
Yöntemi ile Elde Edilen Deneysel Sonuçlar ve Tartışma................................... 61
4.6.1. Öznitelik boyutunun belirlenmesi ile ilgili deneysel sonuçlar ......................... 61
4.6.2. GKM parametrelerinin adaptasyonu ile elde edilen deneysel sonuçlar ........... 63
4.6.3. Önerilen yöntemin literatürdeki yöntemler ile karşılaştırılması....................... 69
5. SONUÇ .................................................................................................................. 73
KAYNAKLAR ............................................................................................................... 75
EKLER ............................................................................................................................ 78
EK 1. ........................................................................................................................... 78
EK 2. ........................................................................................................................... 79
EK 3. ........................................................................................................................... 80
ÖZGEÇMİŞ .................................................................................................................... 81
v
SİMGELER ve KISALTMALAR DİZİNİ
KS
Kalp sesi
S1
Birinci kalp sesi
S2
İkinci kalp sesi
pdf
Olasılık yoğunluk fonksiyonunun
CWT
Sürekli dalgacık dönüşümü
SSA
Singular spektrum analizi
FNR
Yanlış negatif oranı
FPR
yanlış pozitif oranı
FN
Yanlış negatif
FP
Yanlış pozitif
TN
Doğru negatif
TP
Doğru pozitif
FCM
Bulanık c-ortalamalar
TFCM
Zamansal bulanık c-ortalamalar
QPM
Yarı periyodik modelleme
DET
Hata algılama denge grafiği (Detection Error Tradeoff Graph)
NAUC
Eğri altında kalan normalize alan
EM
Beklenti maksimizasyonu
GKM
Gauss karışım model
SD
Kişiye bağımlı
SI
Kişiden bağımsız
SD-GKM Kişi bağımlı - Gauss karışım model
SI-GKM
Kişiden bağımsız - Gauss karışım model
ML
Maksimum olabilirlik
MAP
Maksimum a posteriori
LRT
Olabilirlik oranı testi
ALRT
Adapte edilmiş LRT
ASI
Adapte edilmiş SI
vi
ŞEKİLLER DİZİNİ
Şekil 3.1. Önerilen ve KDE yöntemlerinin kalp ses algılama adımlar ve ilgili
hesaplamalı karmaşıklıkları ............................................................................ 16
Şekil 3.2. Önerilen yöntemin ana blok diyagramı .......................................................... 27
Şekil 3.3. Orta akış hızındaki solunum ses parçası ve uygun logaritmik enerjiye
(düzgünleştirilmiş versiyonu ile birlikte) ....................................................... 28
Şekil 3.4. KS ve non-KS çerçevelerin histogramları ve tahmin edilmiş GKM pdf’leri . 29
Şekil 4.1. (a) Solunum sesinin küçük bir kısmı (b) ve (c) ECG ve spektrum dalga
formu .............................................................................................................. 39
Şekil 4.2. Hata algılama denge grafiği ............................................................................ 41
Şekil 4.3. (a) Solunum sesi düşük akış hızında (b) ilgili tahmini entropiler
(
,
) ............................................................................................ 43
Şekil 4.4. (a) Tahmini entropilerin 615 ve 650 çerçeveler arasındaki aralığın yakın
çekim (b) ve (c) sırasıyla çekirdek ve Gauss tabanlı dağılımların pdf
tahminleri 635 ve 631th çerçeveler için. ........................................................ 44
Şekil 4.5.
,
entropilerin arasındaki ilişki (a) düşük nefes seviyesi
için (b) orta nefes seviyesi için ....................................................................... 45
Şekil 4.6.
,
entropilerin arasındaki ilişki (a) düşük nefes seviyesi
için (b) orta nefes seviyesi için ....................................................................... 47
Şekil 4.7.
,
entropilerin histogramları (a) düşük nefes seviyesi
için (b) orta nefes seviyesi için. ...................................................................... 49
Şekil 4.8. Önerilen ve diğer yöntemlerin FNR, FPR ve geçen süresi açısından
karşılaştırılması............................................................................................... 52
Şekil 4.9. TFCM tabanlı özellik karşılaştırması sonuçları .............................................. 54
Şekil 4.10. (a) Solunum sesinin bir parçası düşük nefes sevisinde (b) ilgili parçanın
logaritmik enerji özeliği (c) logaritmik enerji özeliğine dayalı KS
lokalizasyon sonuçları (d) düzetilmiş logaritmik enerji özeliğine dayalı
KS lokalizasyon sonuçları ............................................................................ 55
vii
Şekil 4.11. TFCM, QPM, FCM ve SSA yöntemlerin sonuçları (a) düşük (b) orta
nefes seviyelerinde ....................................................................................... 57
Şekil 4.12. (a) Solunum ses sinyalinin bir bölümü ve (b)-(e) sırasıyla, TFCM,
QPM ve SSA yöntemleri sonuçları gerçek KS sınırları ile birlikte. ............ 60
Şekil 4.13. LRT yönteminin farklı m değerleri için DET sonuçları (a) düşük (b) orta
nefes seviyelerinde ....................................................................................... 62
Şekil 4.14. GKM adaptasyon sonuçları çeşitli süre uyarlama verileri için (a) düşük
(b) orta nefes seviyelerinde .......................................................................... 64
Şekil 4.15. ALRT ve LRT yöntemlerin DET sonuçları (a) düşük (b) orta nefes
seviyelerinde................................................................................................. 65
Şekil 4.16. Karışım bileşenlerinin çeşitli sayıda NAUC değerleri düşük ve orta
nefes seviyelerinde ....................................................................................... 67
Şekil 4.17. ALRT yöntemine göre iterasyon sonuçları .................................................. 67
Şekil 4.18. LRT ve ALRT yöntemlerin NAUC sonuçları tüm veri tabanı için .............. 68
Şekil 4.19. ALRT, QPM, ve SSA yöntemlerin DET sonuçları (a) düşük (b) orta
nefes seviyelerinde ....................................................................................... 70
Şekil 4.20. Bütün yöntemlerin NAUC sonuçları tüm veri tabanı için ............................ 71
viii
ÇİZELGELER DİZİNİ
Çizelge 3.1. Önerilen TFCM algoritmasına dayalı kalp sesi lokalizasyonu ................... 24
Çizelge 3.2. Önerilen algoritmaların ilklendirilmesi ...................................................... 25
Çizelge 3.3. Önerilen algoritmaların adımları ................................................................ 36
Çizelge 4.1.
ve
arasındaki doğrusal ilişki ............................................... 46
Çizelge 4.2. Tüm veriler için istatistiksel analiz sonuçları ............................................. 48
Çizelge 4.3. Önerilen metottun ve diğer metotların ortalama ve standarda sapması
düşük ve orta nefes sevilerinde .................................................................. 50
Çizelge 4.4. Önerilen metodun ve diğer metotların geçen süre ve normalize geçen
süre sonuçları ............................................................................................. 51
Çizelge 4.5. Tüm özeliklerin NAUC değerleri TFCM algoritması için ......................... 56
Çizelge 4.6. Tüm yöntemlerin NAUC değerleri düşük ve orta nefes seviyelerinde....... 58
Çizelge 4.7. Önerilen metottun ve diğer metotların ortalama ve standarda sapması
düşük ve orta nefes sevilerinde .................................................................. 59
Çizelge 4.8. Önerilen metottun ve diğer metotların ortalama ve standarda sapması
düşük ve orta nefes sevilerinde .................................................................. 59
Çizelge 4.9. Önerilen metottun ve diğer metotların geçen sure ve normaliz gecen
süre sonuçları ............................................................................................. 60
Çizelge 4.10. Tüm M değerleri için NAUC değerleri düşük ve orta nefes
seviyelerinde. ............................................................................................. 62
Çizelge 4.11. LRT ve ALRT için NAUC ve önemlilik test değerleri düşük ve orta
nefes seviyelerinde ..................................................................................... 66
Çizelge 4.12. SSA, QPM ve ALRT için düşük ve orta nefes seviyelerinde NAUC
ve önemlilik test değerleri.......................................................................... 69
Çizelge 4.13. Önerilen metottun ve diğer metotların ortalama ve standarda sapması
düşük ve orta nefes sevilerinde .................................................................. 71
ix
1
1. GİRİŞ
Teknolojinin çok hızlı bir şekilde geliştiği günümüzde tıptan askeri uygulamalara kadar
birçok alanda karar verme mekanizmalarında makine öğrenme yöntemlerinin aktif
kullanılması gün geçtikçe artmaktadır. Hastanelerde hekimleri kullandıkları birçok
cihaz sadece test sonuçlarını göstermekle kalmayıp bu sonuçlar hakkında yorum
yaparak hastalıkların teşhislerde önemli rol oynamaktadır. Örneğin önceleri sadece kalp
seslerini mekanik olarak yükseltip doktorların duymasına yardımcı olan stetoskoplar,
şimdilerde elektronik olarak kalp sesleri yükseltip, filtreler yardımıyla ortam
gürültülerini bastırıp hekimlere ulaştırırken bilgisayar yardımıyla sesleri işleyerek
hastalıklı kalpteki üfürüm yerlerini bularak üfürümün çeşidi hakkında fikir
verebilmektedirler. Bu gelişmelere paralel olarak bu tez kapsamında kalp seslerinin ve
akciğer seslerinin bilgisayar yardımıyla işlenerek istenilen niteliklere hazır hale
getirilmesinin temel adımı olan kalp seslerinin yerlerinin doğru ve düşük işlem yükü ile
kestirilmesi için yeni öznitelikler ve sınıflandırma yöntemleri önerilmektedir. Kalp
seslerinin sınırlarının normal ortam şartlarında veya akciğer sesi içerisinde bulma işlemi
iki aşamadan oluşmaktadır. Bunlardan ilki eldeki sinyalin belirli uzunluktaki
çerçevelere bölünmesi ve her bir çerçeve için uygun özniteliklerin çıkarılması. İkincisi
ise her bir çerçevenin hangi sınıfa (kalp sesi veya kalp olamayan) ait olduğunu bulmaya
yarayan sınıflandırma işlemidir. Bu işlemeler sırasıyla gerçekleştirilirken işlem yükünün
hafif ve sınıflandırma doğruluk başarısının yüksek olması istenen önemli iki özelliktir.
Bu tez çalışması kapsamında öncelikle kalp seslerinin sınırlarının bulunmasında
literatürde sıkça kullanılan entropi özniteliğinin üst sınırı kullanarak yeni bir öznitelik
önerildi. Bu özniteliğin işlem yükü hafif ve sınıflandırma başarısı işlem yükü fazla olan
özniteliklere eş olduğu gösterildi. Bu tez kapsamında bu yeni özniteliğe ek olarak,
literatürde bulunan ve kalp seslerinin sınırlarını bulma işleminde kullanılan
sınıflandırma algoritmalarından daha yüksek performansa sahip iki yeni sınıflandırma
algoritması önerilmiştir. Bu algoritmalardan ilki zamansal bulanık c-ortalama (TFCM)
algoritmasıdır. Bu algoritma bulanık c-ortalama (FCM) algoritması uyarlanarak elde
edilmiştir. TFCM yöntemi özyineli (iterative) öğrenme kabiliyetine sahip bir
algoritmadır ve herhangi bir çerçevenin sınıfını belirlerken sadece ilgili çerçeveye değil
2
o çerçevenin çevresindeki çerçeveleri de dikkate alır. Bu şekilde karar mekanizmasında
zamansal değişim bilgilerini de kullanarak literatürde var olan diğer sınıflandırma
algoritmalarına üstünlük sağlar. Bu tez çalışmasında önerilen diğer bir sınıflandırma
algoritması ise olabilirlik oranı testine dayanmaktadır. Bu yöntemde kalp sesleri ve kalp
sesi olmayan kısımları belirlemek için iki hipotez belirlenir ve bu hipotezler Gauss
karışım modelleri (GKM) yardımıyla olasılıksal olarak modellenir. Bu modellere ait
parametreler kestirilirken elle etiketlendirilmiş eğitim verisi kullanılır. Önerilen bu yeni
sınıflandırma algoritması şayet elde etiketlendirilmiş veri tabanı mevcut ise literatürde
kullanılan yöntemlerden çok daha iyi sonuçlar elde dilebileceğini göstermektedir.
3
2. KURAMSAL TEMELLER
Kalp ve akciğer sesleri insan fizyolojisinin en önemli sistemlerinden solunum ve
kardiyovasküler sistemler hakkında önemli bilgiler içermektedir. Kalp ve akciğer sesleri
bu sistemlerin fiziki muayenesinin önemli parçalarıdır ve hastalıkların tanısında
hekimleri yönlendirirler. Kalp sesleri kanın kardiyovasküler sistemde hareketi esnasında
kalbin kasılma ve gevşeme safhalarında kalp kapakçıklarının kapanması sonucu oluşan
seslerdir. Kalbin çalışması sırasında sistol ve diyastol evrelerinde iki farklı ses
duyulmaktadır. Bunlardan ilki, yani birinci kalp sesi (S1) ventrikül sistolünün başlaması
ile mitral ve triküspit kapaklarının kapanmasın sonucu ortaya çıkar ve “Lab” biçiminde
bir ses olarak işitilir. İkinci kalp sesi (S2) ise ventrikül sistolünün bitiminden hemen
sonra aortik ve pulmoner semilunar kapakların kapanmasıyla ortaya çıkar. İkinci kalp
sesi “Dap” olarak işitilir, yani kalbin dinlenmesi sonucu periyodik olarak “Lab”, “Dap”
sesleri işitilir. Akciğer sesleri ise ağız ve burun yoluyla alınan havanın soluk borusu ile
bronşlara ve oradan alveollere kadar gidişi ve alveollerden tekrar ağız ve burun yoluyla
dışarı atılıncaya kadar geçtiği yollarda oluşturduğu türbülan akımlarından kaynaklanan
titreşmelerdir. Akciğer sesleri genel olarak iki farklı fazdan oluşmaktadır. Bunlardan ilki
nefes alış (inspirasyon) esnasında oluşan seslerdir ve sesin yoğunluğu bu esnasında
düzenli artar. İkincisi ise nefes veriş (ekspirasyon) esnasında oluşan seslerdir. Kalp ve
akciğerler fiziksel olarak birbirlerine çok yakın olduklarından ve çıkardıkları seslerin
frekans içerikleri birbirleri ile örtüştüğünden dolayı bu sesler birbirleri ile sürekli
etkileşim içerisindedir. Bu etkileşim kalp ve akciğer seslerinin birbirinden yalıtılmış
dinlenmesi zorlaştırmaktadır.
Gelişen bilgisayar teknolojileri ve sinyal işleme teknikleri sayesinde kalp ve akciğer
seslerinin birbirinden yalıtılmış olarak algılanmasına imkân sağlamaktadır. Bilgisayar
yardımı ile kalp seslerinin yerlerinin ortam gürültüsü veya akciğer sesleri içerisinde
tespit edilmesi birçok kalp ve akciğer sesi sinyallerinin işlenmesi ve algılanmasında en
temel adımlardan biridir. Örneğin kalp üfürümü olan bir kalp sesi incelendiğinde, kalpte
ne tür bir rahatsızlık olduğunu belirlemek için öncelikle kalp sesi sınırlarının
belirlenmesi ve bu sırlar arasında bulunan üfürüm seslerine yoğunlaşmak gerekmektedir
4
[1, 2]. Benzer şekilde kişi tanıma için kalp seslerinin kullanıldığı biyometrik sistemlerde
kalp seslerinin bölütlendirilmesine ihtiyaç duyulur. Özellikle kalp seslerinin aktif olarak
bulunduğu bölgeler (S1 ve S2 bölgeleri) kişisel bilgilerin çoğunlukla bulunduğu
bölgelerdir ve bu bölgelerden elde edilen öznitelikler kişi tanıma işlemlerinde başarılı
sonuçlar vermektedir [3, 4]. Literatürde var olan ve yukarıda örnekleri verilen yalnızca
kalp sesinin dikkate alındığı uygulamalara ek olarak, kalp seslerinin yerlerinin tespiti ve
bölütlendirilmeleri yalnızca akciğer sesinin algılanmasına ihtiyaç olduğu durumlarda da
gereklidir. Örneğin, akciğer seslerinin stetoskop ile dinlenmesi (incelenmesi) birçok
akciğer hastalıklarının tanısında önemli bir yer tutmaktadır [5]. Ancak akciğer seslerinin
dinlenmesi esnasında kalp sesleri akciğer seslerinin dinlenmesini engelleyebilir bu
durumda kalp sesleri akciğer sesleri için gürültü olarak kabul edilir ve istenmeyen sesler
olarak algılanır. Bu gibi durumlarda, akciğer sesinde kalp seslerinin olumsuz etkilerini
azalmak ve mümkünse ortadan kaldırmak gerekmektedir [6-9]. Literatürde akciğer
sesleri içerisindeki kalp seslerinin etkilerini azaltacak birçok yöntem mevcuttur. Bu
yöntemlerin çoğunluğu kalp seslerinin bulunduğu yerlerin bilgisine ihtiyaç duyarlar ve
bu algoritmaların başarıları kalp sesi sınırlarının ne kadar doğru olarak bulunduğuna
bağlıdır. Akciğer hastalıklarının tespitine ek olarak kalp seslerinden yalıtılmış akciğer
sesleri solunum akışın kestiriminde de kullanılmaktadır [10, 11]. Solunum akışının
kestirimi esnasında akciğer sesleri soluk borusundan stetoskop yardımıyla alınmaktadır.
Soluk borusundan alınan sesler içerisinde kalp sesleri aktif olarak görülmekte ve akciğer
seslerinin algılanmasını zorlaştırmaktadır. Bu durumda kalp seslerinin yerlerinin
belirlenmesi ve bunların bastırılması gerekmektedir. Kalp sesleri bastırıldıktan sonra
soluk akışının kestirimi soluk sesi yardımıyla etkin olarak yapılabilmektedir. Yukarıda
anlatıldığı üzere kalp seslerinin yerlerinin belirlenmesi ve bölütlendirilmesi gerek kalp
sesi uygulamalarında ve gerekse akciğer sesi uygulamalarında aktif olarak
kullanılmaktadır. Bu nedenle kalp seslerinin yerlerinin doğru ve işlem yükü açısından
az işlem yüküne sahip yöntemler ile bulunması oldukça önemlidir [12-14]. Akciğer sesi
içerisinde ve akciğer sesi olmaksızın kalp seslerinin yerlerinin bulunması iki temel
adımda gerçekleştirilir. Bu adımlardan ilki eldeki sinyalden öznitelik çıkarma işlemi
diğeri ise bu öznitelikler kullanılarak sınıflandırma (kalp sesi bölgesi ve kalp olmayan
bölgeler) işleminin gerçekleştirilmesidir. Her iki adımın doğru ve hızlı çalışması
önerilen yöntemlerin başarısını etkilemektedir. İstenilen özelliklerde özniteliklerin
5
bulunması için literatürde birçok çalışmalar yapılmıştır [15-23]. Bu çalışmalarda belirli
özellikler, entropi, enerji, varyans, vb. solunum sesinden çıkartılır ve kalp sesi (KS)
bölgeleri bu özniteliklerin genliğinin belirli bir eşik değeriyle karşılaştırılmasıyla
belirlenir [15, 20, 21]. Bu öznitelikler arasında, Shannon entropi özniteliğinin [24] KS
parçalarının bulunmasında en etkin ve sağlam bir özelliktir olduğu bildirilmiştir [21].
Ancak bu özniteliğin en büyük dezavantajı yüksek işlem yükü gerektirmesidir [15].
İşlem yükünün en önemli sebebi olasılık yoğunluk fonksiyonunun (pdf) tahmini ve
entropi hesaplama işlemlerinden kaynaklanmaktadır. Literatürde bulunan birçok
çalışmada [15, 17, 20, 21], pdf, çekirdek yoğunluk tahmin işlemi ile tahmin
edilmektedir, bu yöntem, histogram tabanlı pdf hesaplama yöntemlerine [25] göre daha
güçlüdür. Pdf kestiriminden sonra entropi kestirimi Monte Carlo integrasyonu
kullanılarak yapılmaktadır. Bu iki işlemin (pdf ve entropi kestirimi) her bir sinyal
çerçevesine uygulandığından bu özniteliğin işlem yükü oldukça fazladır. Literatürde,
işlem yükü açısından en verimli öznitelik, sürekli dalgacık dönüşümümün dayalı CWT
özniteliğidir [18]. Ancak, bu özniteliğin doğruluğu, yukarıda bahsedilen özniteliklerden
oldukça zayıf olduğu bildirilmiştir [15]. Literatürde var olan ve kalp seslerinin yerini
bulma işleminde kullanılan bu öznitelikler dikkate alındığında, işlem yükü az olan ve
kalp sesi yerlerini yüksek doğrulukla hesaplayabilen özniteliklere ihtiyaç olduğu açıktır.
Bu amaç doğrultusunda tezin ilk bölümünde bu tür özelliklere sahip yeni bir öznitelik
önerildi. Daha önce belirtildiği gibi, araştırmalara göre kalp seslerinin lokalizasyonu
için önerilen en güçlü öznitelik entropi özniteliğidir. Ancak, entropi özniteliğinin işlem
yükü oldukça fazladır. Bu dezavantajın üstesinden gelmek için, çekirdek yoğunluk
yaklaşımına dayalı entropi kestiriminin üst sınırını esas alan yaklaşık bir entropi ölçütü
yeni bir öznitelik olarak önerilmiştir. Önerilen bu yeni özniteliğin kalp seslerinin
yerlerinin yerlerini bulmada oldukça başarılı olduğu ve işlem yükü açısından düşük
işlem yüküne sahip olduğu bu çalışmada gösterilmiştir. Kalp sesi sinyalinin bileşenleri
(S1 ve S2) oldukça yüksek genliğe sahip olduğundan dolayı, literatürde birçok
çalışmada kullanılan sınıflandırma yöntemi uyarlanır (adaptive) eşik değerine dayalı
sınıflandırma yöntemidir. Bu yöntem ile sınıflandırma yaparken sinyalden çıkarılan
öznitelik değerleri belirli bir eşik değeri ile karşılaştırılır ve öznitelik değerlerinin eşik
6
değerini geçtiği bölgeler kalp sesi olarak etiketlendirilir [16, 18, 21]. Eşik tabanlı
sınıflandırma yöntemleri, basit ve kolay hesaplanabilir olmalarına rağmen, gürültü ve
aykırı öznitelik değerlerine karşı çok güçlü değildirler. Çünkü bu tür algoritmaların
öğrenme mekanizmaları yoktur ve bu algoritmalar analiz edilen sinyalin zaman
içerisindeki değişimine ait bilgilerini kullanmazlar.
Bu tür sorunların üstesinden gelmek için bu tezin ikinci bölümünde akciğer sesi
içerisindeki kalp sesi bölgeleri bulmak için öğrenme kabiliyeti olan yeni bir yöntem
önerilmektedir. Bu yöntemin ana fikri sınıflandırma problemlerinde sıkça kullanılan
FCM
algoritmasına
dayanmaktadır.
FCM
algoritması
sınıflandırma
işlemini
gerçekleştirirken özyineli (iterative) öğrenme kabiliyeti olmasına rağmen herhangi bir
çerçevenin sınıfı hakkında karar verme esnasında sadece ilgili çerçeveyi göz önüne
aldığı için sinyalin zaman içerisinde değişim bilgisini sınıflandırma işleminde
kullanmamaktadır. FCM algoritmasının bu eksikliği bu tez kapsamında önerdiğimiz
TFCM algoritması ile giderilirmiştir [26]. TFCM algoritması herhangi bir çerçevenin
sınıfı hakkında karar verirken yalnızca o çerçeveye değil o çerçevenin etrafındaki
çerçevelere bakarak karar verme işlemini gerçekleştirir. Bu tez çalışması kapsamında
önerilen bu yeni algoritmanın eşik değer tabanlı algoritmalara göre çok daha doğru bir
şekilde kalp seslerinin yerlerini tespit ettiği gösterilmiştir. Bu tür öğrenme kabiliyeti
olan sınıflandırma algoritmasının yanı sıra, şayet elde etiketlendirilmiş eğitim verisi
bulunuyorsa sınıflandırma algoritmalarının başarısını daha da artırmak mümkündür [20].
Bu tezin üçüncü bölümünde sınıflandırma işleminin etiketlendirilmiş eğitim verisi
kullanılarak nasıl daha iyileştirildiği anlatılmaktadır. Önerilen yöntem LRT üzerinde
temellendirilmiştir. LRT algoritması literatürde birçok alanda yaygın olarak kullanılan
bir algoritmadır [15,16]. Bu tez çalışmasında, LRT algoritmasını kalp sesi sırlarını
bulma işleminde kullandık. Önerilen yöntemde LRT iki hipotez kullanmaktadır. Bu
hipotezlerden ilki analiz edilen çerçevenin kalp sesi diğeri ise kalp sesi olmadığını
savunmaktadır ve bu iki hipotez Gauss karışım modeli (GKM) ile modellenmektedir.
Her bir modelin parametre kümesi elde bulunun etiketlendirilmiş eğitim verisi
kullanılarak kestirilir. Test aşamasında analiz edilen çerçevenin her iki modele
7
uygunluğu hesaplanır ve bu uygunluk değerleri birbirine oranlanarak olabilirlik değeri
hesaplanır. Şayet olabilirlik oranı belirli bir eşik değerini geçiyorsa bu çerçevenin kalp
sesi olduğuna karar verilir. Önerilen bu yöntem ile kalp seslerinin yerlerini literatürde
var olan yöntemlerden daha iyi şekilde bulunmaktadır.
8
3. MATERYAL ve YÖNTEM
3.1. Solunum sesi içerisindeki kalp seslerinin entropi sınırı ile tespiti
Bu çalışmada, düşük hesaplama karmaşıklığında ve yüksek doğrulukta, solunum sesi
içinde kalp sesi (KS) bölümlerinin bulunması için bir entropi sınırının kullanılması
önerilmektedir. Önerilen yöntemde parametrik olmayan bir yaklaşıma dayalı bağımsız
örnekler kullanılarak entropi tahmin edilmesi yerine, entropi için bir üst sınır
kullanılarak daha pratik ve etkili bir yaklaşım olacağı gösterilmektedir.
3.1.1. Problem tanımı ve önceki çalışmalar
Solunum sesleri kalp sesinin ve akciğer sesinin birlikte olduğu ve sadece akciğer sesinin
olduğu bölümler olmak üzere iki çeşitten oluşmaktadır. Kalp seslerinin bulunduğu
bölgeleri diğer bölgelerden ayırt eden en belirgin özellik bu bölgelerin diğer bölgelere
oranla daha yüksek varyansa sahip olmalarıdır. Sinyal işleme teorisinde, sinyalin bir
bölümünde yüksek varyansa sahip olması o bölümle ilgili belirsizliğin yüksek anlamına
gelmektedir. Bir sinyaldeki belirsizlik miktarının ölçüsü, entropi kavramıyla ilgilidir.
Bu yüzden solunum ses sinyalinin entropisi, kalp seslerinin bölümlerinin yerleri için
önemli ipuçları taşımaktadır. Bu özellik sayesinde, entropi özniteliği solunum sesinde
kalp seslerinin yerlerinin tespitinde [15, 17, 19, 21, 23] ve KS bölütlendirilmesinde [27]
sıklıkla kullanılmaktadır. Solunum sesi içinde KS bölümlerinin tespitinin genel
prosedürü aşağıdaki gibi açıklanabilir. İlk olarak, solunum sesi çerçevelere bölünür ve
her bir çerçeve için diferansiyel Shannon entropi H ( X ) aşağıdaki gibi hesaplanır;

H ( X )   p( x) log[ p ( x)]dx
(3.1)

Burada X pdf’i p(.) ile gösterilen sürekli-değerli rastlantı değişkenini gösterilmektedir.
Herhangi bir çerçevenin entropisini hesaplandıktan sonra, entropi değerine göre karar
9
mekanizması aşağıdaki gibi yapılır. Eğer H ( X , n) , n’inci çerçevenin entropisini
gösterdiği varsayılırsa. Bu çerçevenin entropi değeri ( H ( X , n) ) belirli bir eşik değerini
aştığında KS bölgesi olduğuna karar verilir, aksi takdirde KS olmayan bölge olarak
tanımlanır ve bu karar mekanizması aşağıdaki gibi yazılabilir.
 
H ( X , n) 
 
burada
n'inci çerçeve KSolarak karar verilir
n'inci çerçeve non-KSolarak karar verilir
(3.2)
 önceden tanımlı bir uyarlamalı eşik değeridir ve bu değer literatürdeki
çalışmalara benzer şekilde [15, 21], uyarlamalı eşik değeri entropi özniteliğinin
ortalaması ile standart sapmasının toplamı (    ) olarak hesaplanır. (3.1)’de
tanımlanan Shannon entropinin hesaplanması pdf’in bilinmediği durumda iki ana
aşamadan oluşur: Bu aşamalardan ilki ölçümler yardımıyla pdf kestirilmesi ve ikincisi
ise (3.1)’de tanımlanan integralin hesaplamasıdır.
3.1.2. Olasılık Yoğunluk Fonksiyonunun Kestirimi
Entropi tahmininin performansı ağırlıklı olarak ilgili çerçevenin pdf’nin doğru bir
şekilde kestirimine bağlıdır. Parametrik olmayan çekirdek (kernel) yoğunluk tahmini
prosedürü solunum sesi çerçevesinin pdf’ini kestirmek için aşağıda kısaca belirtildiği
gibi literatürde kullanılmıştır [21, 25]. Solunum sesinden elde edilen bir çerçevenin
örneklerinin olasılık yoğunluk fornksiyonu p(.) olan X rastlantı değişkenden geldiği
varsayılarak
kestirimi
x1 ,..., xN  şeklinde
gösterilsin. Bu durumda p(.) nin çekirdek yoğunluk
aşağıdaki gibi tanımlanır.
∑
(3.3)
burada  h (.) çekirdek fonksiyonunu göstermektedir. Bu çalışmada kullanılan Gauss
çekirdek fonksiyonu aşağıda verilmiştir:
10
1
 h  x
2 h2
e
1 x 
  
2 h 
2
(3.4)
burada h çekirdek fonksiyonunun bant genişliğini göstermektedir. Bant genişliğinin
yaklaşık değeri Gauss varsayımı altında aşağıdaki gibi tanımlanmaktadır [25].
h   xK
Burada

ve
x
K
(3.5)
değeri aşağıdaki gibi hesaplanır


2
1 N
 xi   x ,
N i 1
 4 
 3N 
(3.6)
0.2
(3.8)
Burada ̂ değeri çerçevedeki örneklerin ortalama değerini gösterir ve aşağıdaki gibi
hesaplanır.
̂
∑
(3.7)
burada N çerçevede bulunan çekirdeklerin toplam sayısıdır.
3.1.3. Entropi kestirimi
Gerçek olasılık yoğunluk fonksiyonu
p(.) ’nin kestirimi olan f . fonksiyonu
hesaplandıktan sonra f . fonksiyonu (3.1) de p(.) yerine konularak diferansiyel
entropi kestirimi aşağıda verildiği gibi hesaplanır.
11

H kde  X     f  x  log  f  x  dx.
(3.9)

Kestirilen f . fonksiyonu (3.3) de ifade edildiği gibi çekirdek fonksiyonların toplamı
cinsinden ifade edildiği için (3.9) verilen integralin kapalı form çözümü yoktur. Bu
yüzden (3.9) da verilen entropi bu eşitlikte verilen integralin nümerik olarak
hesaplanması sonucu bulunabilir.
Bu integral Monte Carlo yaklaşımı kullanılarak aşağıdaki gibi hesaplanabilir [28].
∑
[
]
(3.10)
(3.3) ve (3.10) tanımlanan denklemlerin birleştirilmesi ile çekirdek yoğunluk
fonksiyonuna dayalı Monte Carlo yaklaşımı ile Shannon entropisinini hesaplamasına ait
formül aşağıdaki gibi verilir.
MC
H kde
X   
1
N
1
log 

j 1
N
N
  x
N
i 1
h
j

 xi  .

(3.11)
Yukarıda (3.11) de tanımlanan entropi kestirimi (3.2) de verilen karar mekanizmasında
entropi yerine yazılarak aşağıdaki gibi uygulanır.
 
MC
H kde
 X , n 
 
n'inci çerçeve KSolarak karar verilir
n'inci çerçeve non  KSolarak karar verilir
(3.12)
Yukarıda belirtilen yöntem ile kalp seslerinin yerlerinin belirlenmesinin temel adımları
Şekil 3.1 de verilmiştir. Denklem (3.11) verilen tahminci gerçek entropi değerine
oldukça yakın değerler vermesine rağmen ana dezavantajı yüksek hesaplama
12
karmaşıklığına sahip olmasıdır [15]. Bir sonraki bölümünde çekirdek yoğunluk tahmini
ile entropi hesaplamanın karmaşıklığı azaltmak için önerilen yöntem anlatılmaktadır.
3.1.4. Önerilen yöntem
Bu bölümde, (3.9)’de tanımlanan entropi için bir üst sınır tanımlanıp ve elde edilen
yaklaşık
entropi
değerinin
kalp
sesinin
bölümlerinin
tespitinde
kullanımı
açıklanmaktadır.
3.1.4.a. Üst sınır elde edilmesi
Çekirdek fonksiyonu  h .
Gauss fonksiyonu seçildiğinden dolayı, (3.3)’de
tanımlanan çekirdek yoğunluk tahminci aşağıdaki gibi yazılabilir.
N
f  x  
i 1
1
N  x; xi , h2  ,
N
Burada N  u;  ,  2  bir
değişken için tek değişkenli beklenen değeri
(3.13)
ve varyansı
olan Gauss pdf’ini göstermektedir. Bu tanımdan, f . fonksiyonunun eşit ağırlık
olasılıklarına sahip bir Gauss karışım olasılık yoğunluk fonksiyonu olduğu
görülmektedir. (3.13) kullanarak, (3.9)’de tanımlanan çekirdek yoğunluğu entropi
değeri aşağıdaki gibi tekrardan yazılabilir.
  1 N
1 N

H kde  X       N  x; xi , h 2  log   N  x; x j , h 2  dx

  N
 N j 1

 i 1
(3.14)
Önerilen üst sınır, logaritma fonksiyonunun konkav özelliğine dayanmaktadır. [29-31].
(3.14) deki logaritma teriminin sınırı aşağıdaki gibi yazılabilir.
13
1 N
1 N
2 
log   N  x; x j , h    N  x; x j , h2 
 N j 1
 N j 1
(3.15)
Bu sonucun (3.14)’de yerine konulursa, aşağıdaki denklemler elde edilebilir.
H kde  X   

N
1 N 
2
N
x
;
x
,
h
log  N  x; x j , h 2 dx




i
2


N i 1
j 1
1 N N 
N  x; xi , h2  log  N  x; x j , h2 dx
2  
N i 1 j 1
(3.16)
(3.17)
2
1
1 x
 log  2 h2    2
2
2 h
(3.18)
 
(3.19)
2
1
1
1
 log 2 x   log  K   2
2
2
K
(3.17)’dan (3.18) elde etmek için gerekli olan ispat Ek 1’de verilmiştir. İçerisine
(3.5)’de verilen h (3.18) de yerine konulmasıyla (3.19) verilen ifade elde edilir. (3.19)
verilen ilk iki terim, varyansı
olan Gauss bir dağılımının entropisi (
) olarak
bilinir. Bu entropi aşağıdaki gibi tanımlanırsa,
(
̂ )
önerilen çekirdek yoğunluğu üst sınırı
(3.20)
aşağıdaki gibi yazılabilir.
UB
H kde  X   H kde
 X   H g  X   log  K  
1
K2
(3.21)
14
Burada
bir sabittir ve (3.8)’de tanımlanmıştır.
3.1.4.b. Önerilen karar mekanizması
Eşitlik (3.21) de entropi üst sınır olarak bulunan
olarak kullanılabilir. Bu durumda ve
değeri
nin yaklaşık değeri
’inci çerçeve için ilgili karar kriteri aşağıdaki gibi
yazılır.
UB
H kde
 X , n   H g  X , n   log  K  
1   KS

K 2   non-KS
(3.22)
(3.22)’nin sadeleştirilmiş versiyonu aşağıdaki gibi yazılabilir
 
H g  X , n 
 
n'inci çerçeve KSolarak karar verilir
n'inci çerçeve non  KSolarak karar verilir
burada
yeni bir eşik değeridir. (3.23)’de, görüldüğü gibi
nin verdiği sonuçlar
ile aynıdır, çünkü
(3.23)
sabit bir değerdir ve sadece çerçeve
içindeki örnek sayısına bağlıdır.
Sonuç olarak, (3.23)’de verilen KS lokalizasyonu için önerdiğimiz karar mekanizması
aşağıdaki gibi özetlenebilir. Herhangi bir solunum sesi çerçevesi için kalp veya kalp
olmayan ses olup olmadığına karar vermek için, ilk olarak verilen çerçevedeki
örneklerin Gauss dağılımına sahip olduğu varsayımı ile (3.6) ve (3.7) tanımlanan,
ortalama (  ) ve varyans (  ) değerleri hesaplanır. Bu durumda varsayılan Gauss
olasılık yoğunluk fonksiyonu aşağıdaki gibi tanımlanabilir.

g  x  N x;  x ,  x
2

(3.24)
15
Daha sonra (3.20)’de verilen formül kullanılarak diferansiyel entropi hesaplanır, ve
(3.23) verilen karar kriteri uygulanır.
entropisi kullanılarak önerilen kalp ses
tespiti yönteminin ana adımları Şekil 3.1’de verilmiştir. Bu şekilde, KDE ve GE
kısaltmaları sırasıyla
ve
entropilerinin kullanıldığı yöntemleri
göstermektedir.
3.1.5. KDE ve GE sonuçlarının hesaplama karmaşıklığının analitik hesaplanması
Şekil 3.1’de KDE ve GE yöntemleriyle ilgili ana aşamalar ve hesaplama yükü
görülmektedir. Bu şekildeki satırlar incelendiğinde her iki yöntemin adım-1 ve adım3’de benzer hesaplama yükü olduğu söylenebilir. Ancak, KDE ve GE yöntemlerinin
adım-2 de önemli ölçüde farklı hesaplama yükü olduğu görülmektedir. KDE yöntemi
O  N 2  kere çekirdek fonksiyonunu ve O  N 2  kere toplama ve O  N  kere de
logaritmik fonksiyonunu hesaplamaktadır. Diğer taraftan, GE yöntemi
toplama ve
kere
kerede logaritmik fonksiyonunu hesaplamaktadır. Şekil 3.1 de
görüldüğü gibi önerilen GE yöntemi KDE ye göre önemli ölçüde az hesaplama yüküne
sahiptir.
16
Şekil 3.1. Önerilen ve KDE yöntemlerinin kalp ses algılama adımlar ve ilgili
hesaplamalı karmaşıklıkları
3.1.6. Hesaplama karmaşıklığı
Önceki bölümde açıklandığı gibi, önerilen yöntem, solunum sesinin her bir çerçevesinin
Gauss dağılımına sahip olduğunu varsayarak çerçevenin entropisi
hesaplanır. Bu alt bölümde
kolayca
hangi şartlar altında benzer kalp sesi
ve
algılama performansı gösterecekleri incelenecektir. Bu amaçla, Gauss kestirimiyle
ve çekirdek kestirimiyle hesaplanan pdf
hesaplanan pdf
arasındaki Kullback-
Leibler uzaklığı aşağıdaki gibi hesaplanır.
D  f  x  || g  x    





f  x  log f  x  dx  


  H kde  X   


f  x
dx
g  x
(3.25)
f  x  log g  x  dx
(3.26)
f  x  log
f  x  log g  x  dx
(3.27)
17
1  h2 
  H kde  X   H g  X    2  (3.28
2   x 
1
  H kde  X   H g  X   K 2 (0.1)
2
(3.29)
(3.28) denkleminden (3.27)’nin nasıl elde edildiği detaylı bir şekilde Ek 2’de
verilmiştir. (3.29) yeniden yazıldığında, aranılan ilişkiyi aşağıdaki gibi bulunur.
[ (
)
]
(3.30)
) Kullback-Leibler uzaklığının üst ve alt sınırlarını inceldiğimizde,
(
entropisi için yeni bir alt ve üst sınırlar hesaplanabilir.
(
) için
sınırlar aşağıdaki gibi yazılabilir.
(
)
(3.31)
Denklem (1.31)’in nasıl elde Ek 3’de verilmiştir. Bu ifade kullanılarak
entropisinin yeni alt sınırı ve yeni üst sınırı aşağıdaki gibi yazılabilir.
1
H g  X   log  K   H kde  X   H g  X   K 2 .
2
(3.32)
(3.32) de verilen üst sınır (3.21) deki sınıra göre daha sıkıdır. Bununla birlikte, her iki
tahmin edilen üst sınırlar ((3.32) de verilen alt sınırlarda) (3.22) deki karar
mekanizmasını kullandığında benzer bir performans göstermektedir. Ayrıca, (3.30)
verilen eşitlik incelendiğinde aşağıdaki gözlemler elde edilebilir.
1.
Çerçeve indeksi
yazılabilir.
olarak alındığında, (3.31) verilen ilişki aşağıdaki şekilde
18
(3.33)
(
Burada
)
,
ve
arasında bir fark
olarak kabul edilebilir.
2.
(3.31) den çıkarılan ilk gözlem
arasında doğrusal bir ilişki
ve
vardır.
3.
Eğer
nin varyansı küçükse
ve
arasındaki fark sabit
bir sayıya yakınsar ve bu sayı sadece çerçeve uzunluğuna bağlıdır. Bu durumda
ve
4.
benzer bir performansa sahiptirler.
(3.31) den elde edilen son gözlem, (3.33) deki terimler analitik olarak
hesaplanmaları mümkün olmamasına rağmen bu terimlerin nümerik olarak Monte Carlo
yaklaşımı kullanılarak aşağıdaki gibi hesaplanabilir.
(3.34)
Önerilen bu yeni öznitelik ile elde edilen sonuçlar Bölüm 4.4 de verilmiştir.
3.2. Zamansal Bulanık C-Ortalamalar Dayalı Kalp Sesi Lokalizasyonu
Bu bölüm, zamansal bulanık c-ortalamalar (TFCM) algoritmasına dayalı solunum
seslerinin içinde kalp seslerinin yerini tespit etmek önerilen yöntem anlatılmaktadır. Bu
yöntemde, ilk başta solunum sesi çerçevelere bölünür ve her bir çerçeve için logaritmik
enerji özellikleri hesaplanır. Daha sonra, TFCM algoritması bu özellikleri kullanarak
solunum sesini kalp sesinin ve akciğer sesinin birlikte olduğu ve sadece akciğer sesinin
olduğu sınıflara ayırır. TFCM algoritması bulanık c-ortalamalar (FCM) algoritmasının
değiştirilmiş versiyonudur. Karar mekanizmasında FCM algoritması sadece yerel
bilgiler kullanırken, TFCM algoritması yerel ve zamansal bilgileri beraber kullanır.
19
3.2.1. Giriş ve önceki çalışmalar
Ana KS bileşenleri S1 ve S2 algılamaları çeşitli bilgisayarlı kalp ses işleme
uygulamalarında önemli bir adımdır [2, 6, 7, 18, 32-34]. Böyle bir algılama sisteminin
ana uygulamalarından biri, solunum ses içinden kalp ses sinyalinin iptal edilmesidir.
Burada akciğer sesi, akciğer hastalıklarının tanısı için istenen sinyal olarak kabul
edilmektedir [6-9, 22, 35, 36]. Bu tür uygulamalarda, solunum sesi içinde kalp sesinin
yerini tahmin etmek için güvenilir öznitelikler ve yöntemler bulmak çok gereklidir.
Kalp sesi sinyalinin bileşenleri (S1 ve S2) oldukça yüksek bir genliğe sahip olduğundan
dolayı, literatürde çeşitli çalışmalar sadece akciğer sesi ve akciğer ile KS birlikte olan
ses parçalarını solunum sesi içinde sınıflandırmak için bir uyarlamalı eşik yaklaşımı
yöntemini kullanmaktadırlar. Uyarlamalı eşik yaklaşımında, kalp sesi yerleri hakkında
karar vermek, veri değerinin belli bir eşik değerini aşması veya altında kalmasına göre
yapılmaktadır.
Bu çalışmalar arasında, örneğin entropi, enerji ve varyans [16, 18, 21] ile çeşitli
özniteliklerin solunum sesinden ayıklanır ve KS bölümlerinin yerleri, daha sonra bu
özniteliklerin genliği belirli bir eşik değerleri ile kıyaslanması ile tespit edilir. Çeşitli
öznitelik türleri arasında, Shannon entropi özelliği kalp sesi bileşenlerinin tespiti için
diğer özellikler arasında en doğru ve sağlam bir özellik olduğunu göstermiştir [21].
Eşik tabanlı yöntemler, basit ve kolay hesaplanabilir olmalarına rağmen, gürültü ve
aykırı değerlere karşı çok güçlü değildirler. Çünkü bu tür algoritmaların etkili bir
öğrenme mekanizmaları yoktur ve bu algoritmalar analiz edilen sinyalin zamansal
bilgilerini kullanmıyorlar. Bu sorunların üstesinden gelmek için ilk çalışmamızda, KS
algılama iyi bilinen ve yaygın olarak kullanılan FCM algoritması ile gerçekleştirilir ve
solunum sesi, kalp sesinin olduğu ve kalp sesinin olmadığı iki farklı sınıfa ayrılmıştır
[19]. Bu çalışmada herhangi bir etiketli eğitim verileri kullanılmamıştır. Böyle bir
istatistiksel analiz bütün göğüs sinyali sınıflandırılıncaya kadar devam eder. Ayrıca
FCM algoritmasının, performansını artırmak için karar mekanizmasında sadece mevcut
analiz çerçeveleri değil, aynı zamanda etrafındaki çerçeveleri de göz önünde
20
bulundurarak modifiye edilebilir olduğunu göstermektedir. Böyle bir yaklaşım, geniş bir
zaman aralığı içinde FCM algoritmasının bir uygulanması olduğundan dolayı bu yeni
yaklaşıma zamansal (temporal) FCM (TFCM) algoritması olarak adlandırıldı. TFCM
algoritması, mevcut çerçeve etrafında ki komşu çerçeveler hakkında verilen kararları
homojen tutmak için zamansal kısıtlamaları dikkate alan ek bir ceza modifiye fonksiyon
terimi kullanılmıştır. Böyle bir geliştirme doğrudan TFCM algoritmasına ait üyelik
fonksiyonlarının ve küme merkezlerinin güncellemesini sağlamakta ve kalp seslerinin
yerlerini bulma performansını artırmaktadır.
3.2.2. Özellik çıkarma ve düzgünleştirme
Bu bölümde iki tür özellik: entropi [37] ve logaritmik enerji ve onların
düzgünleştirilmiş halleri kullanıldı.
3.2.2.a. Logaritmik enerji özelliği
İlk başta solunum sesi 20 ms çerçevelere uzunluğunda ve yandaki çerçeveyle %50
örtüşmeyle bölünür ve her bir çerçeve için logaritmik enerji aşağıdaki gibi hesaplanır.
1 N
2
E  k   ln   s  k , i   ,
 N i 1

, k’inci çerçevenin logaritmik enerjisi olarak hesaplanır ve
(3.35)
solunum sesi ve
N çerçevedeki örnek sayısıdır.
3.2.2.b. Entropi özniteliği
Literatüre de anlatıldığı gibi KS lokalizasyon görevler için Shannon entropi özelliği
güçlü bir özelliktir. Bu nedenle, solunum sesinin her çerçeve için olasılık yoğunluk
fonksiyonu parametrik olmayan, normal çekirdek tahmini [21, 25] kullanarak
21
hesaplanarak, Shannon entropi özelliğini nasıl hesaplandığı Bölüm 3.1.3’de verilmiştir
hesaplanmıştır.
3.2.2.c. Öznitelik değerlerinin düzgünleştirilme işlemi
Deneysel sonuçlar, KS lokalizasyon işlerinde düzleştirme işlemi çok faydalı olduğunu
göstermektedir. Bu nedenle bu çalışmada elde edilen özeliklerin düzgünleştirilmiş
sürümü aşağıdaki gibi elde edilmektedir. Düzleştirme aşaması sıfır-fazlı kesim frekansı
12 Hz ayarlanmış alçak geçiren filtre ile gerçekleştirilmiştir. Filtresi olarak İkinci
dereceden Butterworth IIR filtre kullanılmıştır. Sıfır faz için, filtreleme ileri doğrultuda
gerçekleştirilir; filtrelenmiş dizi daha sonra ters çevrilip ve aynı filtreden geçirilerek geri
çalıştırılır.
3.2.3. FCM lokalizasyon metodu
FCM Algoritması [38], iyi bilinen kümeleme algoritmalarından biridir ve etkili bir
şekilde çok sayıda sınıflandırma uygulamalarında kullanılan bir yöntemdir [19, 39-41].
FCM Algoritması bir karesel amaç fonksiyonunu minimize ederek nesne verilerini
istenilen sayıda kümelere ayırır. Bu çalışmada, öncelikle FCM algoritması kullanılarak
solunum sesi içerisinde KS sinyalinin tespiti incelemiştir. FCM algoritması yararlı bir
kümeleme metodu olmasına rağmen olumsuz bir yönü de vardır; o da çerçeveleri
sınıflandırmak için herhangi bir zamansal bilgi kullanmaksızın sadece analiz altındaki
çerçeveleri dikkate alarak gerçekleştirmesidir. Solunum sesine ait veriler, zamansal
alanda önemli ipuçları taşır ve komşu çerçeveler birbiriyle yüksek oranda ilişkilidirler.
Dolayısıyla bu çalışmada, FCM algoritmasını geliştirip sınıflandırma yaparken
zamansal bilgileri kullanarak aynı küme içine benzer özelliklerin toplaması sağlanır.
FCM algoritmasının maliyet fonksiyonunu aşağıdaki şekilde verilmektedir.
22
 c m
2

 uik xk  vi ,
k 1  i 1

N
minimize
U ,V
c
K.S.
u
i 1
ik
k 1,..., N  ,
 1,
(3.37)
2
 x j  vi  m1
U ij   
 ,
k 1  x j  vk 


c


U  uij , uij   0,1 ,  uij  1, 1  i  c  ,
i 1


c
 u 
N
Vi 
j 1
N
m
ij
 u 
j 1
(3.38)
xj
m
,
(3.39)
ij
Burada U ij ve Vi sırasıyla üyelik fonksiyonları ve küme merkezlerini göstermektedir.
3.2.4. TFCM lokalizasyon metodu
FCM lokalizasyon metodunun görüntü sınıflandırma performansını artırmak için
Chuang ve ark. [42] FCM algoritmasının üyelik fonksiyonunu değiştiren yeni bir
yöntem tanıtmışlardır. Bu yöntemde, komşu pikseller üyelik fonksiyonunun
hesaplanmasını etkilemektedirler. İlk çalışmamızda [19], benzer bir yaklaşım
kullanarak, kalp çerçevelerinin zamansal tutarlılığını artırmak için üyelik fonksiyonunu
geliştirdik ve bu yöntemi TFCM algoritması olarak adlandırdık. Homojen bir bölgede
(KS veya non-KS) zamansal bilgiler kullanılarak sadece orijinal üyelik fonksiyonu
kuvvetlendirilir ve kümeleme sonuçları değişmeden kalır. Fakat KS ve non-KS sınırı
arasındaki bir çerçeve için, onun komşu çerçevelerini etiketleyerek kümenin ağırlığını
azaltır. Bu çalışmada, eski amaç fonksiyonu içine bir zamansal kısıt terimi ekleyerek
önerilen TFCM algoritması değiştirilmiştir. İlk çalışmamıza göre bu yeni amaç
fonksiyonu kullanmanın en önemli avantajı, her iterasyon adımında doğrudan üyelik
23
fonksiyonları ve küme merkezleri geliştirilmektedir ve bu değişim daha iyi
sınıflandırma performansı elde etmeyi sağlamaktadır. TFCM yöntemin özeti Çizelge
3.1’de verilmiştir
N
minimize
U ,V
c

 uikm xk  vi 
2

k 1 i 1
c
K .S .  uik  1,
N
c
 uikm
k 1 i 1
k 1

n  k 1
xn  vi
2
(3.40)
k 1,..., N  ,
i 1
{
Ki
üyelik matrisini ve
}
} küme merkezlerin
{
göstermektedir. | | ise pencere uzunluğunu göstermektedir. m, her bulanık üyelik
üzerindeki ağırlık değeri göstermektedir.
ve
’inci iterasyondaki üyelik fonksiyonu
’inci iterasyondaki küme merkezleri
 k l

t  2
x

v

xn  vit 

j
i
c 
 n  k l
uikt    
2
 k l
t 
j 1 
x

v

xn  vjt 

j
j

 n  k l

k , p  1,..., N  , i  1,..., c .
 
n
vit 1 
k 1
uikt 
m


 xj 


k l
x
n  k l
1      uikt  
i  1,..., c .
n
m
n
aşağıda verilmektedir.
1
 m1

 ,
2


2
(3.41)


,
k 1
(3.42)
3.2.5. Önerilen yöntemin ilklendirilmesi ve sonuç kararları
FCM bazlı sınıflandırma algoritmalarından hızlı ve doğru sınıflandırma performansı
elde etmek için küme merkezlerini iyi bir başlangıç noktasından başlatmak
gerekmektedir [43, 44]. Önerilen çalışmada KS lokalizasyon metodu FCM
algoritmasına bağlı olduğundan, iyi bir başlangıç noktasından başlaması avantajlıdır. Bu
24
nedenle, eşikleme özelliğine dayalı entropi yöntemi [21] kullanılarak önerilen
algoritmalar başlatılmıştır. Solunum sesine ait bir çerçevenin özellik değeri belirli bir
eşik değerini aştığında KS çerçevesi olduğuna karar verilir, aksi takdirde non-KS
çerçevesi olarak adlandırır. Bu sınıflandırma sonuçlarına göre, önerilen yöntemlerin ilk
küme merkezleri oluşturulur. Başlatma yöntemin özeti Çizelge 3.2’de verilmiştir. FCM
bazlı sınıflandırma algoritmaları yumuşak sınıflandırma yöntemi olarak bilinir, diğer
yönden üyelik seviyelerine göre her çerçeve iki kümelere (KS ve non-KS) aittir.
Yumuşak sınıflandırma sonuçları sabit sınıflandırma sonuçlarına dönüştürülebilir.
Solunum sesinin her bir çerçevesi için hesaplanan üyelik fonksiyonlarından (3.40) biri
alınır ve belirli bir eşik değeriyle karşılaştırılarak farklı kümeler halinde sınıflandırılır.
Bulanık üyelik derecesi belirli bir eşik değerini aştığında KS çerçevesi olarak karar
verilir, aksi takdirde kalp olmayan ses çerçevesi olarak adlandırılır.
Çizelge 3.1. Önerilen TFCM algoritmasına dayalı kalp sesi lokalizasyonu
TFCM algoritması
Başlatma:
Adim 1: Küme merkezleri başlat ve t  0 , c  2 ,
ve l  4 ayarla.
Özyineleme:
Adim 2: t  t  1
Adim 3: Üyelik fonksiyonları hesapla.
Adim 4: Kümelerin merkezlerini yenile
Adim 3: Eğer V t 1  V t    iterasyonu durdur. Aksi takdirde, Adım 2 e git.
Sert sınıflandırma:
Eğer Üyelik değerleri sabit bir eşik değerinden büyükse KS e karar ver, aksi takdirde
non-KS karar ver.
25
Çizelge 3.2. Önerilen algoritmaların ilklendirilmesi
Adim 1: Solunum sesinde bir parça alır ve çerçevelere bölünür.
Adim 2: Her çerçeve için öznitelik değerleri hesaplanır.
Adim 3: Hesaplanan her çerçevenin öznitelik değerlerinin ortalama ( ) ve standart
sapma ( ) değerleri hesaplanır.
Adim 4: Eşik değerini    2 olarak seçilir.
Adim 5: Eğer öznitelik değerleri hesaplanan eşik değerinden büyükse KS e karar
verilir, aksi takdirde non-KS olarak karar verilir.
Adim 6: Kümelerin merkezlerini bu değerlerine göre hesaplanır.
3.3. Olabilirlik Oranı Testi (LRT) ile Birlikte Maksimum a Posterior Adaptasyon
Esas Alan Yöntem
Bu bölüm de akciğer sesleri içerisindeki kalp seslerinin yerleri olabilirlik oranı testine
(LRT) dayalı bir yöntem ile bulunmaktadır. Her bir hipotez GKM ile modellerin ve
modellerin parametreleri test kişisinden veriler geldikçe uyarlanır ve bu sayede kişiden
bağımsız modellerden kişiye bağımlı modeller elde edilmeye çalışılır. Önerilen
yöntemin ana blok diyagramı Şekil 3.2’de gösterilmektedir. Bu şekilden görüldüğü gibi,
amaçlanan yöntem iki ana aşamadan oluşmaktadır: eğitim ve test. Eğitim aşamasında,
öznitelik seti solunum seslerinden çıkartılır ve başlangıç model parametreleri iterative
maksimum olabilirlik (EM-ML) algoritması kullanılarak mevcut eğitim verilerinden
öğrenilir. Test aşamasında, algoritma çevrimiçi durumda 2 s uzunluğunda test verisini
alır. Öznitelik çıkarma aşamasından sonra, kalp sesleri (KS) başlangıç model parametre
setiyle tespit edilir. Amaçlanan yöntemin test aşaması, gözlemlenen test verilerini
kullanarak başlangıç model parametrelerini uyarlama yeteneğine sahiptir. Uyarlama
aşaması EM algoritmasına bağlı MAP yaklaşımıyla gerçekleştirilir. Önerilen yöntemin
ana aşamaları aşağıdaki bölümlerde detaylı olarak açıklanmaktadır.
26
3.3.1. Öznitelik çıkarma
Solunum sesi 20 ms lik pencere uzunluklarında birbirleri ile %50’si örtüşecek şekilde
çerçevelere bölünür ve her çerçevenin enerjisi aşağıdaki formül yardımıyla hesaplanır.
1 N
2
zk  ln   s  k , i   ,
 N i 1

Burada
,
çerçeveye ait logaritmik enerjiyi ifade eder,
solunum sesidir ve N çerçevenin uzunluğudur.
(3.43)
çerçeve içerisindeki
27
Şekil 3.2. Önerilen yöntemin ana blok diyagramı
28
Bu çalışmada, çıkarılmış öznitelik değerleri üzerinde aşağıda anlatıldığı gibi
düzgünleştirme (smoothing) yapılmıştır. İlk olarak kesim frekansı 12 Hz olan sıfır fazlı
alçak geçiren (Butterworth IRR) filtre kullanılmıştır. Sıfır faz için, filtreleme işlemi önce
ileri yönde gerçekleştirilir daha sonra filtrelenen kısım terslenir ve aynı filtreleme işlemi
tekrar uygulanır. Ortalama akış hızındaki solunum ses parçası ve çıkarılan logaritmik
enerji özniteliği (düzgünleştirilmiş versiyonu ile birlikte) sırasıyla Şekil 3.3(a) ve Şekil
Genlik
3.3(b) ile gösterilmektedir.
Genlik
Zaman
Çerçev
e
Şekil 3.3. Orta akış hızındaki solunum ses parçası ve uygun logaritmik enerjiye
(düzgünleştirilmiş versiyonu ile birlikte)
3.3.2. Olasılık modellerin tanımlanması
Bu çalışmada, KS belirleme işlemi varsayım test etme problemi olarak tanımlanmıştır.
Bu amaçla

H0 ve H1 varsayımı aşağıdaki gibi tanımlanmıştır [45, 46].
H0 : Ölçülen solunum sesleri sadece akciğer sesi içerir (non-KS).
29

H1 : Ölçülen solunum sesleri akciğer sesiyle beraber kalp sesi de içerir (KS).
Önerilen yöntemde
H0 ve H1 varsayımlarının olasılık yoğunluk fonksiyonları sırasıyla
pzk |H0 .| H 0  ve pzk |H1 .| H1  olarak ifade edilmektedir. Varsayımların olasılık
yoğunluk fonksiyonlarının şeklini tahmin etmek için, solunum sesinden elde edilen
logaritmik enerji özniteliğinin histogramı incelendi. Örnek olarak Şekil 3.4’de veri
tabanımızda bulunan bir kişinin soluk sesine ait KS ve non-KS kısımlarının histogramı
gösterilmektedir. Bu şekilden KS ve KS olmayan kısımların dağılımının çoklu model
dağılım şekline sahip olduğu gözlemlenmiştir.
Şekil 3.4. KS ve non-KS çerçevelerin histogramları ve tahmin edilmiş GKM pdf’leri
Bu yüzden bu çalışmada her varsayım için olasılık yoğunluk fonksiyonları
pzk |H0 .| H 0  ve pzk |H1 .| H1  GKM kullanılarak aşağıdaki gibi modellenmiştir [4749].
30
p zk | H j  z k | H j 
p  zk | i, H j 
Mj
 p  z
i 1
ij
k
| i, H j 
j  0,1
N  zk ; ij , vij  formülü ortalaması
Gauss bileşenini ifade eder.
(3.44)
ve varyansı
olan j. modelinin tek
parametresi j modelin i Gauss karışım yoğunluğunun
ağırlığını ifade eder.
3.3.3. Başlangıç model parametrelerinin belirlenmesi
Önceki bölümde açıklandığı üzere, her varsayımın olasılık yoğunluk fonksiyonu bir

GKM ile modellenir. j. model için parametre seti  j   ij , ij , vij

Mj
i 1
ile ifade edilirken,
M j , j modeldeki karışım bileşenlerinin sayısını göstermektedir. Varsayılan iki model
için toplam parametre seti   0 , 1 denklem (3.45) ile ifade edilir:

   i 0 , i 0 , vi 0 i 10 ,  i1 , i1 , vi1i 11
M
M

(3.45)
Bu çalışmada,  maksimum olabilirlik (ML) yöntemi ile aşağıdaki gibi tahmin edilir.

ML
 arg max p  Z | 

(3.46)
Burada Z veri tabanında bulunan eğitim verisini göstermektedir. Denklem (3.46)’nın
maksimizasyonu EM algoritması yardımıyla bulunur [50].
3.3.4. LRT ile kalp sesine ait kısımları tespit etme
Her iki varsayıma ait model parametreleri biliniyor ise optimum karar mekanizması
aşağı verilen olabilirlik oranı hesaplanması ile elde edilir [51].
31
 zn  
Burada
pzk |H1  zn | H1   

pzk |H0  zn | H 0   
kabul H1
ret H 0
n. andaki öznitelik değerini göstermektedir.
(3.47)
ise önceden tanımlanmış eşik
değeridir. LRT’nin tanımı istatiksel test içerisindeki gözlemlerin birleştirilmesi ile
kolaylıkla genelleştirilebilir. Bu durum karar mekanizmasının performansı ve sağlamlığı
artırır. Çoklu gözlemlerle beraber LRT’nin genelleştirilmesi şu şekilde yapılır:
gözlemlenen
Z n etrafındaki kayan pencere içerisinde 2m 1 gözlemden oluşturulmuş
Zn,m ifadesi aşağıdaki gibi tanımlanırsa
Zn,m  znm ,..., zn ,..., znm .
burada
(3.48)
pencere uzunluğunun yarısını göstermektedir. Çoklu gözlemlerle birlikte LRT
denklemi aşağıdaki gibi tanımlanır.
pzn ,m |H1  Zn,m | H1 
Z   p
n,m
zn ,m | H0
Z
n,m
| H0 
(3.49)
zn  Zn,m olmak üzere her gözlemin bağımsız olduğunu varsayılırsa, bu durumda
denklem (3.49) düzenlenerek (3.50) elde edilir:
pzk |H1  zk | H1 
nm
Z   
n,m
k n m
p zk | H 0  z k | H 0 
(3.50)
Denklemin her iki tarafının logaritması alınırsa denklemin yeni hali aşağıdaki gibi olur.
ln,m 
nm

k n m
ln
pzk |H1  zk | H1 
pzk |H0  zk | H 0 
(3.51)
32
Bununla beraber, eğer   k | H j  ve   k  denklem (3.52 ve 3.53)’de verildiği gibi
tanımlanırsa:

  k | H j  ln pz |H  zk | H j 
k
j

j  0,1
  k    k | H1     k | H 0 
(3.52)
(3.53)
Denklem (3.51) aşağıdaki gibi yazılabilir.
ln,m 
nm
   k .
(3.54)
k nm
Sonuç olarak, çoklu gözlem kullanılarak LRT ye dayalı karar mekanizması aşağıdaki
gibi ifade edilir.
 
ln,m 
 
n 'inci çerçeve HS dir
n 'inci çerçeve non-HS dir
(3.55)
3.3.5. EM-MAP’e dayalı başlangıç parametrelerinin çevrimiçi adaptasyonu
Genellikle, eğer yeterince eğitim verisi varsa kişiye bağımlı modeller kişiden bağımsız
modellerden daha iyi performansı sağlar. Bununla beraber yeterli sayıda kişiye bağımlı
eğitim verisi elde etmek genellikle zordur. Bazı durumlarda, bir kişiye ait yeterince
eğitim verisi yoktur. Bu yüzden, eğitim aşamasında kişiden bağımsız mevcut verileri
kullanmak zorunlu olur ve bu veriler, olabilecek bütün kişi varyasyonlarını
kapsamalıdır. Eğer eğitim modelleri ve test edilen kişi modelleri arasında uyumsuzluk
olursa modeller ile elde edilen performans azalır. Yapılan çalışmada bu zorluğun
üstesinden gelmek için, çevrimiçi olarak çalışan etkili bir adaptasyon algoritması
33
geliştirmeyi amaçlandı. Amaçlanan adaptasyon işlemi aşağıda verilen gerçekçi
varsayımlara bağlıdır:
1.
İlk olarak, test işlemi yapılacak kişi için yeterince eğitim verisi olmadığı, ve diğer
kişilere ait eğitim verileri Z Train ve bu verilere ait etiket verileri S Train ’nin var olduğu
varsayılır.
2.
İkinci olarak test edilecek kişiden alınan yaklaşık 2 s uzunluğunda test verisi Z Test
`nin mevcut olduğu varsayılır.
Bu varsayımlar altında, önerilen adaptasyon işleminin adımlar aşağıdaki gibi olur.
Yaptığımız ilk kabule göre, kişiden bağımsız (SI) etiketli eğitim verilerine elimizde
mevcut ve SI-GKM’leri (KS ve non-KS solunum kısımları için) bu verileri kullanarak
EM–ML algoritması ile eğitilebilir.  Pr bütün başlangıç parametrelerini ifade etsin.
İkinci varsayıma göre, yaklaşık 2 s uzunluğunda hedef kişiye ait Z Test test verilerinin
çok az bir kısmına sahibiz ve bu test verileri KS kısımlarının yerlerini tahmin etmek ve
başlangıç model parametreleri adapte ederek amaçlanan kişi model parametrelerine
benzetmek için kullanılır. Bu şartlar altında, S
Test
test verileri için KS kısmının yeri
başlangıç SI model parametreleri  Pr kullanılarak tahmin edilebilir.
Aslında bu tahmin edilen KS verileri kullanılarak EM-ML algoritması tarafından
hedeflenen kişinin SD model parametreleri tahmin edilebilir. Ancak hedeflenen kişi
verilerinin Z Test çok az bir kısmının burada kullanıldığı için kişiye ait SD model
parametrelerin eğitimi iyi bir şekilde yapılamayacak ve S
Test
içerisinde bazı yanlış
etiketlemeler olacaktır. Bu zorluğun üstesinden gelebilmek için, hedeflenen kişi model
parametreleri MAP tahmin işlemi tarafından tahmin edilir. Bu işlem bizim
durumumuzda olduğu gibi yeterince eğitim verisi olmadığı zamanlar için çok
kullanışlıdır. MAP’e bağlı parametre tahmini aşağıda gösterildiği gibidir [52].
34

MAP
 arg max p   | Z 

(3.56)
 arg max p  Z |   p   

Bu çalışmada hedef kişinin model parametreleri (MAP adaptasyonu olarak bilinen)
uyarlanmış MAP tabanlı parametre tahmin işlemi ile tahmin edilir. Modifiye
aşamasında kişiden bağımsız (SI) başlangıç model parametresleri  Pr bir önceki model
olarak kullanılır ve kullanılan bu önceki model, Z Test test verilerinden yeterli
Ml
Ml
Ml
istatistiklerin çıkarılması aşağıdaki gibi yapılır.  i ,  i ve vi
sırasıyla hedef kişiye ait
modelin i. karışımı (KS ve kalp sesi olmayan) için ağırlık ortalama ve varyans ile ilişkili
yeterli istatistikler olduğu varsayılırsa bu değerler aşağıdaki gibi hesaplanır.
Ml
i 
1 K
  ik ,
K k 1
(3.57)
K
Ml
i 

k 1
K

k 1
K
Ml
vi 
z
ik k
(3.58)
,
ik

k 1
K

k 1
Denklemlerde yer alan,
.
Ml 2
  ik zk   i
(3.59)
ik
 ik
modelin i karışımına ait sorumlu olasılıktır. Z Test

Ml
Ml
Ml
Ml
verilerinden yeterli istatistiklerin tahmini yapıldıktan sonra    i ,  i , vi

Mj
i 1
,
adapte edilmiş model parametreleri, test verilerinden tahmin edilen model parametresi
 Ml ve başlangıç model parametresi  Pr ’nin kombinasyonu ile bulunur. Kişiden
35
bağımsız adaptasyon (ASI) parametreleri modelin i. karışımı için aşağıdaki formüller
kullanılarak tahmin eder.
Adp
 i  i  1  i   i ,
(3.60)
Adp
 i  i  1  i   i ,
(3.61)
i
i
Adp
vi
Ml
Pr
Ml
Pr




Adp
Ml 2 
Adp
Pr 2 
 Adp
 Pr
  i vi   i   i   1   i  vi   i   i  .




i
Denklemlerde yer alan
(3.62)
önceki ve yerel parametrelerin katkısını dengelemek için
kullanılan ağırlık faktörüdür ve denklem (3.63) ile ifade edilir:
K
i 

k 1
K

k 1
ik
,
(3.63)
ik
, r
Burada r sabiti uygunluk faktörüdür. (3.57-3.63) ile verilen formüller çevrimiçi
adaptasyon formülleridir ve daha anlaşılır olması için iterasyon terimi kullanmaksızın
basitleştirilmiştir. Amaçlanan algoritmanın tam versiyonu çevrimiçi çalışır ve
adaptasyon işlemi sırasında, SI model parametreleri zamanla ASI model parametrelerine
dönüşür. Dolayısıyla parametreler zamanla hedef kişinin SD modeline daha yakın olur.
Algoritmanın tam versiyonu EM-MAP olarak adlandırılır ifade edililir ve Çizelge
3.3’de verilmiştir.
36
Çizelge 3.3. Önerilen algoritmaların adımları
Giriş: Başlangıç parametrelerin girilmesi
̂
{
}
{
Başlatma: Verilen veriler
̂
{
}
}
{
}
, başlangıç olabilirlik
karışım bileşenlerinin sayısı
başlangıç parametreler
} Maksimum iterasyon sayısı MIterNum=2
{
ve uygunluk faktörü r=15.
Adaptasyon Özyineleme: Adım 1: t=t+1
,̂
Adım 2: Test verilerinin etiketlerinin
{̂
Adım 3: Verilerin olasılığının hesaplanması
Adım 4: Eğer (
̂
} tahmin edilmesi
|̂
(
̂
)
veya (IterNum=MIterNum) Adım 9 git
)
Adım 5: IterNum = IterNum+1.
Adım 6: ̂
Adım 7: Her
iki sınıflar ayrı
bakarak
{
} ve
{
{
}̂
{
} ve
{
}
E-Adım: Posterior olasılıkların tahmini
tahmin edilmesi
̂
(|
)
M-Adım: Yeni parametre değerlerinin tahmini.
Kj

Ml ( t )
ij
Kj
1

Kj

k 1
Ml ( t )
(k )
ijk
,  ij


k 1
Kj
(k ) j
ijk k
z

k 1
Kj
v
Ml ( t )
ij


k 1
(k )
ijk
Ml ( t )
( z   ij
j
k
Kj

k 1
(k )
ijk
,
(k )
ijk
Kj
)

2
,  ijMl (t ) 
}
k 1
Kj

k 1
A-Adım: Yeni uyarlanmış parametre değerleri tahmin.
(k )
ijk
(k )
ijk
,
r
37
Adp ( t )
 ij
Adp ( t )
vij
Ml ( t )
 ijMl (t )  ij
 ijMl (t ) vij

Ml ( t )


Pr( t )
 1   ijMl (t )  ij
Adp ( t )
 (  ij
Ml ( t )
  ij
Adp ( t )
,  ij
̂
ve Adım 1 git.
Adım 9: Dur.
Çıkışı: Nihai parametre seti ̂


Pr( t )
 1  ijMl (t )  ij
,
Adp ( t )
Pr( t )
Pr( t )
)2   1  ijMl (t )  vij  (  ij
  ij )2  ,



Endin bitişi
Adım 8: ̂
Ml ( t )
 ijMl (t )  ij
ve etiketleri ̂
38
4. ARAŞTIRMA BULGULARI
4.1. Veri tabanı
Bu çalışmada kullanılan veri tabanı, solunum problemi olmayan 3 yaş grubu [6-15],
[15-25] ve [25-50] olmak üzere 8’i kadın 24 sağlıklı kişiden alınan solunum seslerinden
oluşmaktadır. Çalışma Atatürk Üniversitesi Sağlık Bilimleri Enstitüsü Etik Kurulu
tarafından onaylanmıştır. Deneyler yapılmadan önce bütün katılımcılar kabul formunu
imzalamıştır. Solunum verileri bir kontak mikrofondan (TSD108, Biopac) elde edilen
seslerin amplifikatör (DA100C, Biopac) ile yükseltilmesi ile kaydedildi. Kayıt
esnasında mikrofon sağ akciğer üst lob da 2. ve 3. kaburga boşlukları arasına
yerleştirilmiştir. Solunum sesi ile birlikte eşzamanlı olarak solunum akış miktarı ve
elektrokardiyografik sinyallerde TSD117 (Biopac) ve ECG100C (Biopac) cihazları
yardımıyla kayıt edilmiştir. Bütün kişiler orta hava akış hızlı veriler için [7.5–15]
ml/s/kg ve düşük akış hızlı veriler için 7.5 ml/s/kg’dan az solunum yapmaları hakkında
bilgilendirilmiştir. Her kayıt ortalama 20 s sürmektedir. Kayıt işlemleri sırasında, sabit
koşulları sağlamak için bütün kişiler bir sandalye üzerinde sabit olarak oturtulup nefes
almaları istenmiştir. Ayrıca bir burun klipsi kullanılarak burun yoluyla havanın kaçması
engellenmiştir.
4.2. Veri tabanının etiketlenmesi
Önerilen algoritmanın performansını ölçmek için, yukarıda anlatılan veri tabanındaki
kalp seslerinin yerleri el ile belirlenir. Veri tabanın el ile etiketlenmesi bir kardiyolog
kontrolünde eğitimli 3 kişi tarafından dikkatlice incelenerek yapılmıştır. Etiketleme
Wavesurfer [23] ara yüzü kullanılanılmıştır. S1 kalp atışlarının başlangıç sınır yerleri
için ECG dalga formunda R-tepe yerleri kullanılmıştır. Diğer sınırlar solunum sesini
dinleyerek, spektrum ve zaman dalga formunda inceleme yapılarak bulunur. Örneğin,
solunum sesinin küçük bir kısmı için spektrum ve ECG dalga formu Şekil 4.1’de
39
gösterilmiştir. El ile etiketlenmiş sınırlar (dikey kırmızı çizgiler) solunum sesi, spektrum
Genlik
ve ECG dalga formu üzerine bindirilmiştir.
Genlik
(a)
Ferekans
(b)
(c)
Zaman
Şekil 4.1. (a) Solunum sesinin küçük bir kısmı (b) ve (c) ECG ve spektrum dalga formu
4.3. Performans değerlendirmeleri ölçütleri
4.3.1. Ortalama hata ölçütleri
Yöntemlerin performansını ölçmek için, dört sayısal sonuç hesaplanmıştır: (1) doğrupozitif (TP) KS çerçeveleri algoritma tarafından doğru tespit edildiğinde; (2) doğrunegatif (TN) non-KS çerçeveleri algoritma tarafından doğru tespit edildiğinde; (3)
40
yanlış-negatif (FN) KS çerçeveleri algoritma tarafından bulunamamışsa; (4) yanlışpozitif (FP) non-KS çerçeveleri algoritma tarafından KS olarak algılandığında
hesaplanır. Önerilen algoritmaların genel performansını değerlendirmek için, FNR ve
FPR değerleri aşağıdaki gibi hesaplanır.
FNR 
FN
100
TP  FN
(4.1)
FPR 
FP
100
TN  FP
(4.2)
FN ve FP sırasıyla, yanlış negatif ve yanlış pozitif çerçeve sayısını göstermektedir. TN
ve TP sırasıyla, doğru negatif ve doğru pozitif çerçeve sayısını göstermektedir.
4.3.2. Hata algılama denge grafiği (DET)
Belli bir özel eşik değer altında elde edilen FPR ve FNR değerleri, literatürde kullanılan
KS bulma algoritmalarının [15, 21] performansını ölçmek için yaygın olarak
kullanılmaktadır. Fakat bu değerler yöntemleri karşılaştırmak için yeterli değildir,
çünkü belirli FNR ve FPR değerleri, sistemin performansını sadece seçilen eşik değeri
için hesaplanmıştır ve eşik değeri değiştirildiğinde sistemin performansı önemli ölçüde
değişmektedir [19]. Ayrıca, KS lokalizasyon işlerinde FNR ve FPR arasında bir tercih
söz konusu olabilir ve aynı zamanda sistemin performansını değerlendirmek için bu
tercihin sonuçlarını görmek istenen bir durumdur. Bu zorlukları aşmak ve yöntemleri
daha iyi karşılaştırmak için performans ölçüsü olarak DET eğrisini kullandık. Kalp sesi
lokalizasyonu işlerinde, KS bölgelerini bulmak non-KS bölgelerini bulmaktan daha
önemli olduğundan, Şekil 4.2’de görüldüğü gibi DET eğrisinin sağ alt tarafta bulunan
eğri üzerinde ki bir nokta (Örneğin C noktası) bir çalışma noktası olarak seçilir.
41
Şekil 4.2. Hata algılama denge grafiği
4.3.3. Geçen süre
Deneysel olarak her yöntemin hesaplama karmaşıklığını ölçmek için 20 saniyelik
sonulum sesi içerisindeki kalp seslerinin yerlerini bulmaya harcadığı süre, MATLAB
programının (R2011b-32bit-win32) tic ve toc fonksiyonları yardımıyla ölçülmüştür.
Ayrıca, yöntemlerin gerçek zamanlı performansını analiz etmek amacıyla bu süre
normalize edilerek normalize geçen zaman hesaplanmıştır. Normalize geçen süre, her
geçen süre 20 saniye bölünmesi ile hesaplanmıştır. Tüm deneyler aynı bilgisayarda
(Intel Core i7-2600 CP processer 3.4 GHz @, 16.0 GB RAM) ve aynı deney koşulları
altında yapılmıştır.
4.3.4. Önemlilik testi
Bu çalışmada kalp sesinin tespiti için kullanılan iki yöntemi karşılaştırmak için
önemlilik testi yapılmıştır [25]. Hangi yöntemin daha iyi performans sağladığını bulmak
42
için her bir yöntem den elde edilen DET eğrileri altındaki normalize edilmiş alanlar
karşılaştırılır. Bu çalışmada önemlilik testleri p  0.01 seviyesinde yapılmaktadır. Bu
testlerde, her kişi için bulunan NAUC değeri bağımsız bir örnek olarak
değerlendirilmiştir.
4.4. Entropi Sınırına Dayalı Yöntemin Deneysel Sonuçları ve Tartışması
Bu alt bölümde, Entropi sınıra dayalı önerilen yöntem ve literatürdeki çeşitli yöntemler
için elde edilen sonuçlar yukarıda anlatılan veri tabanı kullanılarak karşılaştırılmaktadır.
Bütün şekillerde ve çizelgelerde hesaplanan ortalama ve standart sapma değerleri, 20
deneğe ait verilerden elde edilmiştir. Literatürde [15, 21] olduğu gibi solunum sesi 20
ms pencere uzunluğu ile %50 örtüşme ile çerçevelere ayrılmış ve performans analizi
için solunum sesleri, düşük ve orta nefes hızlarında incelenmiştir. Daha iyi
değerlendirme ve karşılaştırma için, deneysel sonuçlar iki alt bölümlere ayrılmıştır. İlk
alt bölümde
arasındaki ilişkisi deneysel olarak incelenmiştir. İkinci
ve
alt bölümde ise, çekirdek tabanlı yöntem ve literatürde verilen diğer yöntemlerin
lokalizasyon performansları önerilen yöntem ile ayrıntılı olarak karşılaştırılmıştır.
4.4.1.
,
ve
arasındaki ilişki
Bu alt bölümde, (3.34)’de verilen
,
ve
arasındaki ilişkiler
deneysel olarak aşağıdaki gibi incelenmiştir.
4.4.1.a.
ve
arasındaki ilişki
Şekil 4.3(a) ve Şekil 4.3(b) sırasıyla, solunum sesi ve bu ses den elde edilen
ve
entropi değerlerini göstermektedir. Bu şekillerden gözlendiği gibi,
’nin arasında yüksek bir ilinti bulunmaktadır ve solunum sesinin bir çerçeve
ve
için
,
’nin bir üst bir sınır gibidir.
Genlik
43
Zaman
Genlik
(a)
Çerçeve
(b)
Şekil 4.3. (a) Solunum sesi düşük akış hızında (b) ilgili tahmini entropiler
(
,
)
Şekil 4.3(b)’nin 615 ve 650 çerçeveleri arasındaki bölge ayrıntılı incelemek amacıyla
büyültülerek Şekil 4.4(a) verilmiştir. Bu şekilde elde edilen gözlemler şunlardır
ve
birbirine çok yakın (örneğin, 635 çerçeve gibi) ve aynı zamanda birbirinden
uzak olabilirler (örneğin, 631th çerçeve gibi). Bu farklılığın nedenini incelemek için her
iki çerçevenin çekirdek ve Gauss tabanlı pdf tahminleri Şekil 4.4(b) ve Şekil 4.4(c)
verilmiştir. Bu şekillerden görülmektedir ki, şayet bir çerçevenin olasılık yoğunluk
fonksiyonu Gauss-benzeri bir dağılıma sahip ise, çekirdek ve Gauss-tabanlı pdf
tahminleri birbirine çok yakın ve ilgili tahmini entropiler birbirlerine benzerdir. Diğer
yandan, bir çerçevenin pdf`i Gauss-benzeri bir dağılıma sahip olmadığında, çekirdek ve
Gauss-tabanlı tahmini pdf’ler ve ilgili tahmini entropiler birbirlerinden uzak olabilirler.
Bölüm 3.1.6 de tartışılan teorik nedenlere göre, bu sonuçlar zaten beklenmektedir.
631’inci çerçevede,
ve
arasındaki fark çok küçük olmamasına rağmen,
eşik değer yaklaşık -1 nat seçildiğinde KS ve kalp olmayan sesler her iki entropi için
doğru olarak bulunabilir.
44
(a)
(b)
(c)
Şekil 4.4. (a) Tahmini entropilerin 615 ve 650 çerçeveler arasındaki aralığın yakın çekim (b) ve
(c) sırasıyla çekirdek ve Gauss tabanlı dağılımların pdf tahminleri 635 ve 631th çerçeveler için.
45
(a)
(b)
Şekil 4.5.
,
orta nefes seviyesi için
entropilerin arasındaki ilişki (a) düşük nefes seviyesi için (b)
Şekil 4.5(a) ve Şekil 4.5(b), sırasıyla veri tabanındaki tüm deneklerin
değerlerini
figürlerde,
entropi
karşı düşük ve orta solunum akış hızları için göstermektedir. Bu
ve
entropilerin arasındaki güçlü bir korelasyon ve lineer bir
ilişki açıkça görülmektedir. Pearson product-moment yaklaşımına göre korelasyon
46
katsayısı, düşük ve orta solunum akış oranları için, r = 0.99 olarak bulunmuştur. Ayrıca,
bu şeklerde teorik olarak (3.32)’de verilen
’nin üst ve alt sınır değerlerini
göstermektedir. Entropi veri noktaları (yaklaşık 40000 çerçeve) bu sınırlar arasına
düşmüştür. Teorik olarak bulgular teyit etmek için, tahmin edilen regresyon
fonksiyonları düşük ve orta solunum akış oranları Çizelge 4.1’de verilmiştir.
Çizelge 4.1.
arasındaki doğrusal ilişki
ve
Düşük
MC
H g  X   1.015  H kde
 X   0.22
Orta
4.4.1.b.
ve
MC
H g  X   1.012  H kde
 X   0.23
enropilerin korelasyon ve varyans analizi
Bu alt bölümde,
arasındaki korelasyon ve varyanslar deneysel
ve
olarak aşağıdaki gibi incelenmiştir. Şekil 4.6(a) ve Şekil 4.6(b) de verilmiş dağılım
grafikler,
ve
arasındaki ilişkiyi sırasıyla, düşük ve orta solunum akış
oranları için göstermektedir. Bu grafikleri gözlemleyerek, veri noktalarının rasgele
dağlımı ve dolayısıyla
ve
arasında oldukça zayıf bir ilişki olduğu
söylenebilir. Korelasyon katsayılarının sayısal ölçümleri, sırasıyla düşük ve orta
solunum akış oranları için, r = 0.13 ve r = 0.14 bulunmuştur. Şekil 4.7(a) ve Şekil 4.7(b)
de
,
ve
entropilerinin veri noktalarının histogramı sırasıyla,
düşük ve orta solunum veri hızları için gösterilmiştir.
47
(a)
(b)
Şekil 4.6.
,
orta nefes seviyesi için
Bu şekillerde
entropilerin arasındaki ilişki (a) düşük nefes seviyesi için (b)
ve
benzer dağılımları olduğu görülmektedir. Düşük ve
orta solunum akış oranlarında
arasındaki fark,
ve
dağılımının ortalaması hafifçe sağ taraf kaymasıdır ve bu kayma miktarı
’nin
’nin
ortalama değeri ile ilgilidir ve bu fark sırasıyla Şekil 4.7(a) ve Şekil 4.7(b)’de
gösterilmiştir. Bu kayma aynı zamanda
ve
arasındaki doğrusal ilişkinin
48
varlığını göstermektedir. Tüm verilerin düşük ve orta bölgelerinin dağılımla ilişki
sonuçlar Çizelge 4.2’de verilmiştir. Bu çizelgedeki ana gözlem,
ve
ortalamaları birbirinden biraz farklı olsa da, bunların varyansları birbirine çok yakındır.
arasındaki fark terimi
ve
Bu çizelgede, fark entropinin (
olarak Çizelge 4.2’de gösterilmiştir.
) varyansı
(yaklaşık yüz kat) görülmektedir. Çünkü
göre daha düşük olduğu
nin varyansı
göre daha
küçüktür ve bunların arasında zayıf bir ilişki vardır. Bu sebeple Bölüm 3.1.6’nin 3’üncü
gözleminde belirtilen tartışmaya göre, önerilen
benzer KS algılama
ve
performansları sağlamaktadır.
Çizelge 4.2. Tüm veriler için istatistiksel analiz sonuçları
Model
H
MC
kde
X
Hg  X 
MC
D
e
X 
Nefes seviyesi
Ortalama
Varyansı
Düşük
-1.89
1.20
Orta
-1.73
0.92
Düşük
-1.69
1.23
Orta
-1.53
0.96
Düşük
0.21
0.009
Orta
0.19
0.009
4.4.2. Önerilen yöntem ve diğer yöntemlerin karşılaştırılması
Önceki alt bölümler çekirdek yoğunluğuna dayalı
dağılımına dayalı
entropisi ve Gauss
entropinin nasıl benzer kalp sesi algılama performansları
sağladıkları ile ilgili bazı görüşler göstermiştiler. Bu alt bölümde ortalama algılama
hataları ve hesaplama karmaşıklığı açısından,
ve
’nin performansları
birbirleri ve literatürün diğer iki yöntemi SSA [16] ve CWT [14] ile karşılaştırılmıştır.
49
SSA, KDE ve CWT yöntemlerinin belirli parametreleri orijinal çalışmalarıyla aynı
Frekans
olacak şekilde seçilmiştir.
Entropi (nat)
Frekans
(a)
Entropi (nat)
(b)
Şekil 4.7.
,
orta nefes seviyesi için.
entropilerin histogramları (a) düşük nefes seviyesi için (b)
50
Çizelge 4.3. veri tabanındaki 20 kişiden elde edilen ortalama hatalarının yüzdesini
göstermektedir. Bu çizelge önerilen GE yönteminin ortalama FNR ve FPR hataları
sırasıyla, düşük solunum akış hızı için 1.45±1.50 ve 1.65±1.70 ve orta solunum akış hızı
için 1.98±1.81 ve 2.13±1.91 olduğu görülmektedir. Bu çizelgedeki değerlere göre GE,
SSA ve KDE metotlarının ortalama hataları birbirinden farklı olmasına rağmen, bu
farkın önemsiz olduğu görülmektedir. Dolayısıyla, ortalama algılama hatası açısından,
bu üç yöntemin benzer performansa sahip olduğunu görülmektedir.
Çizelge 4.3. Önerilen metottun ve diğer metotların ortalama ve standarda sapması düşük
ve orta nefes sevilerinde
Nefes seviyesi
Düşük
Orta
Metot
FNR
FPR
CWT
2.33 ± 1.73
2.85 ± 1.85
KDE
1.48 ± 1.54
1.68 ± 1.75
SSA
1.50 ± 1.52
1.72 ± 1.68
GE
1.45 ± 1.50
1.65 ± 1.70
CWT
4.72 ± 2.11
5.53 ± 2.18
KDE
2.01 ± 1.83
2.17 ± 1.92
SSE
1.96 ± 1.83
2.20 ± 1.87
GE
1.98 ± 1.81
2.13 ± 1.91
Ayrıca, CWT yöntemi tüm yöntemler arasında en yüksek lokalizasyon hatasını sahiptir.
SSA ve KDE arasındaki karşılaştırma benzer şekilde bir önceki çalışmada da
gösterilmiştir [15]. Bu çalışmada, düşük solunum akış hızında KDE ve SSA benzer
sonuç verdiği ve orta solunum akış hızında SSA’nin biraz daha iyi sonuçları verdiği
bulunmuştur. Ayrıca, CWT’nin KDE ve SSA göre daha büyük hata oranlarına sahip
olduğunu göstermiştiler. Çizelge 4.4’de hesaplama karmaşıklığı açısından önerilen
yöntemin ve diğer yöntemlerin 20s lik bir veriyi işlemede geçen süreleri göstermektedir.
51
Çizelge 4.4. Önerilen metodun ve diğer metotların geçen süre ve normalize geçen süre
sonuçları
Metot
Geçen süre
Normaliz geçen süre
CWT
0.12 ± 0.05
0.006
KDE
4.21 ± 0.79
0.260
SSA
1.32 ± 0.21
0.066
GE
0.05 ± 0.01
0.003
Bu çizelgeden, KDE ve SSA ortalama yüzde hataları benzer olmasına rağmen, KDE
için hesaplama maliyeti SSA göre önemli ölçüde daha yüksek olduğu görülmektedir.
KDE’nin ana hesaplama maliyeti, çekirdek yoğunluk tahmin yöntemine dayalı pdf
kestiriminden kaynaklanıyor. Ayrıca, SSA’nin GE göre oldukça yüksek hesaplama
maliyeti vardır. Sonuç olarak, GE metodu KDE ve SSA yöntemlerine göre oldukça
düşük bir hesaplama maliyetine sahiptir. [15]’de bildirildiği gibi, nispeten büyük yanlış
negatif hata vermesine rağmen, CWT tüm yöntemler arasında en düşük hesaplama
maliyeti vermektedir. Önerilen yöntemin ortalama 20 s lik veriyi ortalam hesaplama
süresi 0.05 s dir ve bu süre diğer yöntemlere göre önemli ölçüde daha düşüktür. Ayrıca,
hesaplama yükü açısından en iyi ikinci yöntem CWT dir ve 20 s veri parçası için geçen
zaman 0.12 s hesaplanmaktadır. Şekil 4.8 de ortalama FNR, FPR hatası ve geçen zaman
açısından
önerilen
yöntemi
diğer
uygulanan
yöntemlerle
karşılaştırılması
sunulmaktadır. Sonuçlar veri tabanındaki 20 kişi için verilmiştir. Şekil 4.8 den aşağıdaki
iki temel sonuç elde edilmektedir. İlk olarak, önerilen yöntemin FNR ve FPR açısından
CWT ye göre önemli ölçüde iyi performans sağlamakta ve önerilen yöntem KDE, SSA
ile benzer bir performans sağlamaktadır. İkincisi, önerilen yöntemin ortalama
hesaplama süresi diğer yöntemlere göre önemli ölçüde düşüktür.
52
Şekil 4.8. Önerilen ve diğer yöntemlerin FNR, FPR ve geçen süresi açısından
karşılaştırılması
4.5. Zamansal Bulanık C-Ortalamalar Yönteminin Deneysel Sonuçları ve
Tartışması
Bu bölüm deneysel sonuçların daha iyi değerlendirmesi ve karşılaştırması için iki alt
bölümlere ayrılmıştır: özellikleri ve yöntemleri karşılaştırma. Birinci alt bölümde, KS
lokalizasyonun performansı önerilen TFCM yöntemiyle logaritmik enerji, Shannon
entropi ve bunların düzeltilmiş sürümleri kullanılarak birbiriyle karşılaştırılmıştır. Bir
sonraki alt bölümde ise, önerilen yöntemlerin performansını doğrulamak ve
karşılaştırmak amacıyla, literatürde verilen QPM [22] ve SSA [15] yöntemleri bu
çalışmada uygulanmıştır. SSA ve QPM yöntemlerinin belirli parametreleri orijinal
çalışmalarında belirtildiği gibi seçilmiştir. Literatürde yer alan iki yöntemin
lokalizasyon performansı ayrıntılı olarak önerilen FCM ve TFCM yöntemleri ile
karşılaştırılmıştır.
4.5.1. Özellik karşılaştırması sonuçları
Şekil 4.9(a) ve Şekil 4.9(b) tüm hesaplanan özellikler için sırasıyla düşük ve orta
solunum akış hızlarında DET eğrilerini göstermektedir. Bu şekillere göre elde edilen ilk
53
sonuç, Shannon entropiye ait DET eğrisi sonuçları logaritmik enerjiye ait DET
eğrilerinden daha yüksek olmasıdır. İkincisi ise, düzgünleştirmiş özelliklerin (Shannon
entropi ya logaritmik enerji) DET eğrisi sonuçları düzgünleştirilmiş olmayan
özelliklerin DET eğrisi sonuçlarına göre önemli ölçüde düşük olmalarıdır. Bu DET
grafiklerinin kantitatif NAUC değerleri, sırasıyla düşük ve orta solunum akış hızındaki
Shannon
entropi,
düzgünleştirilmiş
logaritmik
enerji,
logaritmik enerji
düzgünleştirilmiş
için
Çizelge
Shannon
entropi
ve
4.5’de gösterilmektedir. Bu
çizelgelerden görüldüğü gibi, düşük ve orta solunum akış hızındaki düzeltilmiş
logaritmik enerji sırasıyla 0.0145 ve 0.0269 olarak en düşük NAUC değerlerine sahiptir.
Oysa düşük ve orta solunum akış hızındaki düzgünleştirmemiş Shannon entropi
sırasıyla 0.0675 ve 0.0782 değerleriyle en yüksek NAUC değerlerine sahiptir. Şekil
4.10’de solunum ses sinyalinin bir parçası logaritmik enerji özelliği ve düzeltilmiş
logaritmik enerji özelliği için gerçek KS sınırları ile birlikte gösterilmektedir. Bu
şekilde, düzgünleştirme işleminin nasıl kalp sesi lokalizasyonunun performansını
artırdığını göstermek için önemlidir. Daha iyi anlaşılması için, lokalizasyon işleminde
kullanılan basit eşikleme yöntemi ile kullanılır [21]. Bu şekillere göre, ayrıca logaritmik
enerji özelliğini düzgünleştirme olan düzgünleştirme olmayanlardan daha düşük FN ve
FP hata değerleri verdiğini gözlemleyebilirsiniz.
54
(a)
(b)
Şekil 4.9. TFCM tabanlı özellik karşılaştırması sonuçları
55
Şekil 4.10. (a) Solunum sesinin bir parçası düşük nefes sevisinde (b) ilgili parçanın logaritmik
enerji özeliği (c) logaritmik enerji özeliğine dayalı KS lokalizasyon sonuçları (d) düzetilmiş
logaritmik enerji özeliğine dayalı KS lokalizasyon sonuçları
56
Çizelge 4.5. Tüm özeliklerin NAUC değerleri TFCM algoritması için
Düşük
0.0675
Logaritmik
Enerji
0.0475
Orta
0.0782
0.0590
Entropi
Düzetilmiş
Entropi
0.0160
Düzetilmiş
Logaritmik enerji
0.0145
0.0290
0.0269
4.5.2. Yöntem karşılaştırması sonuçları
Önceki alt bölümlerde, logaritmik enerji ve Shannon entropi değerleri önerilen TFCM
yöntemiyle karşılaştırılmıştı. Bu alt bölümde ise amacımız, önerilen FCM ve TFCM
yöntemlerinin
performanslarını
literatürdeki
QPM
ve
SSA
yöntemleri
ile
karşılaştırmaktır. Önceki alt bölümlerde gösterildiği gibi, düzeltilmiş logaritmik enerji
özelliği TFCM yöntemi ile düşük ve orta solunum akış hızında diğer özelliklere göre
daha iyi sonuçlar verir. Bu nedenle FCM ve TFCM yöntemlerinin performansını bu
özelliği kullanarak QPM ve SSA yöntemleriyle karşılaştırmaya karar verilmiştir.
Şekil 4.11(a) ve Şekil 4.11(b)’de sırasıyla düşük ve orta solunum akış hızlarında ki
önerilen yöntemlerle (TFCM, FCM) QPM ve SSA yöntemleri için DET grafiklerine
dayalı genel performansları görülmektedir. Önerilen TFCM yönteminin DET değerleri
sonuçları diğer yöntemlerin DET değerlerinden oldukça düşüktür. SSA yönteminin ise
en yüksek DET eğrisi değerleri vardır. Diğer yöntemlerin (QPM ve FCM) DET eğrileri
bu iki eğri arasında kalır. Şekil 4.11(b)’de orta solunum akış hızı göz önüne alındığında,
orta akış hızında hatalar düşük akış hızına göre beklenildiği gibi daha yüksek olur. Buna
ek olarak, düşük solunum akış oranı ile elde edilen sonuçlara paralel olarak TFCM
yöntemi, orta solunum akış oranında da diğer yöntemlere göre daha iyi performans
gösterdiği görülmektedir.
57
(a)
(b)
Şekil 4.11. TFCM, QPM, FCM ve SSA yöntemlerin sonuçları (a) düşük (b) orta nefes
seviyelerinde
Kantitatif sonuçları karşılaştırmak amacıyla, DET grafiklerinin NAUC değerleri her
yöntem için hesaplanır. Çizelge 4.6’da sonuçlar gösterilmiştir. Bu çizelgeden da
görüldüğü gibi, TFCM yöntemi, sırayla düşük ve orta solunum akış oranları için 0.0145
ve 0.0269 arasında düşük NAUC değerlerine sahiptir. Bu çizelgeye göre SSA yöntemi
ise düşük ve orta akış oranları için en yüksek (0.0166 ve 0.0300) NAUC değerlerine
58
sahiptir. Kalan SSA ve FCM yöntemlerin performansı düşük ve orta solunum akış
oranları için NAUC değerlerine göre sırasıyla verilmiştir. SSA ve QPM yöntemleri için
performans değerleri sonuçları [8, 36]’da verilen sonuçlara benzerdir.
Şekil 3.11(a) ve Şekil 3.11(b), deki sonuçlar ve Çizelge 4.6’da verilen NAUC değerleri,
FPR değerlerine karşı FNR değerlerine çeşitli eşik değerleri için dikkate alınarak
verilmiştir. Aynı zamanda belirli bir FPR değer için FNR değerlerini incelemek
öğreticidir. Bu amaçla, sırası ile, düşük ve orta solunum akış oranı için FPR=%1.7
örnek bir nokta olarak seçilmiştir. Önerilen TFCM algoritmanın FNR değeri seçilen
FPR değerine göre arzu edilen bölgededir. Her yöntemin hesaplama karmaşıklığı
incelemek için, biz 20 s süreli solunum verisi için her yöntemin kalp seslerini bulmak
için harcadıkları süreyi hesapladık. Çizelge 4.9’da her yöntemin için ortalama geçen
süre ve normalize edilmiş ortalama geçen süre verilmiştir. Çizelge 4.7’de tüm yöntemler
için bu noktada FNR değerleri sırasıyla düşük ve orta solunum akışlarında
verilmektedir.
Çizelge 4.7’de görüldüğü gibi TFCM yönteminin ortalama FNR hataları sırasıyla,
düşük ve orta solunum akış hızı için 0.8±1.1 ve 1.5±1.4 dir, ve elde edilen sonuçlar bu
çalışmada en iyi sonuçlarıdır. TFCM yöntemin böyle bir performansı düşük ve orta
solunum akış hızları için bir sonraki rakibe göre (QPM yöntemi), %42 ve %25 gibi bir
iyileştirme anlamına gelir. Ayrıca, pratik uygulamalar için özel bir eşik değeri için
yöntemler genel performansı incelemek için de önemlidir. Bu amaç için, özel bir eşik
değeri olarak özelliklerin ortalaması ile standart sapmasının toplamı seçilir [8, 26, 33].
Bu eşik değeri için ortalama sonuçlar Çizelge 4.8’te verilmiştir. Bu çizelgede verilen
sonuçlara göre, önerilen TFCM yöntemi diğer yöntemlere göre düşük ve orta solunum
akış oranları için oldukça düşük FNR değerlerine sahiptir.
Çizelge 4.6. Tüm yöntemlerin NAUC değerleri düşük ve orta nefes seviyelerinde
Nefes seviye
SSA
FCM
QPM
TFCM
Düşük
0.0166
0.0163
0.0159
0.0145
Orta
0.0300
0.0294
0.0291
0.0269
59
Çizelge 4.7. Önerilen metottun ve diğer metotların ortalama ve standarda sapması düşük
ve orta nefes sevilerinde
Nefes seviyesi
Düşük
Orta
Yöntem
FNR
FPR
SSA
1.5 ± 2.0
1.7
FCM
1.5 ± 1.8
1.7
QPM
1.4 ± 1.2
1.7
TFCM
0.8 ± 1.1
1.7
SSA
2.7 ± 2.4
1.7
FCM
2.3 ± 2.0
1.7
QPM
2.0 ± 1.8
1.7
TFCM
1.5 ± 1.4
1.7
Çizelge 4.8. Önerilen metottun ve diğer metotların ortalama ve standarda sapması düşük
ve orta nefes sevilerinde
Nefes seviyesi
Düşük
Orta
Yöntem
FNR
FPR
SSA
1.8 ± 1.8
2.0 ± 1.4
QPM
1.5 ± 1.4
1.9 ± 1.1
TFCM
1.0 ± 1.2
1.7 ± 1.1
SSA
2.3 ± 2.0
2.5 ± 2.1
QPM
1.9 ± 1.7
2.1 ± 1.9
TFCM
1.5 ± 1.6
1.8 ± 1.7
Normalize geçen süre, her geçen zamanın 20 saniye bölünmesi ile hesaplanır. Bu
tablodan, FCM yönteminin diğer yöntemlere göre daha düşük hesaplama maliyeti
olduğunu belirtmek mümkündür. Ayrıca, hesaplama karmaşıklığı açısından TFCM
yöntemi en iyi ikinci yöntemdir. Şekil 4.12 solunum ses sinyalinin bir bölümünün
sırasıyla, TFCM, QPM ve SSA yöntemleri sonuçları ile gerçek KS sınırlarıyla birlikte
gösterir.
60
Çizelge 4.9. Önerilen metottun ve diğer metotların geçen sure ve normaliz gecen süre
sonuçları
Nefes seviye
SSA
FCM
QPM
TFCM
Düşük
1.3 ± 0.2
0.11 ± 0.03
0.25 ± 0.07
0.2 ± 0.05
Orta
0.06
0.006
0.012
0.010
Şekil 4.12. (a) Solunum ses sinyalinin bir bölümü ve (b)-(e) sırasıyla, TFCM, QPM ve
SSA yöntemleri sonuçları gerçek KS sınırları ile birlikte.
61
4.6. Olabilirlik Oranı Testi (LRT) ile Birlikte Maksimum a Posterior Adaptasyon
Yöntemi ile Elde Edilen Deneysel Sonuçlar ve Tartışma
Bu bölümde olabilirlik oranı testi ile yapmış olduğumuz deneysel sonuçlar
sunulmaktadır. Sonuçların daha iyi değerlendirilmesi için bu bölüm üç kısma ayrılmıştı:
öznitelik boyutunun seçimi, adaptasyon işlemi ve yöntemlerin karşılaştırılması.
4.6.1. Öznitelik boyutunun belirlenmesi ile ilgili deneysel sonuçlar
Şekil 4.13(a) ve Şekil 4.13(b)’de sırasıyla, düşük ve orta solunum akış hızlarında farklı
öznitelik guruplarına göre önerilen LRT yönteminin DET grafikleri gösterilmiştir.
Çizelge 4.10, Şekil 4.13(a) ve Şekil 4.13(b) de farklı m ((3.48)’ de tanımlı) değerleri
için verilen DET grafiklerinin NAUC değerlerini göstermektedir. Bu şekiller
incelendiğinde, kalp sesi tespiti amacıyla çoklu gözlemler için en iyi m değerinin iki
( m  2 ) olduğu ve onun NAUC değeri diğer m değerlerine göre oldukça düşük bir
değere sahip olduğu görülmektedir. Düşük ve orta hızlı solunum akışları için en düşük
NAUC değerleri 0.0119 ve 0.0189 olarak ölçülmüştür. Bu şekillerden görüldüğü
kadarıyla, tek boyutlu öznitelikler yerine ( m  0 ), çok boyutlu özniteliklerin (özellikle
1  m  4 ) kullanılması önerilen yöntemin performansını iyileştirmektedir. Çünkü çoklu
öznitelik kullanılması karar mekanizmasına zamansal bilgi ekleler ve bu ekstra bilgi
sistemin performansını artırır..
62
(a)
(b)
Şekil 4.13. LRT yönteminin farklı m değerleri için DET sonuçları (a) düşük (b) orta
nefes seviyelerinde
Çizelge 4.10. Tüm M değerleri için NAUC değerleri düşük ve orta nefes seviyelerinde.
Nefes seviye
M=0
M=1
M=2
M=3
Düşük
0.0329
0.0151
0.0119
0.0155
M=4
0.0184
Orta
0.0550
0.0277
0.0189
0.0269
0.0306
63
4.6.2. GKM parametrelerinin adaptasyonu ile elde edilen deneysel sonuçlar
Önceki bölümde, m  2 değeri en iyi sonuç verdiği için çalışmanın geri kalan
bölümünde bu değer kullanılmıştır. Bu alt bölümde SI model parametrelerinin
adaptasyonunun KS tespitindeki faydaları incelenmektedir. Öncelikle veri tabanında
bulunan bir kişi için GKM adaptasyon aşamasına ait örnek sonuçlar incelenecektir.
Şekil 4.14(a) ve Şekil 4.14(b), adaptasyon işleminin farklı miktarlarda adaptasyon
verileri için SA-GKM, SI ve SD-GKM modellerini nasıl değiştiğini göstermektedir. Bu
şekillerden, adaptasyon sırasında kullanılan verilerin süresinin 2s den 20 s’ye artırılması
SI
model
parametrelerini
iyileştirdiği
ve
SD
modeline
daha
yaklaştırdığı
gözlenmektedir. Ayrıca 8 s ve 8 s’den fazla kullanılan adaptasyon verileri arasındaki
adaptasyon farkı çok önemli olmadığı gözlenmiştir. Şekil 4.15(a) ve Şekil 4.15(b) ise
LRT modellerinin adaptasyonu esnasında elde edilen DET eğrileri sırasıyla düşük ve
orta solunum akış hızları için gösterilmiştir.
64
(a)
(b)
Şekil 4.14. GKM adaptasyon sonuçları çeşitli süre uyarlama verileri için (a) düşük (b)
orta nefes seviyelerinde
65
(a)
(b)
Şekil 4.15. ALRT ve LRT yöntemlerin DET sonuçları (a) düşük (b) orta nefes
seviyelerinde
Bu şekillerde verilen sonuçlar adaptasyon işleminin düşük ve orta akış hızlı solunum
seslerinde kalp sesi tespit performansını iyileştirdiğini göstermektedir.
66
Çizelge 4.11. LRT ve ALRT için NAUC ve önemlilik test değerleri düşük ve orta nefes
seviyelerinde
Nefes seviye
LRT
ALRT
Z0
Düşük
0.0119
0.0091
3.69
Orta
0.0189
0.0168
3.13
Bu bölümün devamında, 20 s’lik adaptasyon verisi kullanılan ALRT, ALRT yöntemi
olarak tanımlanmıştır. Çizelge 4.11 sayısal olarak LRT ve ALRT ye bağlı NAUC
değerlerini sunmaktadır. Önerilen adaptasyon işlemi, LRT ile bulunan NAUC değerini,
düşük ve orta solunum akış hızları için yaklaşık olarak %23 (0.0119-0.0091) ve %11
(0.0189-.0168) oranında azaltmıştır. Şekil 4.15(a) ve Şekil 4.15(b)’de sırasıyla kalp sesi
olmayan (non-KS) ve KS olan kısımlar için, her GKM için karışım sayısı 4 ve 5
seçilmiştir. Kalp sesi ve kalp sesi olmayan yerlerin karışım bileşenlerinin en iyi değerini
bulmak için çok sayıda deney yapılmış ve deneme yanılma yoluyla en iyi sonuçlar elde
edilmiştir. Şekil 4.16’de bu deneysel çalışmaların sonuçları gösterilmektedir. Bu
şekilden, KS için karışım sayısı
M1  5 ve KS olmayan yerler için M0  4 olarak
seçildiği zaman diğer karışım sayılarına göre daha iyi sonuçların elde edildiği
görülmüştür. Ayrıca kalp sesinin olduğu yerler için seçilen karışım sayısının KS
olmayan kısımlar için seçilen değerden daha büyük olması gerektiği gözlenmiştir.
67
Şekil 4.16. Karışım bileşenlerinin çeşitli sayıda NAUC değerleri düşük ve orta nefes
seviyelerinde
Şekil 4.17. ALRT yöntemine göre iterasyon sonuçları
68
Karışım sayısına ek olarak, önerilen yöntemin performansını etkileyen iki önemli
parametre daha vardır. Bu parametreler Çizelge 3.3 de verilen adım-4 ve adım-9
arasında kullanılan tekrarlama (iterasyon) sayısı ve denklem (3.63)’de kullanılan r
uygunluk faktördür. Bu parametrelerin yöntem üzerine etkilerini incelemek için çok
sayıda deneysel çalışma yapılmıştır. Şekil 4.17’da düşük solunum akış hızında
uygunluk parametresine karşı çeşitli iterasyon sayılarına göre önerilen yöntemin
performansı gösterilmiştir. Bu şekilden elde edilen sonuçların benzer olduğu görülse de
en iyi sonuç uygunluk faktörünün on beş ve iterasyon sayısının iki seçilmesi ile elde
edilmiştir Bu yüzden sırasıyla tekrarlama ve uygunluk parametreleri bundan sonraki
sonuçlarda 2 ve 15 olarak seçilmiştir.
Adaptasyon işleminin veri tabanındaki her bir kişi için elde edilen performansı nasıl
iyileştirdiği Şekil 4.18’de görülmektedir. Ayrıca adaptasyon işleminin istatiksel olarak
anlamlı bir iyileştirmeye sebep olup olmadığını incelemek için istatistiksel anlamlılık
testi yaptık. Bu testten elde edilen sonuçlar Çizelge 4.11’de verilmektedir. Z 0 skorları
düşük ve orta akış hızları için 3.69 ve 3.13 olarak bulunmuştur. Bu sonuçlara göre,
adaptasyondan elde edilen gelişmeler istatistik olarak da anlamlıdır (p < 0.01).
Şekil 4.18. LRT ve ALRT yöntemlerin NAUC sonuçları tüm veri tabanı için
69
4.6.3. Önerilen yöntemin literatürdeki yöntemler ile karşılaştırılması
Bu bölümde amacımız ALRT yöntemi ile KS tespit işleminin performansını
değerlendirmek ve bu yöntemi literatürde iyi bilinen iki yöntem QPM [7] ve SSA [9] ile
karşılaştırmaktır. Önerilen ve diğer yöntemlerin DET eğrileri düşük ve orta solunum
akış hızları için Şekil 4.19(a) ve Şekil 4.19(b) de gösterilmektedir. Bu şekillerden
anlaşılacağı üzere ALRT yöntemi ile bulunan DET değerleri diğer iki yönteme göre
daha düşüktür. Her bir yöntemin veri tabanındaki her kişi için NAUC değerleri Çizelge
4.12 de sunulmaktadır.
Çizelge 4.12. SSA, QPM ve ALRT için düşük ve orta nefes seviyelerinde NAUC ve
önemlilik test değerleri
Nefes seviye
SSA
QPM
Düşük
0.0166
Orta
0.0300
0.0159
ALRT
0.0091
Z0(ALRT&QPM)
4.77
0.0291
0.0168
5.63
Bu çizelgedeki değerlerden görüldüğü üzere, adaptasyonlu ALRT yöntemi düşük ve
orta solunum akış hızları için en düşük 0.0091 ve 0.0168 değerine sahiptir. Oysa QPM
yöntemi ile bu değerlerin 0.0159 ve 0.0291 olduğu görülmüştür. Önceki çalışmalarda da
[7], QPM için performans değerlerinin SSA yöntemine göre daha iyi olduğu
belirtilmiştir. Ayrıca Şekil 4.20’de bütün kişilere ait veri tabanı için önerilen ve diğer
yöntemler için NAUC değerleri verilmiştir. Bu şekil her kişi için yöntemler arasında en
düşük NAUC değerleri ALRT yönteminin sahip olduğunu göstermektedir. Çizelge
4.12’te orta ve düşük akış hızları için istatiksel olarak ALRT ile yapılan çalışmalarda en
iyi sonuçlar elde edildiği ifade edilmektedir. Şekil 4.19(a) ve Şekil 4.19(b) ile sonuçlar
çeşitli eşik değerleri için FPR’ye karşılık FNR değerlerine bağlı olarak ifade edilmiştir.
70
(a)
(b)
Şekil 4.19. ALRT, QPM, ve SSA yöntemlerin DET sonuçları (a) düşük (b) orta nefes
seviyelerinde
Bu şekil özel bir FPR değerine karşılık gelen FNR değerini incelemek için oldukça
öğreticidir. Bu amaçla, örnek bir nokta için FPR =%1.7 seçtik. Bütün yöntemlere göre
bu noktalardaki FNR değerleri Çizelge 4.13’te sunulmuştur. Dikkat edileceği üzere
ALRT yöntemi ile en düşük FNR değerleri elde edilmiştir.
71
Şekil 4.20. Bütün yöntemlerin NAUC sonuçları tüm veri tabanı için
Şekil 4.21’de KS sınırlarıyla beraber veri tabanında bulunan bir solunum sesinin 5 s lik
kısmı görülmektedir. Bu şekil ayrıca ALRT, QPM, SSA yöntemlerine göre elde edilen
KS sonuçları da görülmektedir. Bu şekilde de önerilen ALRT algoritmasının QPM ve
SSA yöntemlerinden daha iyi sonuçlar verdiği görülmektedir.
Çizelge 4.13. Önerilen metottun ve diğer metotların ortalama ve standarda sapması
düşük ve orta nefes sevilerinde
Nefes seviyesi
Düşük
Orta
Metot
FNR
FPR
SSA
1.5 ± 2.0
1.7
QPM
1.4 ± 1.2
1.7
LRT
0.9 ± 1.1
1.7
ALRT
0.6 ± 1.0
1.7
SSA
2.7 ± 2.4
1.7
QPM
2.0 ± 1.8
1.7
LRT
1.5 ± 1.8
1.7
ALRT
1.0 ± 1.5
1.7
72
Şekil 4.21. (a) Solunum ses sinyalinin bir bölümü ve (b)-(e) sırasıyla, ALRT, QPM ve SSA
yöntemleri sonuçları gerçek KS sınırları ile birlikte
73
5. SONUÇ
Bu tez de literatürdeki yöntemleri göz önüne alarak üç farklı yöntem öneriliştir. İlk
bölümde, solunum sesleri içinden kalp seslerinin hızlı ve doğru olarak algılaması için
yeni bir öznitelik önerilmiştir. Önerilen bu öznitelik tahmini bir entropidir ve aynı
zamanda çekirdek tabanlı entropi tahmini için bir üst sınırdır. Önerilen bu tahmini
entropinin, verilerin Gauss dağılıma sahip olduğu varsayımıyla hesaplanan entropi ile
aynı algılama performansına sahip olduğu gösterilmiştir. Önerilen ve çekirdek tabanlı
kalp sesi algılama yöntemlerin hesaplama karmaşıklığı hem analitik hem de sayısal
olarak karşılaştırılmıştır. Önerilen yöntemin, çekirdek tabanlı yönteme göre önemli
ölçüde daha düşük hesaplama karmaşıklığı sahip olduğu gösterilmiştir. Buna ek olarak,
önerilen ve çekirdek tabanlı yöntemin hangi şartları altında benzer algılama performansı
sağlayacağı tespit edilmiştir. Ayrıca önerilen ve çekirdek tabanlı entropi arasında güçlü
bir doğrusal ilişki olduğunu hem analitik hem de deneysel olarak gösterilmiştir ve
çekirdek tabanlı entropi yerine önerilen entropi kullanılarak benzer algılama
performansları elde edilebileceği gösterilmiştir. İlk bölümde önerilen yöntemin
performansı gerçek solunum sesleri içeren bir veri tabanı kullanılarak literatürdeki üç
yöntem ile karşılaştırılmıştır. Deneysel sonuçlar göre, önerilen yöntemi diğer tüm
yöntemlere karşılaştırıldığında önemli ölçüde daha düşük hesaplama karmaşıklığı
olduğu gösterilmiştir. Önerilen yöntemin ortalama hatası CWT göre daha düşük, KDE
ve SSA ile benzer olduğu gösterilmiştir. Elde edilen bu sonuçlara göre, önerilen entropi
çeşitli uygulamalarda çekirdek tabanlı entropi yerine kullanılabilir.
Bu tezin ikinci bölümünde, solunum seslerinin içinde kalp sesinin yerini tespit etmek
FCM algoritmasına dayalı yeni bir algoritma önerilmiş ve bu algoritmaya zamansal
bulanık c-ortalamalar (TFCM) algoritması ismi verilmiştir. Bu algoritmanın FCM
algoritmasından en önemli farkı karar mekanizmasının çalışma şeklidir. Karar
mekanizmasında FCM algoritması sadece yerel bilgiler kullanırken, TFCM algoritması
yerel ve zamansal bilgileri beraber kullanır. Önerilen bu algoritma kalp seslerinin yerini
bulma görevinde FCM ve literatürdeki birçok algoritmalarla karşılaştırılmış ve bu
algoritmalardan daha başarılı sonuçlar elde ettiği gösterilmiştir.
74
Bu tezin üçüncü bölümünde kalp seslerinin yerlerini bulma işleminin etiketlendirilmiş
eğitim verisi kullanılarak nasıl daha iyileştirilebileceği anlatılmıştır. Önerilen yöntem
olabilirlik oranı testi (LRT) ve etkili bir adaptation işlemine dayanmaktadır. Deneysel
sonuçlar şunları göstermiştir; adaptasyon işlemi düşük ve orta solunum akış hızlarında
sistemin performansını iyileştirmiştir.
75
KAYNAKLAR
[1]
[2]
[3]
[4]
[5]
[6]
[7]
[8]
[9]
[10]
[11]
[12]
[13]
[14]
[15]
S. Sanei, M. Ghodsi, and H. Hassani, 2011. An adaptive singular spectrum analysis
approach to murmur detection from heart sounds. Medical Engineering & Physics.
33(3), 362-367.
M. El-Segaier, O. Lilja, S. Lukkarinen, L. Sornmo, R. Sepponen, and E. Pesonen, 2005.
Computer-based detection and analysis of heart sound and murmur. Annals of
Biomedical Engineering. 33(7), 937-942.
F. Beritelli and S. Serrano, 2007. Biometric identification based on frequency analysis
of cardiac sounds. IEEE Transactions on Information Forensics and Security. 2(3),
596-604.
K. Phua, J. Chen, T. H. Dat, and L. Shue, 2008. Heart sound as a biometric. Pattern
Recognition. 41(3), 906-919.
R. Palaniappan, K. Sundaraj, and N. U. Ahamed, 2013. Machine learning in lung sound
analysis: A systematic review. Biocybernetics and Biomedical Engineering. 33(5), 129135.
C. Ahlstrom, O. Liljefeldt, P. Hult, and P. Ask, 2005. Heart sound cancellation from
lung sound recordings using recurrence time statistics and nonlinear prediction. IEEE
Signal Processing Letters. 12(12), 812-815.
V. K. Iyer, P. A. Ramamoorthy, F. Hong, and Y. Ploysongsang, 1986. Reduction of
Heart Sounds from Lung Sounds by Adaptive Filtering. IEEE Transactions on
Biomedical Engineering. 33(12), 1141-1148.
M. Kompis and E. Russi, 1992. Adaptive Heart-Noise Reduction of Lung Sounds
Recorded by a Single Microphone. Proceedings of the Annual International Conference
of the IEEE Engineering in Medicine and Biology Society. Vol 14, pp. 691-692.
H. Zheng, H. Wang, L. Y. Wang, and G. G. Yin, 2007. Cyclic system reconfiguration
and time-split signal separation with applications to lung sound pattern analysis. IEEE
Transactions on Signal Processing. 55(6), 2897-2913.
A. Yadollahi and Z. Moussavi, 2011. The Relationship between Tracheal Respiratory
Sounds and Flow in Osa Patients during Sleep. Proceedings of the 33th Annual
International Conference of the IEEE Engineering in Medicine and Biology Society
(Embc), 6797 - 6800.
A. Yadollahi and Z. A. K. Moussavi, 2006. A robust method for estimating respiratory
flow using tracheal sounds entropy. IEEE Transactions on Biomedical Engineering.
53(4), 662-668.
C. T. Chao, N. Maneetien, C. J. Wang, and J. S. Chiou, 2014. Performance Evaluation
of Heart Sound Cancellation in FPGA Hardware Implementation for Electronic
Stethoscope. Scientific World Journal.
J. I. Shin, S. L. Yi, D. H. Jo, J. H. Bae, and T. S. Leei, 2013. Development of
smartphone-based stethoscope system. Proceedings of the 13th International
Conference on Control, Automation and Systems, pp. 1288-1291.
F. Belloni, D. Della Gıustına, M. Rıva, and M. Malcangi , 2010. A new digital
stethoscope with environmental noise cancellation. Proceedings of the 12th WSEAS
International Conference on Mathematical and Computational Methods in Science and
Engineering. pp. 169-174.
F. Ghaderi, H. R. Mohseni, and S. Sanei, 2011. Localizing Heart Sounds in Respiratory
Signals Using Singular Spectrum Analysis. IEEE Transactions on Biomedical
Engineering. 58(12), 3360-3367.
76
[16]
[17]
[18]
[19]
[20]
[21]
[22]
[23]
[24]
[25]
[26]
[27]
[28]
[29]
[30]
[31]
[32]
[33]
Gnitecki J., and M. Z. Mossavi, 2003. Variance fractal dimension trajectory as a tool for
hear sound localization in lung sounds recordings. Proceedings of the 25th Annual
International Conference of the IEEE Engineering in Medicine and Biology Society. pp.
2420-2423.
F. Jin and F. Sattar, 2013. A Multiscale Mean Shift Localization Approach for Robust
Extraction of Heart Sounds in Respiratory Signals. Proceedings of the IEEE
International Conference on Acoustics, Speech and Signal Processing. pp. 1291-1295.
M. T. Pourazad, Z. Moussavi, and G. Thomas, 2006. Heart sound cancellation from
lung sound recordings using time-frequency filtering. Medical & Biological
Engineering & Computing. 44(3), 216-225.
H. Shamsi and I. Y. Ozbek, 2012. Heart Sound Localization in Chest Sound Using
Temporal Fuzzy C-Means Classification. Proceedings of the 34th Annual International
Conference of the IEEE Engineering in Medicine and Biology Society (Embc), pp.
5286-5289.
H. Shamsi and I. Y. Ozbek, 2014. Robust heart sound detection in respiratory sound
using LRT with maximum a posteriori based online parameter adaptation. Medical
Engineering & Physics. 36(10), 1277-1287.
A. Yadollahi and Z. M. K. Moussavi, 2006. A robust method for heart sounds
localization using lung sounds entropy. IEEE Transactions on Biomedical Engineering.
53(3), 497-502.
M. Zivanovic, and M. Gonzalez-lazal, 2013. Quasi-periodic modeling for heart sound
localization and suppressionin lung sound. Biomed Signal Proces. 8(6), 586-595.
H. Shamsi and I. Y. Ozbek, 2013. Heart Sound Detection in Respiratory Sound Using
Hidden Markov Model. Proceedings of the 21st European Signal Processing
Conference (Eusipco), pp. 1-5.
C. E. Shannon, 1948. mathematical theory of communication. Bell System Technical
Journal, vol. 27, pp. 379-423.
B. W. Silverman, 1986. Density Estimation for Statistics and Data Analysis: Chapman
and Hall/CRC.
H. Shamsi and I. Y. Ozbek, 2015. A robust method for online heart sound localization
in respiratory sound based on temporal fuzzy c-means. Medical & biological
engineering & computing, 53(1), 45-56.
H. Liang, S. Lukkarinen, and I. Hartimo, 1997. Heart sound segmentation algorithm
based on heart sound envelogram. Computers in Cardiology. 24, pp. 105-108.
I. A. Ahmad, and P. Lin, 1976. Nonparametric estimation of the entropy for absolutely
continuous distributions. IEEE Trans on Inform Theory. 22(3), 372-375.
M. Thomas, J. A Thomas, 1991. Eements of Information Theory. : Wiley-Interscience.
J. R. Hershey and P. A. Olsen, 2007. Approximating the Kullback Leibler Divergence
between Gaussian Mixture Models. Proceedings of the IEEE International Conference
on Acoustics, Speech, and Signal Processing. 1-3, pp. 317-320.
M. F. Huber, T. Bailey, H. Durrant-Whyte, and U. D. Hanebeck, 2008. On Entropy
Approximation for Gaussian Mixture Random Vectors. Proceedings of the IEEE
International Conference on Multisensor Fusion and Integration for Intelligent
Systems, 1-2, pp. 336-343.
J. Nahar, T. Imam, K. S. Tickle, and Y. P. P. Chen, 2013. Computational intelligence
for heart disease diagnosis: A medical knowledge driven approach. Expert Systems with
Applications, vol. 40(1), 96-104.
H. Naseri and M. R. Homaeinezhad, 2013. Detection and Boundary Identification of
Phonocardiogram Sounds Using an Expert Frequency-Energy Based Metric. Annals of
Biomedical Engineering, vol. 41(2), 279-292.
77
[34]
H. Uguz, A. Arslan, R. Saracoglu, and I. Turkoglu, 2008. Detection of heart valve
diseases by using fuzzy discrete hidden Markov model. Expert Systems with
Applications, vol. 34(4), 2799-2811.
[35]
S. Cortes, R. Jane, A. Torres, J. A. Fiz, and J. Morera, 2006. Detection and adaptive
cancellation of heart sound interference in tracheal sounds. Proceedings of the 28th
Annual International Conference of the IEEE Engineering in Medicine and Biology
Society. 1-15, pp. 4830-4833.
[36]
F. Jin, F. Sattar, and D. Y. T. Goh, 2009. A filter bank-based source extraction
algorithm for heart sound removal in respiratory sounds. Computers in Biology and
Medicine. 39(9), 768-777.
[37]
C. E. Shannon, 1948. A Mathematical Theory of Communication. The Bell System
Technical Journal. 27, 379–423.
[38]
J. C. Bezdek, R. Ehrlich, and W. Full, 1984. FCM - the Fuzzy C-Means ClusteringAlgorithm. Computers & Geosciences. 10(2-3), 191-203.
[39] C. C. Hung, S. Kulkarni, and B. C. Kuo, 2011. A New Weighted Fuzzy C-Means
Clustering Algorithm for Remotely Sensed Image Classification. IEEE Journal of
Selected Topics in Signal Processing. 5(3), 543-553.
[40]
H. Tang, T. Li, Y. Park, and T. S. Qiu, 2010. Separation of Heart Sound Signal from
Noise in Joint Cycle Frequency-Time-Frequency Domains Based on Fuzzy Detection,"
IEEE Transactions on Biomedical Engineering. 57(10), 2438-2447.
[41]
L. Zhu, F. L. Chung, and S. T. Wang, 2009. Generalized Fuzzy C-Means Clustering
Algorithm With Improved Fuzzy Partitions. IEEE Transactions on Systems Man and
Cybernetics Part B-Cybernetics. 39(3), 578-591.
[42]
K. S. Chuang, H. L. Tzeng, S. Chen, J. Wu, and T. J. Chen, 2006. Fuzzy c-means
clustering with spatial information for image segmentation. Computerized Medical
Imaging and Graphics. 30(1), 9-15.
[43]
F. Hoppner and F. Klawonn, 2003. A contribution to convergence theory of fuzzy cmeans and derivatives. IEEE Transactions on Fuzzy Systems. 11(5), 682-694.
[44]
S. R. Kannan, 2008. A new segmentation system for brain MR images based on fuzzy
techniques. Applied Soft Computing. 8(4), 1599-1606.
[45]
J. Ramirez, J. Segura, C. Benitez, L. Garcia, A. Rubio, 2005. Statistical voice activity
detec-tion using a multiple observation likelihood ratio test. IEEE Signal Process Letter
12(10), 689–92.
[46]
S. M. Kay, 1993. Fundamentals of statistical signal processing, vol. 2: detection
theory.New Jersey: Prentice-Hall Inc.
[47]
H. Jiang, L. Deng, 2001. A bayesian approach to the verification problem: applications
to speaker verification. IEEE Trans Speech Audio Process. 9(8), 874–84.
[48]
K. Phua, J. Chen, T. H. Dat, L Shue, 2008. Heart sound as a biometric. Pattern Recogn.
41(3), :906–919.
[49]
K. H. Lee, J. H. Chang, N. S. Kim, S. Kang, Y. Kim, 2010. Frequency-domain doubletalkdetection based on the Gaussian mixture model. IEEE Signal Process Letter. 17(5),
453–456.
[50]
A. P. Dempster, N. M. Laird, D. B. Rubin, 1977. Maximum likelihood from incomplete
datavia the EM algorithm. J Roy Stat Soc B Met. 39(1), 1–38.
[51] J. Neyman, E.S. Pearson, 1933. On the problem of the most efficient tests of
statisticalhypotheses. Philos Trans Roy Soc A 231, 289–337.
[52] J. L. Gauvain, C. H. Lee, 1994. Maximum a posteriori estimation for multivariate Gaussian mixture observations of Markov chains. IEEE Trans Speech Audio Process.2(2),
291–298.
ÖZGEÇMİŞ
1985 yılında İran’da dünyaya gelen Hamed SHAMSİ ilk, orta ve lise öğrenimini
İRAN’da tamamladı. 2003 yılında başladığı İSLAMİK AZAD Üniversitesi Elektronik
ve Haberleşme Mühendisliği Bölümü’nden 2007’de mezun oldu. 2007’da İSLAMİK
AZAD Üniversitesi Elektrik Elektronik Mühendisliği Haberleşme Bilim Dalında
lisansüstü eğitim için hak kazandı ve 2010 yılında mezun oldu. 2011’da Atatürk
Üniversitesi Elektrik Elektronik Mühendisliği Haberleşme Bilim Dalında doktora
eğitim için hak kazandı. Evli ve 1 çocuk babasıdır.
Download