veri tabanı

advertisement
BÖLÜM 8: VERİ KAYNAKLARININ
YÖNETİMİ
GELENEKSEL DOSYA ORTAMLARINDA VERİYİ
ORGANİZE ETMEK
Etkili bir bilgi sistemi kullanıcılara tam
vaktinde, kesin ve konu ile ilgili bilgileri sağlar. Bu
bilgiler bilgisayar dosyalarında muhafaza edilir. Bu
dosyalar düzgün bir şekilde düzenlenip bakımları
yapıldığında kullanıcıların istediği bilgilere
kolaylıkla ulaşılabilir.
2
Dosya Organizasyonu Kavramları:






Bir bilgisayar sistemi bilgiyi bir hiyerarşi içinde
düzenler. Bu organizasyon bit, bayt, alan isimleri,
kayıtlar, dosyalar (tablolar) ve veri tabanlarıdır.
Bit, bilgisayarın işleyebileceği en küçük bilgi birimini
temsil eder.
Bir grup bit bayt oluşturur ve bir karakteri temsil eder. Bu
harf, rakam veya sembol olabilir.
Bir grup karakter veya komple bir numara alan olarak
adlandırılır.
İlgili alanların oluşturduğu gruba bir kayıt olarak
adlandırılır.
Kayıt grubu da dosyayı (tablo) oluşturur.
İlgili dosyaların oluşturduğu grup da veri tabanını
oluşturur.
3
Dosya Organizasyonu Kavramları:
Bir kayıt bir varlığı ifade eder. Varlık bir kişi, yer,
sayı, olay olabilir. Varlığın her özelliği tablonun kolonu
olarak adlandırılır.
Dosyadaki her bir kayıt, kayıtların ayırt edileceği,
değiştirileceği, alınacağı ve sıralanacağı, en azından bir
alan içerir. Bu tanımlayacağı alan anahtar (key) alan
olarak adlandırılır. Anahtar alan ise örneğin sipariş
numarası, çalışma numarası veya sosyal güvenlik
numarası olabilir.
4
Bilgisayar Dosyalarından Kayıtlara Erişmek:
Bilgisayar sistemleri dosyaları, yükleme araçlarında
saklarlar. Kayıtlar yükleme ortamlarında birçok yolla
düzenlenebilir.
Birinci yol kayıtları organize etmek için sıralı dosya
organizasyonudur. Bu dosya organizasyonlarında kayıtlar,
yükleme aracına (sabit disk) hangi sırada yüklenirse o
şekilde geri alınırlar.
Buna
karşılık
rastgele
veya
direk
dosya
organizasyonlarında saklama ortamındaki fiziksel sıraya
bakılmaksızın kullanıcılar istediği sırada kayıtlara
ulaşabilirler.
Sıralı dosya organizasyonları manyetik teyplerde
kullanılan bir dosya organizasyonudur.
5
Sıralı İndeks Ulaşım Metodu:
Kayıtlar direk ulaşım sağlayan saklama aletlerine
yüklenmesine rağmen kişisel kayıtlara sıralı indeks
taşıma
metodu
(ISAM)
kullanarak
direk
ulaşabilirsiniz. Bu ulaşım metodu anahtar alanların
indeksine güvenir.
Dosya indeksi bir kitabın indeksine benzer.
İndeks her kaydın anahtar alanını listeler ve onu
saklama aracına yerleştirir.
Kayıtlar, anahtar numaralarına göre diske atılır.
ISAM genelde sıralı okumaya ihtiyaç duyan
uygulamalarda kullanılır. Fakat genelde direk ulaşım
kullanılır.
6
Direk Dosya Ulaşım Metodu
Bu metotta anahtar alan kaydın fiziksel
adresini bulmak için kullanılır. Burada
anahtar alan disk üzerindeki kaydın fiziksel
olarak saklanacağı yere dönüştürülür.
7
Geleneksel Dosya Ortamlarında Problemler:
1.
Gereksiz Bilgi: Gereksiz bilgi bir veriden birden fazla
olmasıdır. Farklı birimler, farklı alanlar, firmadaki gruplar
bağımsız bir şekilde aynı parça bilgiyi topladıklarında
gereksiz bilgi oluşur. Veri, pek çok farklı yerlerde
muhafaza edilir ve birikir, çünkü aynı veri parçası
organizasyonun farklı bölümlerinde farklı anlamlara
sahip olabilir.
2.
Program ve Veri Bağımlılığı: Program veri bağımlılığı
dosyadaki bilgiler ile bu dosyaları düzeltme ve değiştirme
için kullanılan programlar arasındaki ilişkiler tutar.
Geleneksel veri ortamında bir veri değiştiğinde o veriyi
kullanan diğer programların tümünde bir değişiklik
yapmamız gerekir. Bu tarz program değişikliklerini
gerçekleştirmekte firmaya milyon dolarlara patlar.
8
Geleneksel Dosya Ortamlarında Problemler:
3.
4.
5.
Esneklik Olmaması: Geleneksel dosya sistemlerinde
planlı bir rapor alabilmek için çok geniş, büyük
program yazmak gerekir. Ani rapor istekleri için rapor
alınamayabilir. Bilgi sistemde herhangi bir yerde
olabilir ve bu bilgiyi alabilmek pahalıya patlar. Bu iş
için çok programcının çalışması gerekir.
Zayıf Güvenlik: Bilginin üzerindeki zayıf kontrol ve
yönetim veriye erişimde problemler oluşturur. Bilginin
üzerindeki sınırlamalar gelenekler ve alışkanlıklara
bağlı olmaktadır.
Veri Paylaşımı ve Kullanımında Esneklik: Karışık
sistemlerde de kontrol eksikliğinden dolayı istenen
bilgiyi elde etmek kolay değildir. Bilgiyi paylaşmak
veya bilgiye ulaşmak görüntüde de çok zordur.
9
MODERN VERİ TABANI ORTAMLARI:
Veri
tabanının
en
iyi
tanımı
veriyi
merkezleştirerek ve gereksiz veriyi ortadan kaldırarak
birçok uygulama tarafından paylaşılan, organizasyonu
yapılmış verilerin toplamıdır. Veriyi ayrı dosyalarda
tutmak yerine, veriler fiziksel olarak bir yerde tutulur.
Bir veri tabanı birçok uygulamaya servis yapabilir.
Veri Tabanı Yönetim Sistemleri (VTYS): VTYS basit
bir yazılımdır. Bu yazılım veriyi merkezleştirmeye,
etkili bir şekilde kullanmaya, uygulama programları
tarafından, ulaşılmasına izin verir. Bir uygulama
programı, veriye ulaşmak istediğinde; VTYS bu veriyi
bulur ve uygulama sunar.
10
MODERN VERİ TABANI ORTAMLARI:
Verinin Fiziksel Ve Mantıksal Görüntüleri: VTYS ile
geleneksel dosya organizasyonları arasındaki en büyük fark
VTYS’nin verinin nerede ve nasıl kayıtlı olduğunun
anlaşılması işlemini programcılar ve son kullanıcılar için
azaltarak mantıksal ve fiziksel veri görüntülerini birbirinden
ayırmasıdır.
Bu da programcı veya son kullanıcının verinin nerede ve
nasıl kayıtlı olduğunu anlamasını kolaylaştırır.
Veri tabanı kavramı mantıksal ve fiziksel veri
görüntülerini birbiriyle karşılaştırır.
Mantıksal görüntü verilerin son kullanıcılar tarafından
kavranılarak oluşturulmasıdır.
Fiziksel görüntü ise verinin fiziksel depo ortamında nasıl
organize edildiğini ve yapılandırıldığını gösterir.
11
Veri Tabanı Yönetim Sistemlerinin Avantajları:
1.
2.
3.
4.
5.
6.
Organizasyondaki bilgi sisteminin karmaşıklığı, verinin
erişiminin ve güvenlikten sorumlu merkezi yönetim tarafından
azaltılabilir.
Veri fazlalığı ve değişkenliği, aynı veri elemanlarının tekrar
edildiği bağımsız dosyaların tümünden elimine edilmesiyle
azaltılabilir.
Veri karmaşıklığı, veri oluşumunun merkezi kontrolünün ve
tanımlamasının sağlanmasıyla elimine edilebilir.
Program veri bağımlılığı verinin mantıksal görüntüsünün
fiziksel düzenlemesinden ayrılmasıyla azaltılabilir.
Program geliştirilmesi ve düzeltilmesi maliyetleri kökten
azaltabilir.
Bilgi sistemlerinin esnekliği, çok geniş havuzlu bilgi
sorgulamalarının ayarlanmasına hızlı ve ucuz olarak izin
vererek çok fazla miktarda arttırılabilir.
12
Veri Tabanı Tasarımı:
Üç temel mantıksal veri tabanı modeli vardır:
1. Hiyerarşik
2. Ağ
3. İlişkisel
13
1. Hiyerarşik Veri Modeli:
İlk VTYS’leri hiyerarşiktir. Hiyerarşik veri modeli
kullanıcılara veriyi ağaç yapısında sunuyordu. Her
kaydın içinde, veri parçacıkları kısım denilen
kayıtlarda düzenlenirdi. Kullanıcıya her bir kayıt, en
üst seviyesi kök olan düzenli bir organizasyon
çizelgesi olarak görünür. Hiyerarşik bir VTYS’de
bilgiler birbirine bir dizi, birbiriyle alakalı bilgi
kısımları oluşturan işaretleyicilerle bağlanır.
İşaretleyiciler, ilgili kayıt sistemlerini yöneten
diskin üzerindeki kayıt kısımlarına iliştirilmiş veri
öğeleridir.
14
2. Ağ Veri Modeli: Ağ veri modeli hiyerarşik bilgi
modelinin bir çeşididir. Veri tabanları hiyerarşikten
ağa çevrilebilir ve işlemlerin hızı ve uygunluğu
açısından tam tersi de mümkündür.
3. İlişkisel Veri Modeli: İlişkisel veri modeli, bu üç veri
tabanı modelinin en yenisidir. Bütün bilgiyi iki
boyutlu tablolara depolar ve bu tablolar
koleksiyonuna veri tabanı denir.
Bir ilişkisel veri tabanında, kullanışlı bilgi
kümeleri oluşturmak için üç temel işlem kullanılır:
seçme, projeksiyon ve birleştirme.
15
Üç Veri Tabanı Modelinin Avantaj ve
Dezavantajları:
 Hiyerarşik ve ağ veri tabanı modellerinin temel
avantajı işlem verimliliğidir.
 Hiyerarşik ve ağ veri tabanı modellerinin birçok
dezavantajları vardır. Erişim yollarının tümü, dizinler,
ve indeksler ileri seviyede tanımlanır. Bir defa
tanımlandıktan sonra, büyük bir programlama çabası
göstermeksizin üzerlerinde değişiklik yapılamaz.
 Hem
hiyerarşik
hem
de
ağ
sistemlerinin
programlanması yoğundur., zaman harcama periyodu
uzundur, kurulumu zordur ve tasarım esnasında
hatalar yapılmışsa düzeltilmesi imkansız gibidir.
16
Üç Veri Tabanı Modelinin Avantaj ve
Dezavantajları:
 İlişkisel VTYS’in güçlü yanları; ad hoc sorgularına olan
geniş esnekliği, değişik kaynaklardan bilgi birleştirme
gücü, tasarım ve üretiminin basitliği ve mevcut
program ve başvurulara karışmadan yeni bilgi ve
kayıtların girilebilmesidir.
 İlişkisel VTYS’nin zayıf yanları düşük işlem
kapasitesidir.
 İlişkisel sistemler hiyerarşik sistemlerden taşınan
yüksek sayıda işaretleyiciye sahip değildir.
Şekil 8.8
17
Veri Tabanı Sistemleri İçin Yönetim
Gereksinimleri:
Veri tabanındaki önemli öğeler:
Bilgi Yönetimi,
2. Bilgi Planlama ve metodu modellendirme,
3. Veri tabanı teknolojisi ve yönetimi,
4. Kullanıcılardır.
1.
18
Veri Yönetimi:
Organizasyonun bir bilgi yönetimini geliştirmesi
ve firmanın tümü için olan bilgi ihtiyaçlarını
tanımlamasını ve üst yönetime direkt giriş vermesi
demek oluyor.
Bilgi yönetiminin ana kuralı bir bütün olarak
organizasyonun bilginin tamamına sahip olduğudur.
Bütün bilgiler bir işi tamamlamak için ihtiyacı olan
herkese uygun hale getirilmelidir.
Bir organizasyon, organizasyon içinde bilgiyi
paylaşmak, yaymak, kazanmak, standart hale
getirmek, sınıflandırmak ve envanter haline getirmeye
ihtiyaç duyar.
19
Veri Planlama ve Modelleme
Metodolojileri
Kurum geniş planlanmış veriye ihtiyaç duyar.
Organizasyonun bütün enformasyon ihtiyacını
belirleyen girişim analizi, bir veri tabanının
geliştirilmesine ihtiyaç duyar. Girişim analizinin amacı
anahtar varlıkları tanımlamak, özellikleri ve ilişkileri
kurmaktır.
20
Veri Tabanı Teknolojisi ve Yönetimi:
Veri tabanları yeni yazılımlara, yeni kadrolara
özellikle VTYS tekniklerinde eğitim almış kişilere
ihtiyaç duyar. Çoğu kuruluş kendi içinde veri tabanı
tasarımını ve yönetim grubu oluşturur. Bu grup veri
yönetim grubudur ve şunları yapar:
 Veri tabanının yapısını ve içeriğini tanımlar ve
organize eder,
 Veri tabanı güvenliği için gerekli prosedürleri geliştirir,
 Veri tabanı dokümantasyonunu geliştirir,
 Veri tabanı yönetim yazılımını düzenler.
21
Kullanıcılar:
Veri tabanı geleneksel sistemlerden daha çok
kişiye hitap eder.
Dördüncü nesil ilişkisel sistemler bilgisayar
uzmanı olmayan çalışanlarına veri tabanına ulaşma
izni verir.
Uzman olmayanlara sistemi kapatmak için eğitim
almış kişilere çok kaynak verilmelidir.
Profesyonel sistem, çalışanlarına VTYS kursları
düzenlemeli ve bu kişiler prosedürler geliştirmelidir.
22
TERİMLER:
AD-HOC QUERY: En temel sorgu biçimi.
BLOK (Block): Veri tabanındaki en küçük saklama,
koruma ünitesidir.
DAR BOĞAZ (Bottleneck): Bilgisayar literatüründe
darboğaz, sistemin performansını sınırlayan bir sistem
parçasıdır.
TAMPON BELLEK (Buffer): Bu terim, bilgiyi koruyan,
saklayan hafıza miktarıdır. Buffer, kullanılmak üzere olan
ya da henüz kullanılmamış olan bilgiyi saklar.
CACHE: Bu terim, veriye hızlı giriş sağlanması için
kullanılan, koruma alanı olarak da kullanılır. Donanım
terimlerine göre, ana RAM’e göre daha küçük miktarlarda
ancak daha hızlı çalışan hafızaya sahiptir. Sık kullanılan
bilgilerin ya da CPU (işlemci) çipleri, cache gibi yapılanmış
küçük hafıza miktarları içerirler.
KONTROL NOKTASI: Bütün değişiklikleri zorlayan bir
operasyondur. Bu, bir hata anında, veri tabanının yeniden
çalışma süresinin belirlenmesinde çok önemli bir
faktördür.
VERİ TABANI: Veri tabanı gerçek verinin kendisidir.
Verinin bulunup getirilmesi gerektiğinde erişmesi gereken
yapıdır.
VERİ SÖZLÜĞÜ (Data Dictionary): Veri tabanı hakkında
bilgi sağlamak için kullanılan bir set tablosudur. Veri
sözlüğü, tablolar, indeksler hakkında bilgi tutar.
DBA ( Database Administrator- veri tabanı yöneticisi):
Operasyon konfigürasyon ve veri tabanı performansından
sorumlu kişidir. DBA, veri tabanının geri dönüşlerinin
düzenli olarak sağlanması ve yeni yazılım yüklenmesi
operasyonunu
sağlamakla
görevlidir.
Gelecekteki
genişlemeleri ve disk alanı ihtiyacını planlamak, tablo alanı
ve veri tabanı yaratmak, kullanıcılar eklemek ve güvenliği
sağlamak, ve veri tabanını izlemek gibi sorumlulukları da
vardır. Sistemin düzgün çalışmasını devam ettirmek iin
büyük yüklemeler DBA tarafından yapılır.
DBMS ya da RDBMS ( İlişkisel Veri Tabanı
Yönetim Sistemi): Veri tabanı yönetim sistemi
yazılımıdır ve veri tabanını yöneten elemanların
toplamıdır.
FİZİKSEL HAFIZA (Physical Memory): Sistem
operasyonu ve başvuruları tarafından kullanılmak için
bilgisayarda mevcut olan gerçek donanım, RAM’i
anlatmaktadır.
SORGU (Query): Sorgu veri tabanına karşı sadece
okuma işlemidir. Kullanıcılar genellikle sorguları ve
diğer işlem tiplerini ayırt ederler. Çünkü, bir sorgu veri
tabanındaki hiçbir veriyi değiştirmez.
SANAL HAFIZA (Virtual Memory): Sistem
operasyonunda programlar için kullanılabilecek
hafızadır.Fiziksel
hafızaların
yetersizliğinden
kaynaklanan problemlerin üstesinden gelmek için,
sanal hafıza, sistemdeki fiziksel hafıza miktarlarında
büyük programlara izin verir.
DEPOLAMA BİRİMLERİ (Storage Units):
Bit: veri koruyucusunun en küçük birimidir. Bir bit 1
ya da 0’dır.
Byte: 8 bit. Bilgisayar sisteminde en basit karakteri
oluşturur. (Ör: Bir harf, rakam veya sembol).
Word: 32 ya da 64 bittir.
Kilobyte(KB): Bir kilobayt 1,024 byte.
Megabyte (MB): Bir megabyte 1,024 KB ya da
1,048,576 byte.
Gigabyte (GB): Bir gigabyte 1,024 MB ya da
1,073,741,824 byte.
Terabyte (TB): Bir terabyte 1,024 gigabyte ya da
1,099,511,627,776 byte.
Download