Büyük Veri Analitiği ve Güvenliği

advertisement
24.02.2016
Veriler : Tanımlar
Veri
• Sayısal hale dönüştürülmüş sinyaller
Büyük Veri Analitiği ve Güvenliği
Prof. Dr. Şeref SAĞIROĞLU
Gazi Üniversitesi, Mühendislik Fakültesi, Bilgisayar
Mühendisliği Bölüm Başkanı
[email protected]
Büyük Veri
• “Mevcut BT işleyemeyeceği kadar geniş ve karmaşık veri
kümeleridir.”
• “BT araçları ve uygulamalar tarafından oluşturulan, büyük hacimli,
çeşidi bol ve hızla gelen, geleneksel yöntemlerle toplama, saklama,
temizleme, görselleştirme, analiz etme ve anlamlandırma
işlemlerini kapsayan dağıtık veri kümeleridir.”
11.2.2016
Sunum Planı
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
Büyük Veriler
• Büyük Veride Bilinmesi Gerekenler
• Veri, Büyük veri, türleri, boyutları, özellikleri, önemi, güçlükler,
beklentiler
• Büyük Veri Örnekleri
• Büyük Veri Bilimi
• Büyük Veri Analitiği
TERABAYT
• Büyük Veri Araçları
11.2.2016
PETABAYT
EKSABAYT
ZETABAYT
GIGABAYT
• Büyük Veri Güvenliği
• Değerlendirmeler
4
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
2
11.2.2016
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
5
Veriler Büyüyor
Kapsamlı
BÖLÜM 1:
Veri
BÜYÜK VERİ İLE İLGİLİ BİLİNMESİ GEREKENLER
11.2.2016
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
3
11.2.2016
Büyük Veri
Smart Veri
Boyutlu
Veri
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
6
24.02.2016
Verilerin Önemi
Araştırmalar Değişiyor
Bilinen
Bilinmeyenleri
KARARLAR
amaç
BİLGELİK
ÖZBİLGİ
anlam
içselleştirme
BİLGİ
içerik
VERİ
11.2.2016
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
7
11.2.2016
Devletler Değişiyor
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
10
Büyük Veriyi Oluşturan Alanlar
•
•
•
•
•
•
•
•
•
•
•
e-, m-, uVatandaşlar
Vatandaşlar
Büyük
Veriler
Topraklar
11.2.2016
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
Veriler Değişiyor
SINIRLI
8
İşlem ve uygulama trafikleri,
e-postalar,
metin, belge, video, ses, resim,
tıklama akışları, sistem günlükleri,
arama sorguları,
sosyal ağ etkileşimleri,
sağlık kayıtları,
bilimsel veriler,
devlet ve özel sektöre ait kayıtlar,
sensörler
akıllı telefonları
11.2.2016
11
Veri Türleri artıyor..
PEK ÇOK VERİ
TİPİ
MEVCUT
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
BÜYÜK
VERİ
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
Duran
veriler
11.2.2016
Bilinmeyen
Bilinmeyenleri
9
11.2.2016
Bağlı
veriler
Zaman
serileri
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
Akışkan
veriler
12
24.02.2016
Büyük Verinin Bileşenleri (5V)
Volume (kapasite) :Terabyte, Petabyte, Daha Fazlası
Velocity (Hız): Batch, Gerçek Zamanlı, Etkileşimli
Value (Değer), İstatistiksel, Gizli, Bilinmeyen
BÖLÜM 2:
Veracity (Geçerlik): Tutarlık, Güvenilirlik
Variety (Çeşitlilik): Yapısal, Yarı-yapısal, Yapısal olmayan
11.2.2016
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
Büyük Verinin Özellikleri
Veri Saklama
İşleme Yöntemi










İsteğe Bağlı
Sürekli
Gerçek Zamanlı
Zaman Serileri
İlişkisel
Sütün Tabanlı
Graf Tabanlı
Anahtar-Değer
Doküman Tabanlı
Yüksek Performanslı Hesaplama
Dağıtık
Paralel
Grid
Kümeleme




Tahmine Dayalı
Analitik
Sorgu ve Raporlama
Modelleme
İşleme Amacı
11.2.2016




İşlemsel
Geçmiş
Meta
Ana

Toplu
Akan
İnteraktif
Yapısal
Yarı-Yapısal
Yapısal Olmayan














Web ve Sosyal Medya
Makine Kaynaklı
Nesnelerin İnterneti (IoT)
İnsan Kaynaklı
Dâhili Kaynaklar
Veri Sağlayıcıları
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
16
İnsan
İş Süreci
Kurumsal Uygulamalar
Veri Ambarları
Endüstri
Akademi
Devlet
Araştırma Merkezleri
Karma
Veri Kaynağı
Veri Tüketi cileri
Veri Kull anı mı
Analiz Türü
14
Büyük Veri Gelişmeleri
11.2.2016
11.2.2016
Veri Biçimi



BÜYÜK
VERİ



BÜYÜK VERİ ÖRNEKLERİ
Büyük Veri Sonuçları
Veri Türü
Veri Frekansı




13
11.2.2016
Kaynak: http://bits.blogs.nytimes.com/2013/06/19/sizing-up-big-data-broadening-beyond-the-internet/
17
Büyük Veri Örnekleri
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
Kaynak: http://www.memoori.com/big-data-internet-things-gartners-hype-cycle-emerging-technologies/
15
11.2.2016
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
Kaynak: http://bits.blogs.nytimes.com/2013/06/19/sizing-up-big-data-broadening-beyond-the-internet/
18
24.02.2016
Büyük Veri Örnekleri
TED Konuşması Yapan Proje
TED Konuşması Yapan Bir Yapay Zeka Sistemi
 TED Konuşmaları 2200+, SAMIM.IO, RNN
 4 milyondan fazla kelimenin kullanıldığı yaklaşık 2 bin TED konuşmasından beslenen bir proje
Google DeepDream Robot: Inceptionism
 Bilgisayarların insanları, hayvanları ve cisimleri nasıl düşündüğü, anladığı ve tanımladığı
üzerine bir proje
 Google araştırmacıları yapay zekanın görsel tanıma sürecinde ortaya çıkan “sanat eserleri”
 Makinaların etrafındaki görüntüleri olduklarından farklı bir şekilde hayal edebilmesi
POI.BOT
11.2.2016
Kaynak:
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
http://wikiproject.oii.ox.ac.uk/mapping_wikipedia/#map=id&lang=en&loc=1
19
 Her kullanıcının ayrı iletişim biçimini ve düşünme şeklini taklit etmeye çalışan kişisel robot,
kullanıcısı yerine otomatik tweet atıyor.
11.2.2016
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
22
Verilere Bilimsel Bakış
BÖLÜM 3:
BÜYÜK VERİ BİLİMİ
Kaynak: http://altmetrics.org/altmetrics12/kaur/
11.2.2016
 İnterneten yapılan aramalara dayanan matematiksel modeller ile gribin ABD’de bölgelere ve
hangi yoğunlukta yayıldığını tespiti
 Google veri tabanı ve veri işleme kapasitesiyle otoritelerinden daha etkili bir şekilde hastalığın
yayılma bilgilerine sahip
 450 milyon model kullanıldı ve gerçek vakalar ile karşılaştırıldı.
 45 arama terimi ile resmi yayılma oranları arasında çok güçlü bir korelasyon olduğu tespit edildi.
 Google tarafından ortaya konulan araştırma internetin bu zamana kadar kamu sağlığı kapsamda
kullanılmayan önemli bir yönünü ortaya koymaktaydı.
 İnternet arama motoru devinin elindeki veri insanlık için çok kıymetli yenilikçi mal ve
hizmetlerin ortaya çıkması
11.2.2016
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
23
Büyük Veri Bilimi Tanımları
Google Domuz Gribi Projesi
 2009 yılında domuz gribi salgını (H1N1 virüsü), Nature
Kaynak: S. Cook ve Ark.,DOI: 10.1371/journal.pone.0023610
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
21
 “Elektronik ortamlardan toparlanan tüm verinin, anlamlı ve işlenebilir biçime
dönüştürülmüş, ilişkisel veri tabanlarında tutulan yapısal verinin dışında kalan,
son dönemlere dek çok da kullanılmayan, yapısal olmayan veri yığınıdır.”
 “Günümüzdeki bilgi çöplüğü diye adlandırılan olgudan muazzam derecede
önemli, kullanılabilir, yararlı yani çöplükten hazine çıkmasına neden olan yegane
sistemdir.”
 “Geleneksel veritabanı araçları ve algoritmaları ile işlemesi zor olan bu büyük
verinin oluşturulması, saklanması, akışı, analiz edilmesi gibi birçok konuyu
içeren bilim dalıdır.”
11.2.2016
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
24
24.02.2016
Büyük Veri Bilimi
Veri Bilimi
Makina
Öğrenmesi
DAHA ZOR
ZOR
Matematik
İstatistik
Bilgisayar
Bilimi
Geleneksel
Yöntemler
11.2.2016
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
25
Büyük Veri Bilimi
11.2.2016
VERİ
BİLİMİ
Konu
Uzmanlığı
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
28
Veri Bilimcisi
 Sorular sorar,
 Hipotezler hazırlar ve sunar,
BELİRSİZLİK
KESİNLİK
 Denemeler yapar,
 Verileri araştırır,
 Bilinmeyeni keşfeder,
 Verileri modeller,
 Veri ilişkilerini kurar ve anlamlandırır,
 Değerlendirmeler ve çıktılar için öngörüler sunar.
11.2.2016
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
26
11.2.2016
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
Veri Bilimi İşlemleri
Veri Bilimi
FEN VE
UYGULAMALI
BİLİMLER
ÇOKLU DİSİPLİNLİ /
SOSYAL BİLİMLER
VERİ BİLİMİ
İşlenmemiş
Veri Toplama
Veri İşleme
Veri Ürünü
11.2.2016
29
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
27
11.2.2016
Veri Kümesi
Temizleme
Görselleştirilmiş
Rapor
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
Keşfedici/
Araştırmacı
Veri Analizi
Modeller /
Algoritmalar
Karar
Verme
30
24.02.2016
Hedef: Verilerden Değer Elde Etme
ALTYAPI
BÖLÜM 4:
BÜYÜK VERİ ANALİTİĞİ
11.2.2016
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
31
Büyük Veri Analitiği
 “Yüksek hacimli verilerden değer elde etmek için, istatistik bilimi, modern ve
yapay zeka hesaplama yöntemleri, bilgisayar bilimi ve matematik gibi
yaklaşımlar arasındaki entegrasyonu sağlayarak kurumlara daha etkin kararlar
almalarında yardımcı olan süreçtir.”
11.2.2016
Birleştirilmiş Kaynaklar Üzerinde Keşif
Her Çeşit Veriyi Saklama ve Yönetme
Yapısal Verilerin Hızlı Analizi
 “Bilinmeyen saklı örüntülerin, bilinmeyen ilişkilerin, kullanıcıların veya
hizmetlerin eğilimleri, tercihleri veya diğer faydalı işlerdir.”
Akan Verilerin Yönetimi
Elde edilen çıktılar:
 daha efektif satış veya hizmet, yeni iş veya kazanç fırsatları, daha iyi ve kaliteli
müşteri hizmetleri, operasyonel iş verimliliğinin iyileştirilmesi, rekabetçi
ortamların daha sağlıklı olması ve diğer iş alanlarında kullanılabilir.
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
32
Büyük Veri Analitiği
Yeni Mimariler ve
Uygulamalar
Yapısal Olmayan Veri Analizi
Veri Kaynaklarının Entegrasyonu
11.2.2016
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
35
Büyük Veri Analitiği Adımları
Analitik
İşlemler
FAYDALANMA
Problemi
Tanımlama
Saklama
Edinme/Sahip
Olma
11.2.2016
34
Gereklilikler
 “Farklı veri setlerine sahip olan büyük verilerin analiz edilmesidir.”
11.2.2016
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
33
11.2.2016
İhtiyaç
Tasarımı
Veri Ön
İşlemleri
Veriler Üzerinde
Analitik İşlemler
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
Verileri
Görselleştirme
36
24.02.2016
Büyük Veri Teknik ve Teknolojileri
Büyük Veri Analitiği
11.2.2016
Kaynak: GARTNER
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
37
Büyük Veri Analitiği
 Elde edilecek değerler ile saygınlık, karlılık, hizmet
kalitesi arttırabilir,
 Müşteri memnuniyetini ölçülebilir,
 Risk analizleri yapabilir, yeni riskler alınabilir,
 Geleceğine yön verebilir,
 Kurumlarının değeri artırılabilir.
 Kurumların kendilerini daha iyi değerlendirmelerini
sağlayabilir.
 Yeni iş alanları ve iş modelleri geliştirilebilir.
11.2.2016
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
Kaynak : http://mattturck.com/category/big-data/
Büyük Veri Teknik ve Teknolojileri
Platform Türü
Lokal
Bulut
38
11.2.2016
Araçlar
Hadoop, Spark,
MapR, Cloudera,
Hortonworks, InfoSphere,
IBM BigInsights, Asterix
AWS EMR, Google Compute Engine,
Microsoft Azure, Pure System,
LexisNexis HPCC Systems
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
41
Büyük Veri Teknik ve Teknolojileri
Veritabanı Türü
SQL
NoSQL
Column
BÖLÜM 5:
BÜYÜK VERİ ARAÇLARI
11.2.2016
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
Key-value
Document
Graph
In-Memory
39
11.2.2016
Araçlar
Greenplum, Aster Data, Vertica, SpliceMachine
HBase, HadoopDB, Cassandra, Hypertable, BigTable, PNUTS,
Cloudera, MonetDB, Accumulo, BangDB
Redis, Flare, Sclaris, MemcacheDB, Hypertable, Valdemort,
Hibari, Riak, BerkeleyDB, DynamoDB, Tokyo Cabinet,
HamsterDB
SimpleDB, RavenDB, ArangoDB MongoDB, Terrastore,
CouchDB, Solr, Apache Jackrabbit, BaseX, OrientDB, FatDB,
DjonDB
Neo4J, InfoGrid, Infinite Graph, OpenLink, FlockDB,
Meronymy, AllegroGraph, WhiteDB, TITAN, Trinity
SAP HANA
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
42
24.02.2016
Büyük Veri Teknik ve Teknolojileri
Fonksiyonellik
Veri İşleme
Veri Ambarı
Veri Toplama &
Transfer
Arama
Sorgu Dili
İstatistik &
Makine Öğrenmesi
İş Zekası
Görselleştirme
11.2.2016
Sosyal Medya
Analizi
Araçlar
MapReduce, Dryad, YARN, Storm, S4, Kafka, BigQuery
Hive, HadoopDB, Hadapt
Sqoop, Flume, Chukwa
Verilerin Güvenliği
EN ÖNEMLİ
ÇOK ÖNEMLİ
Lucene, Solr
Pig Latin, HiveQL, DryadLINQ, MRQL, SCOPE, ECL
Mahout, Weka, R, SAS, SPSS, Pyhton, Pig, RapidMiner,
Orange, BigML, Skytree
Talend, Jaspersoft, Pentaho, KNIME
Google Charts, Fusion Charts, Tableau Software,
QlikView
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
43
Radian6,
Clarabridge
ÖNEMLİ
11.2.2016
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
46
Büyük Verilere Sahipler
 Sıradan sunuculardan oluşan küme üzerinde büyük verileri işleme amacıyla
uygulamaları çalıştıran ve Hadoop Distributed File System (HDFS) olarak
adlandırılan bir dağıtık dosya sistemi ile MapReduce özelliklerini bir araya
getiren, açık kaynaklı bir Java kütüphanesidir.
 Birçok büyük veri teknolojisinin temelini oluşturmaktadır.
 FACEBOOK
 bizim sosyal ilişkilerimizi, nelerden hoşlandığımızı, …
 GOOGLE
 arama alışkanlıklarımızı, ilişkilerimizi, yazdıklarımızı, konuştuklarımızı, arkadaşlarımızı, bilgi
birikimimizi, sağlımızı, … herşeyimizi, ülkeleri ve vatandaşlarını
 TWITTER
 düşündüklerimizi, duygularımızı, alışkanlıklarımızı, tepkilerimizi, …
 MOBİL İŞLETMELER
 kiminle ne konuştuğumuzu,konumlarımız, sevdiklerimizi, tatillerimizi, boş vakitlerimizi kiminle
geçirdiğimizi, hangi arkadaşımıza ne kadar yakın olduğumuzu, etc.
11.2.2016
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
44
 DEVLETLER
 vatandaşlarının internet üzerinden gerçekleştirdikleri işlemleri izleme kapasitesini önemli oranda
arttırmıştır. Örn: NSA skandalları
11.2.2016
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
47
Büyük Veri Güvenlik ve Gizlilik Konuları – Literatürdeki Çalışmalar
Hadoop
Güvenliği
Bulut Güvenliği
Gözetim
Anahtar
Yönetimi
Veriler
Twitter
Uygulanamaz (N/A)
N/A
Saldırı tespit mimarisi
Kötü niyetlilik metrikleri
DNS, IP kayıtları, HTTP
trafiği, honeypot verisi
Güvenli veri depolama
Güvenli grup anahtarı transferi
Güvenli grup veri paylaşımı
BÜYÜK VERİ GÜVENLİĞİ
11.2.2016
Metot
Bağlantılar arası güven mekanizması
Kerberos mekanizması, Bull Eye algoritması ve Name node yaklaşımı
Doğrulama, Şifreleme, şifre çözme ve sıkıştırma
Anomali tespiti / Ağ davranışı
tahmini
Anormal kullanıcı davranışı tespiti
Dinamik veri depolama denetimi
Güçlü anahtar oluşturma / Kimlik
doğrulama
Denetim
BÖLÜM 6:
Amaç
Hadoop’da güvenlik ve gizlilik
HDFS güvenliği
Güvenli veri depolama
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
Yapılandırılmamış verilerin güvenliği
45
Anonimleştirme Hassas alanların gizlenmesi
Mahremiyeti koruyan veri
madenciliği
Anonimleştirme için ölçeklenebilirlik
Ölçeklenebilir mahremiyet koruması
11.2.2016
Anahtar kuruluş şeması ve kimlik tabanlı şifreleme algoritması
10GB boyutlu
Veri toplama, entegrasyon, analiz ve yorumlama
N/A
Kuantum kriptografi ve PairHand protokolü
N/A
Şartlı proxy yeniden şifreleme şeması
N/A
XML, e-mail, metin,
resim, video, ses vb.
Intel Circuit logları
Kendinden garantili sistem
Merkle Hash Tree tabanlı MuR-DPA
Diffie-Hellman tabanlı anahtar şeması
Veri analitiği ve güvenliği
K-anonimleştirme tabanlı metrikler
Adaptif fayda tabanlı anonimleştirme modeli
N/A
N/A
N/A
UCI Adult
Hibrit yukarıdan aşağıya ve aşağıdan yukarıya alt ağaç anonimleştirme UCI Adult
İki fazlı kümeleme algoritması
Cencus-Income
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
48
24.02.2016
Büyük Veri Güvenlik ve Gizlilik Konuları
 Altyapı Güvenliği
 Saklama ve paylaşımda SLE kullanımı, İlişkisel olmayan NoSQL gibi veri tabanları için hem enjeksiyon
gibi klasik tehditlere karşı hem de sisteme özgü ek güvenlik önlemleri alınmalıdır.
 Veri Gizliliği
 Veri madenciliği ve analitik süreçlerinin, gizliliği koruyarak ve suistimalleri önleyerek
gerçekleştirilmesi, sistemlere erişimin sınırlandırılması ya da verinin şifrelenmesi
 Veri Anonimleştirme ve Sentetikleştirme
 Veri Maskeleme, Yerine Koyma, Kayıt Karıştırma, Varyans ve Şifreleme Tekniği
 Yasal zorunluluklar: ABD: GLBA (Gramm-Leach-Bliley), AB 95/46/EC Yönt., UK Veri Koruma Yasası
 Anahtar Yönetimi
 Şifre paylaşımlarının güvenli kanallar aracılığıyla yapılması, hızlı ve dinamik kimlik doğrulama
yöntemleri kullanımı
 Veri Yönetimi
 Verinin kaynağının bilinmesi, graflar şeklinde analizinin yapılması, uygulamaların doğrulanması
 Bütünlük ve Tepkisel Güvenlik
 Cihazlardan ve uygulamalardan toplanan verinin sunum aşamasında filtrelenip doğrulanarak
kullanılması
 Tüm koruma ve güvenlik önlemleri alındıktan sonra, büyük veri altyapısının ve analizlerinin gerçek
zamanlı olarak gözetilmesi
Kısmen Faydalanılan Kaynak: http://www.slideshare.net/PeterWoodx/big-data-and-security-where-are-we-now-2015
Büyük Veri Başka Sistemlerin Güvenliğini Sağlamak Amacıyla Kullanılması
 Depolanan veya akan verinin analizi, bu aktivitelerin bilgi güvenliğinde
kullanılmasına da sebep olmuştur.
 Log kayıtları, sistem olayları, ağ trafikleri, SIEM (security information and event
management) uyarıları, siber saldırı örüntüleri, iş süreçleri ve diğer bilgi kaynakları
kullanılarak pek çok analiz ve karar destek sistemleri geliştirilmektedir.
o Anomali tespiti,
o Saldırı tespiti,
o Zararlı yazılım tespiti,
o Dolandırıcılık tespiti,
o APT (advanced persistent threats) tespiti,
o Gerçek zamanlı savunma sistemleri,
o Adli bilişim.
11.2.2016
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
50
Değerlendirmelerimiz : 1
Büyük Veriye Öncelikle Sahip Olmak
Gerekiyor...
Büyük verileri toplamak için strateji ve uygulamalara
ihtiyaç var.
Büyük verileri toplayan ve güvenli olarak saklayan
sistemlere, uygulamalara ve araçlara ihtiyaç var.
11.2.2016
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
52
Değerlendirmelerimiz : 2
Büyük Veri / Büyük Problem...
 Ham formda veri yönetmek son derece zordur.
 Verilerin kategorize edilmesi ve buna göre depolanması ve
önceliklendirilmesi gerekiyor.
 BVye harcanan zamanın %80’i yapılandırmada geçiyor.
 Verileri depolamak değil, verinin içindeki yapıları keşfetmek, veriyi
analiz etmek, geleceğe dönük tahminler yapmak
 Altyapıyı, mimari yapıyı, verileri ve veri yapılarını gözden geçirmek
 Birbiri ile entegre çalışabilen platformlar, sistemler, uygulamalar
yüksek bilgi birikimi gerektiriyor.
11.2.2016
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
53
Değerlendirmelerimiz : 3
BV Miktarı Büyüyor... İhtiyaçlarda Artıyor...
Büyük Veri Pazarı büyüyor (%27’lik büyüme)
Yatırımlar artıyor.. (2015 yatırımı 75 Milyar TL)
Yeni yatırımlara ihtiyaç var (2017, 100 Milyar TL)
Geleneksel veri merkezlerinden ziyade yeni veri
merkezlerine ihtiyaç var.
Uzman personel ihtiyacı artıyor.
Beklentiler artıyor, yeni başarı hikayelerine ihtiyaç var.
BÖLÜM 7:
BÜYÜK VERİNİN ÖNÜNDEKİ ENGELLER
11.2.2016
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
51
11.2.2016
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
54
24.02.2016
Değerlendirmelerimiz : 4
Değerlendirmelerimiz : 7
 Yeni Değerler Elde Etmek Gerekiyor.
 BV’lerin çoğu maalesef değer elde etmek için yetersiz.
Beklentilere cevap verecek çıktılar üretilemiyor.
 BVlerin kıymetlendirilmesi gerekiyor bunun içinde veri
bilimcilerine ihtiyaç var.
 Her veriden beklenen değer elde edilemeyeceği gerçeğiyle
verilerden değer elde etmek, yapılan işlere değer katmak
gerekiyor.
11.2.2016
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
55
Değerlendirmelerimiz : 5
56
58
11.2.2016
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
59
Değerlendirmelerimiz : 9
Artık Verilerin Her Yerde Olduğu veya
Olabileceği Unutulmamalı ve Değer Elde
Edebilecek Planlar Yapmalıdırlar.
BV Analitiği için Uzmanlığa İhtiyaç Var.
 BV ile büyük hedeflere ulaşmak için hala insan
girdilerine ihtiyacı var, şimdilik bu süreci
otomatikleştirmek zor görünüyor.
 BV bir süre daha uzmanlara ihtiyacı var.
 Bu bir al-kur-sonuç-al işi değil... Bunun için deneyimli
uzmanlara ihtiyaç var.
 Deneyim burada önde gelen unsur.
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
 BV ile ilgili pek çok çözüm mevcut fakat tam otomasyon için
yeni yaklaşımlara ve çözümlere ihtiyaç var.
 Kullanılan araçlar ne kadar iyi tanınıyor ve uzman deneyimi
ne kadar yüksek ise verilerin kıymetlendirilebilmesi ve elde
edilebilecek değerde o derece yüksek olacaktır.
Değerlendirmelerimiz : 6
11.2.2016
 Veri toplama yaklaşımlarını yenileme, değişken sayısını
arttırma gibi
11.2.2016
BVnin Yeni Araçlara / Metotlara / Bunları
Kullanan Uzmanlara İhtiyacı Var.
 Verilerin iç ve dış kaynaklı olması değeri arttıracaktır.
 Farklı veri gruplarının örtüştürülmesi farklı çıkarımların
elde edilmesini sağlayacaktır.
 Önemli olan büyük veriler içerisinde büyük fırsatlar
olacağını tam anlamıyla anlamak ve buna uygun
hareket etmektir.
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
 Her kurum sahip olduğu verilerden değer elde edemeyebilir
veya bu beklenen düzeyde olmayabilir.
 Standart veri çözümleri ile değer elde ediliyorsa, ve yeterli
ise büyük veri analizi için beklemekte fayda olabilir.
 Bugün için değer elde edilmemiş olsa bile bunun sebebini
bile bilmek ve gelecek için önlem almak ise diğer bir
değerdir.
Değerlendirmelerimiz : 8
 Verilerin Çeşitli Olması Elde Edilecek
Değerleri Artıracaktır.
11.2.2016
BVden Her Zaman Değer Elde Edilemeyebilir.
57
 İnternet ve sensör teknolojilerinin gelişmesi, uygulamaların ve
hizmetlerin artması ile BV analitiğine hemen hemen her kurumun
ihtiyaç duyacağı açıktır.
 Kurumlar verileri olduğu sürece ayakta kalabilecek, amaçlarına iyi
hizmet edebilecek, daha yüksek değer oluşturabileceklerdir.
 Bu bakış açısıyla kurum verileri toplanmalı, güvenli olarak saklanmalı,
analiz edilmeli ve değerler elde edilmelidir.
24.02.2016
Değerlendirmelerimiz : 10
İyi Uygulamaların Geliştirilmesi ve
Paylaşılması
Safe Harbor Statement
 İyi uygulamaların paylaşılması bu konuya olan ilgiyi artıracak
ve karşılaşılan problemlerin çözümünü hızlandıracaktır.
 Kamuda veri paylaşımının önü açılmalıdır.
 Konu uzmanlarının sayısı artırılmalıdır.
 Paylaşım için ortak bir platform oluşturulmalıdır.
https://www.data.gov, https://www.govdata.de gibi
 Bu tür etkinliklerin sayısı arttırılmalıdır.
The following is intended to outline our general product direction. It is intended for information
purposes only, and may not be incorporated into any contract. It is not a commitment to deliver
any material, code, or functionality, and should not be relied upon in making purchasing decisions.
The development, release, and timing of any features or functionality described for Oracle’s
products remains at the sole discretion of Oracle.
Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | Oracle Confidential – Internal/Restricted/Highly Restricted
64
TEŞEKKÜR EDERİM
Prof. Dr. Şeref SAĞIROĞLU
Gazi Üniversitesi, Mühendislik Fakültesi
Bilgisayar Mühendisliği Bölümü
Eposta: [email protected]
HACİM
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
ÇEŞİTLİLİK
BÜYÜK VERİ....?
http://bigdatacenter.gazi.edu.tr
11.2.2016
HIZ
62
Copyright © 2014 Oracle and/or its affiliates. All rights reserved. |
Büyük Veri Büyük Dönüşüm
Devamlılık
Dr. Pelin Özbozkurt
Oracle Büyük Veri Çözümleri Lideri, Türkiye ve Orta Asya
Pelin.ozbozkurt @oracle.com
Veriyi Topla
Dönüşüm
Veriyi Analiz Et
Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | Oracle Confidential – Internal/Restricted/Highly Restricted
63
Copyright © 2014 Oracle and/or its affiliates. All rights reserved. |
65
24.02.2016
44%
Müşteri/Vatandaş
Analizi
30%
Operasyonel
İyleştirme
Büyük Veri
Kullanım Alanları
26%
Yeni İş Modelleri
Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | #StrataHadoop - Oracle Big Data Architecture
Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | Oracle Confidential – Internal/Restricted/Highly Restricted
Sağlık ve
Sosyal
Güvenlik
Büyük Veri ile ilgili Doğru
Bilinen Yanlışlar
Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | Oracle Confidential – Internal/Restricted/Highly Restricted
68
•Sağlık Harcamalarını Azaltmak
•Yasadışı İşlemleri (Fraud)
Engellemek
•Hastalık&Teşhis&Tedavi Arasındaki
İlişkiyi Analiz Etmek
•Hastalık risk tahmini/Riskli
Bölgelerin Tespiti
Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | Oracle Confidential – Internal/Restricted/Highly Restricted
71
KAMU GÜVENLİĞİ
Büyük Veri ile İlgili Doğru Bilinen Yanlışlar!
• Sosyal Medya Analizi
1. Veri boyutu?
2. Yapısal/Yapısal Olmayan Veri
3. Maliyet?
Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | Oracle Confidential – Internal/Restricted/Highly Restricted
70
• Suç/Şüpheli/Yüksek Suç Riskine Sahip Bölgelerin
Tespiti
• Olay Tahminlemesi
• Siber Suçların Tespiti/Önlenmesi
• Gümrük Güvenlik Kontrol
69
Copyright © 2014 Oracle and/or its affiliates. All rights reserved. |
72
24.02.2016
Enerji
BÜYÜK VERİ ANALİZİ
•Akıllı ve sürekli hizmet
sağlayan modern enerji
network sistemleri
2010 ile 2040 yılları arasında enerji
tüketiminde beklenen artış:
Gelişmiş ülkeler:%56
Gelişmekte olan ülkeler: %90
•Gerçek zamanlı peak/off
peak enerji tüketiminin
analizi
ANALİZ ET
DEĞER YARAT
KARAR VER!
•Kullanıcı şikayet yönetimi:
Verilerin gerçek zamanli
analizi ile şikayet gelmeden
yerinde müdahale
Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | Oracle Confidential – Internal/Restricted/Highly Restricted
VERİYİ KEŞFET
76
BÜYÜK VERİ ANALİZİ
Akıllı Tenis Raketleri
Gerçek zamanlı oyuncu performansı
Vuruş hızı ve tekniğe göre kazanılan puan sayısı
VERİYİ
TOPLA & DÜZENLE
Ürün bittikçe uyarı veren minibar
Oda sıcaklık ayarını yapan akıllı klimalar
Mobil cihazlara gönderilen oda kartları
Akıllı park sistemleri ile daha kolay ve sorunsuz araç park etme
Gerçek zamanlı trafik yoğunluğuna göre değişen otopark fiyatları
Sürücüleri en yakın rotaya yönlendirme
Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | Oracle Confidential – Internal/Restricted/Highly Restricted
VERİYİ
TOPLA & DÜZENLE
Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | Oracle Confidential
73
Nesnelerin Analitiği ve Büyük Veri
GÖRSELLEŞTİR
Veri Rezervi :
•Farklı kaynaklardan farklı formatta gelen veriler (text
data, GPS datası, web logları vs)
•Arşivleme
•Canlı Soğuk Veri
•Uzun Dönemli Veri- Analitik çalışmalar, trend analizi
•Kaliteli ve Tutarlı Veri
•Yüksek performans
•Düşük Maliyet
74
Copyright © 2014 Oracle and/or its affiliates. All rights reserved. |
Copyright © 2014 Oracle and/or its affiliates. All rights reserved. |
77
BÜYÜK VERİ ANALİZİ
VERİYİ KEŞFET
Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | Oracle Confidential – Internal/Restricted/Highly Restricted
75
Veri Keşfi:
•Bütün Veri
•Veri Anormallikleri
•Pattern Analizi
•Kümeleme
•Yüksek Kaliteli Analitik Çalışmalar ve Karar destek
Sistemleri için Perfomanslı Ön Analizler
Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | Oracle Confidential
78
24.02.2016
BÜYÜK VERİ ANALİZİ
ANALİZ ET
BÜTÜN VERİ ile:
Analitik Çalışmalar:
•Bütün Veri ile Analitik
•Trend Analizi
•Tahminsel Modellemeler
•Optimizasyon
•Otomatize edilmiş İstatistiksel Modeller ve Karar
Destek Sistemleri
•Gerçek Zamanlı Analitik
•Yüksek Perfomans
Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | Oracle Confidential
DAHA HIZLI
GERÇEK ZAMANLI
GÜVENİLİR
79
BÜYÜK VERİ ANALİZİ
Oracle Büyük Veri Platformu
Büyük Veri Yönetim Sistemi
İŞ
ANALİTİKLERİ
BÜYÜK VERİ
UYGULAMALARI
Raporlama
•Bütün Veri de Görsellik
•Yüksek Perfomanslı İş Zekası Raporları
DİKEY SEKTÖR
z UYGULAMALARI
VERİ KEŞFİ
İŞ ANALİTİKLERİ
VERİ REZERVUARI
VERİ AMBARI
VERİ
KAYNAKLARI
BÜYÜK VERİ
YÖNETİMİ
GÖRSELLEŞTİR
Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | Oracle Confidential – Internal/Restricted/Highly Restricted
Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | Oracle Confidential
80
Oracle Büyük Veri Platformu
BÜYÜK VERİ ile Etkin Karar Destek Sistemleri
Veri &Metin Madenciliği
Sosyal Ağ Analizi
RAPORLAMA
VERİ REZERVUARI
BÜYÜK VERİ
UYGULAMALARI
ANALİZ ET
Copyright © 2014 Oracle and/or its affiliates. All rights reserved. |
GÖRSELLEŞTİR
•Uzun Dönemli, daha fazla
hareket ile daha yüksek başarılı
analitik modeller
VERİYİ
TOPLA&DÜZENLE
•Güvenilir ve Performanslı Karar
Destek Sistem Altyapısı
Bağlı ve Entegre
Kurumlardan Gelecek
BÜTÜN Veri
Copyright © 2014 Oracle and/or its affiliates. All rights reserved. | Oracle Confidential – Internal
VERİ
KAYNAKLARI
KEŞFET
•DW kontrolünde olmayan, yeni
gelen verilerin analizi
•Ad Hoc Raporlama için Temel
KARAR
Veri İçindeki Yapı
Uç Gözlemler
Kural Bazlı Algoritmalar
•Data Offload
•Uzun Dönem (Sıcak) Arşiv
81
•Düşük Maliyet
Copyright © 2014 Oracle and/or its affiliates. All rights reserved. |
82
24.02.2016
Oracle Büyük Veri Yönetim Sistemi
VERİ REZERVUARI
Cloudera Hadoop
Oracle Big Data
Connectors
Oracle Big Data SQL
Oracle NoSQL
Oracle R Advanced
Analytics for Hadoop
Oracle Data
Integrator
Oracle R Distribution
Big Data Appliance
Apache
Flume
Oracle
Database
Oracle
Database
Oracle Industry
In-Memory,
Multi-tenant
Models
Oracle Industry Models
Oracle Advanced
Analytics
Oracle Advanced
Analytics
Oracle Spatial & Graph
Oracle Spatial & Graph
Bul
Gözlemle
Dönüştür
Keşfet
Paylaş
Exadata
Oracle
GoldenGate
Oracle Data
Oracle
Oracle Event
Integrator GoldenGate Processing
VERİ
KAYNAKLARI
Oracle Event
Processing
VERİ AMBARI
Oracle Big Data Discovery – Hadoop için görsel arayüz
Copyright © 2014 Oracle and/or its affiliates. All rights reserved. |
Copyright © 2014 Oracle and/or its affiliates. All rights reserved. |
Big Data SQL
88
Oracle Büyük Veri Platformu
Tüm veride SQL
• Hadoop üzerinde SQL’in tüm özelliklerini kullanabilme
• Tüm veride SQL sorgusu çalıştırabilme
• Sonuçları Oracle veritabanı ile entegre edebilme
Teknik Faydalar
SQL
Copyright © 2014 Oracle and/or its affiliates. All rights reserved. |
• Tamamen Önceden Entegre Edilmiş Bütünleşik Sistemler
• Açık kaynak koduna Oracle tarafından verilen kurumsal destek
• İlişkisel ortamların limitasyonlarının ortadan kaldırılması
• Yeni teknolojiyi eski bilgi birikimiyle kullanabilme esnekliği:
Big Data SQL
• Büyük veri dünyası ile ilişkisel dünyanın bir araya getirilmesi:
Big Data Connectors
• Büyük veriyi yönetebilmenin en maliyet etkin yolu!
Copyright © 2014 Oracle and/or its affiliates. All rights reserved. |
Oracle R Enterprise
Tüm Veride Analitik İşlemler
• Hadoop üzerinde analitik işlemler
• R’ın gücünü ölçeklendirilebilir ve yüksek performanslı hale getirme
• R konektörü sayesinde aynı R sorgularını veri tabanında da
çalıştırabilme
Copyright © 2014 Oracle and/or its affiliates. All rights reserved. |
R
Oracle Big Data Appliance
Bazı Güncel Örnekler
Copyright © 2014 Oracle and/or its affiliates. All rights reserved. |
Oracle Confidential – Internal
89
24.02.2016
Türkiye’nin önde gelen bankalarından biri
İSPANYA Banka
Müşteri DNA
Pazarlama ve Satış için Bir Sonraki En İyi Aksiyon Analizi
Hedefler
• Müşteriyi daha yakından tanıma.
• Müşterinin davranışsal verilerinin de analiz edilmesi.
• Müşteriye daha uygun ürünün ve çözümün sunulması.
• Müşteri memnuniyetini artırma
• Müşterinin davranışsal verilerinin de risk parametrelerini hesaplamada
kullanılması.
• Tüm verilerin yüksek hızda analizi ve raporlanması.
• Verilerin silinmemesi ve ileride olası analizlerde kullanılması.
Hedefler
• Gelirlerin çok yüksek oranda
kişiselleştirilmiş öngörüsel analizler ile
arttırılması.
• Arttırılmış dönüşüm oranları ve hesap
kıymeti için Akıllı Bankacılık.
• Web sitelerinin, ATM’lerin, Kredi
Kartlarının ve POS işlemlerinin gerçek
zamanlı filtrelenmesi için Büyük Veri
çözümünün sağlanması.
• Gerçek zamanlı öğrenme ile her
müşteriye önerilerde bulunulması.
Copyright © 2014 Oracle and/or its affiliates. All rights reserved. |
91
Türkiye’nin önde gelen telekom operatorlerinden biri
Hedefler
• Veri ambarı fonksiyonalitesini artırma.
• Farklı verileri de analize dahil etme.
• ETL performansını artırma.
• Yapısal olmayan verileri inceleme ve saklama
• Yeni analitiklerin üretilmesi ve iş birimlerinin kullanımına sunulması.
• “Kum havuzu” uygulamasının iş birimlerinin kullanımına sunulması.
Hedefler
• Seyahat edenler ile hizmet sağlayıcıları arasındaki taleplerin tüm kanallar
üzerinden karşılanması: “değilse, neden değil?” Analizleri.
• Fiyat optimizasyonu yapılırken tüm tekliflerin yakalanarak BDA’ya
kaydedilmesi.
• Satış performansı üzerinde kullanılabilirlik (Availability) etkisinin yaratılması.
• Pazar analizleri: rota olmaması sebebi ile satışta kapasite fazlası ve kayıp
durumları  Yeni tekliflerin yaratılması!
Copyright © 2014 Oracle and/or its affiliates. All rights reserved. |
92
Sağlık Sigortası Değişim Platformu- ABD
Genel Bakış
• Eyalet Sağlık Sigortası Değişim Platformu.
• Bu değişim Platformu ile halkın sağlık planlarını
bulup karşılaştırabilecekleri ve kendilerine en
uygun olan içeriktekileri seçebilecekleri bir sağlık
sigortası pazar alanı yaratılması amaçlanmaktadır.
Zorluklar/Fırsatlar
• Büyük Veri mimarisi ölçeklenememektedir.
• Kısa proje süreleri – 2 ay içinde Canlıya geçiş.
• Cloudera HBase ile çok hızlı kurulabilecek bir
platform ihtiyacı.
• Canlı, Test ve DR ortamlarının eş zamanlı kurulum
ihtiyacı.
Copyright © 2014 Oracle and/or its affiliates. All rights reserved. |
95
Basın – Hollanda
Müşterini tanı, yeni servisler yarat
Faydalar
• Oracle BDA, diğer üretici
çözümleri ile kıyaslandığında
en etkin fayda/maliyet oranını
sağlamaktadır.
• Oracle BDA sıkışık proje
sürelerini sağlayabilen tek
çözüm olmuştur.
• Oracle BDA çözümü mevcut
Exadata ile InfiniBand
üzerinden mükemmel şekilde
entegre olmaktadır.
Copyright © 2014 Oracle and/or its affiliates. All rights reserved. |
94
Havayolu, Seyahat ve Ağırlama Çözümleri
ABD
Veri Ambarı Genişletme
Sağlık Sigortası Değişim Platformu
Copyright © 2014 Oracle and/or its affiliates. All rights reserved. |
93
Hedefler
• İçeriğin dijital araçlar üzerinden piyasaya sürülmesi
• Müşterilerin tanınması
• Segmentasyon ve tekliflerin uygun hale getirilmesi
– Tabanın büyütülmesi
– Yeni müşterilerin cezbedilmesi
.
Copyright © 2014 Oracle and/or its affiliates. All rights reserved. |
96
24.02.2016
BÜYÜK VERİ: ORACLE TEKNOLOJİSİ ve UZMANLIĞI İLE...
BÜYÜK VERİ KEŞİF
ÇALIŞTAYLARI
BÜYÜK VERİ PROJE PLANI
BÜYÜK VERİ TEKNİK
ALTYAPI ÖNERİSİ
Büyük Veri Analitiği ve Güvenliği Kamu Çalıştayı
Büyük Veri Güvenliği
ve
Mahremiyeti
BÜYÜK VERİ TEKNİK
ÇALIŞTAYLAR
Yusuf TULGAR
Donanma Şirketler Grubu, CEO
email: [email protected]
Copyright © 2014 Oracle and/or its affiliates. All rights reserved. |
Büyük Veri
İnternetin yaygınlaşmasından ve internetteki veri
miktarının fazlalığından yola çıkarak her şeyi büyük
veri olarak adlandırma yönünde bir eğilim vardır.
Büyük veri, bilişim teknolojilerindeki ilerlemeler
sonucunda veri saklama kapasitesinin ve işlem
hızının artmasıyla ortaya çıkan 3V
• Aşırı büyük veri hacmi (volume)
• Yüksek veri hızı (velocity)
• Çok geniş veri çeşitliliği (variety)
ile tanımlanmaktadır.
Copyright © 2014 Oracle and/or its affiliates. All rights reserved. |
Kamu Kurumlarında
e-Devlet Projeleri
e-devlet Projelerinden Bazıları
•
•
•
•
•
•
•
MERNİS
TAKBİS
UYAP
VEDOP
POLNET
MEBSİS
e-DEVLET KAPISI
24.02.2016
Kamu Kurumlarında Büyük Veri Mahremiyeti
Kamu Kurumlarında Büyük Veri Güvenliği(Veri
koruma)
Kamu Kurumlarında Büyük Veri Güvenliği(Veri
koruma)
Kamu Kurumlarında Büyük Veri Güvenliği(Veri
koruma)
Kamu Kurumlarında Büyük Veri Güvenliği(Veri
koruma)
Kamu Kurumlarında Büyük Veri Bütünlüğünün
Korunması
Kamu kurumlarında,
• Önemsiz veri yoktur.
• Dijital ortamdaki her türlü veri değerlidir.
• Kullanıcıların kişisel verileri kıymetlidir.
• Saklanan veri kadar veri oluşturma, düzenleme, erişme,
silme, çoğaltma, paylaştırma logları da önemlidir.
• Bilgi işlem bölümlerindeki kullanıcılar ancak kendi
yetkileri kapsamındaki verilere ulaşabilmelidir.
• En yetkili-bilgili kişiler dahi başka kullanıcılara ait verilere
ulaşamamalıdır.
• Tüm veriler mümkün olduğunca merkezi sistemlerde
saklanmalı ve bu sistemlerin her türkü erişim noktaları
kontrol altına alınarak loglanmalıdır.
Kamu kurumlarında,
• Dijital ortamdaki tüm veriler (video, fotoğraf, ses,
doküman, sistem ve veri tabanı yedekleri, mail vs.) kriptolu
bir ortamda saklanmalı ve kripto anahtarlarının güvenliği
sağlanmalıdır.
• Veriler yatayda büyüyebilen merkezi İçerik Yönetim
Sistemlerinde saklanmalıdır. (Mümkün olduğunca kullanıcı
bilgisayarlarında veri tutulmamalıdır.)
• Kullanıcılara güvenli ortak çalışma alanları sağlanmalıdır.
• Kullanıcılar yetkileri dahilinde güçlü arama araçlarına sahip
olmalıdır.
• İhtiyaç durumunda kurum tarafından denetlenebilen
güvenli veri paylaşım ortamları sağlanmalıdır.
• Tüm verilerin eski versiyonlarına erişim sağlanabilmelidir.
• Kamu kurumları ve taşra birimleri arasında güvenli veri taşıma
sistemleri kurulmalıdır.
• Mail ortamında veri taşıma operasyonları durdurulmalıdır.
• Merkezi veri depolama alanlarında kullanıcı yetkilendirmesi
yapılabilmelidir.
• Kamu kurumlarının tüm verileri düzenli yedeklenmelidir.(Tam, Fark,
Log Yedek)
• Kamu verileri dosya sistemleri üzerinde saklanmamalıdır.
• Kurum veri üzerinde
•
İşlem Tipi (ekleme, silme, düzeltme, okuma, kurtarma), İşlem Tarihi, Kullanıcı Adı, Adı Soyadı, Bilgisayar
Adı, MAC Adresi, IP Adresi
detayında log tutulmalıdır.
• Veriler organize edilerek sistemler üzerinde güvenli bir şekilde
taşınabilmelidir.
Kamu kurumlarının,
• Verilerinin saklandığı içerik yönetim sistemleri
virüslerden etkilenmemelidir.
• Verileri kullanıcıların yetkileri ile silinerek yok
edilememelidir.
• Verileri merkezi bir içerik yönetim sisteminde
depolanırken dinamik indeksleme mekanizmaları ile
indekslenebilmelidir. Bu sayede tüm veriler
arşivlenirken anlamlandırılabilmelidir.
• Tüm dosyaların eksiksiz hash (özet) bilgisi saklanmalıdır.
• Verilerinin saklandığı içerik yönetim sistemlerinde,
dosya içeriklerine göre arama yetenekleri olmalıdır.
Kamu kurumlarında,
• İçerik yönetim sistemleri kurumdaki tüm sistemler ile web servisleri
üzerinden entegre edilebilmelidir.
• İçerik yönetim sistemleri web, desktop, akıllı telefon teknolojilerini
desteklemelidir.
• İçerik yönetim sistemleri üzerinde depolanan veriler üzerinde detaylı
istatistik verileri alınabilmelidir.
• İçerik yönetim sistemleri üzerinde tutulan veriler kötü niyetli yetkili
personeller tarafından kurum dışına çıkartılamamalıdır. Çıkartıldığında
hiçbir veri anlamlı hale getirilememelidir.
• İçerik yönetim sistemleri kurum içerisinden erişim sağlanabilecek özel
bulut teknolojilerini destekleyecek yapıda kurulmalıdır. Tüm dış
saldırılara karşı fiziksel olarak yalıtılmalıdır.
• Diğer kamu kurum ve kuruluşları ve özel şirketler ile tüm veri
paylaşımları, kurumun kendi kontrolümde olan genel bulut
sistemlerinde tutulmalıdır.
Kamu kurumlarında,
• Tüm veriler merkezi içerik yönetim sistemlerinde saklanmalıdır.
(Dijital Arşiv)
• İçerik yönetim ve bilgi sistemlerinin yedekleri düzenli ve
kontrollü alınmalıdır. (hash kontrol)
• Tüm veriler ve veri hareketlerinin logları, zaman damgası ile
damgalanmalıdır.
• Arşivlenmiş dijital verilerin bütünlüğü tam koruma altına
alınmalıdır.
24.02.2016
Kamu Kurumlarında Büyük Verinin Taşınması
Kamu kurumlarında,
• Dijital Arşivlere, ihtiyaç duyulan her noktadan kontrollü erişim
sağlanmalıdır.
• Dijital verilerinin taşınması sırasında, verilerin mutlaka kriptolu
ortamlarda taşınması sağlanmalıdır.
• Veriler kurumun kendi kontrolü altında, yüksek güvenlikli ağ
altyapılarında taşınmalıdır.
• Veri taşıma aşamasında verinin kopyalanması, ağın dinlenmesi
önlenmelidir.
Teşekkürler…
Yusuf TULGAR
Donanma Şirketler Grubu, CEO
email: [email protected]
Kamu Kurumlarında Büyük Verinin Yedeklenmesi
• Kamu verileri, mutlaka Felaket Kurtarma Merkezlerinde
düzenli yedeklenmelidir.
• Tüm verilerin tam, fark ve işlem yedekleri düzenli olarak
alınmalıdır.
• Tüm veri yedekleri kriptolanarak saklanmalıdır.
Büyük Veri Analitiği & Güvenliği Kamu Çalıştayı
Dr. M. Umut DEMİREZEN
STM Siber Güvenlik ve Büyük Veri Grup Yöneticisi
[email protected] | @udmrzn
UNCLASSIFIED
Kamu Kurumlarında Büyük Veriyi Bekleyen İç ve Dış
Tehditler,
• Kamu kurumlarında kurum ve kullanıcı verileri
– DropBox, Yandex Disk, Google Drive, OneDrive, WeTransfer vb.
bulut depolama sistemleri ile
– Gmail, Hotmail, Yahoo vb. mail gibi yabancı bulut sistemlerinde asla
depolanmamalı paylaşılmamalıdır.
• Kamu Kurumlarında Özel ve Genel Bulut Sistemleri kurulmalıdır. Bu
sistemlerin kontrolleri tamamen kurumların kendi bilgi işlem alt
yapılarında olmalı ve yabancı bulut servisleri üzerinde veri taşıma,
saklama, paylaşma yapılmamalıdır.
• Kamu kurumları büyük boyuttaki verilerin taşınması, saklanması,
paylaştırılmasına olanak sağlayacak araçlara sahip olmalıdır.
• Kullanıcılar USB bellek ve taşınır disk vb. her an çalınabilir, bozulabilir,
çoğaltılabilir, kaybolabilir ortamlarda verilerini saklamamalıdır.
Download