Büyük Verinin Gücü
Büyük Veri (Big Data), hem yapılandırılmış hem de yapılandırılmamış olabilen büyük ve karmaşık veri kümeleriyle ilgilidir. Konsepti, bu büyük miktarda bilgiyi yönetmek için oluşturulan altyapıları, teknolojileri ve araçları kapsar. Ek olarak bu veri dizini o kadar büyüktür ki onu analiz etmek, aramak, işlemek ve bir dizi çoklu teknolojiyi anlamak için bir platforma ihtiyaç duymamızın nedeni budur.
Beş Özelliği
Büyük Veri, giderek hayatımızın ayrılmaz bir parçası haline gelmekte. Herkes bir teknoloji türü kullanmakta veya büyük şirketlerle iletişim kurmaktadır. O büyük şirketler bize verilerini sunarken bizim onlara sunduğumuz verileri de kullanırlar. Daha verimli üretim yapmak ve yeni ürünler geliştirmek için bu verileri sürekli olarak analiz ederler.
Daha basit bir şekilde ifade etmek gerekirse, özellikle yeni veri kaynaklarından alınan büyük ve karmaşık veri kümeleridir. Bu kümeler o kadar büyüktür ki veri işleme için kullanılan geleneksel yazılımlar bunları kolayca yönetememiştir, bu nedenle yeni bir araç ve yazılım kümesi oluşturulmuştur.
Bu yüzden bu konu hakkında konuşurken her zaman için beş özellikten bahsetmek gerekir.
- Değer (Value): Çeşitli bilgi türleri, algılama ve işleme sorunları için farklı karmaşıklıklar olabilir, bu da akıllı sistemlerin birlikte çalışmasını karışık bir hale getirir. Bu nedenle bilgi, sonunda değer sağlayacak bir şekilde yönetilmelidir.
- Doğruluk (Veracity): Bilgi kaynağının kökeninin veya güvenilirliğinin, analiz için ne kadar önemli olduğu anlamına gelir.
- Çeşitlilik (Variety): Dizilerdeki bilgiler kısmen, tamamen yapılandırılabilen ve biriktirilebilen heterojen biçimlere sahip olabilir. Örneğin sosyal medya ağları; metin, video, ses, işlemler, resimler vb. içerisinde Big Data analizini kullanır.
- Hacim (Volume): Öncelikle veri, fiziksel boyutu ve dijital depolama ortamında kapladığı alan ile ölçülür. Her gün 150 GB’ın üzerindeki dizinleri içerir. Ayrıca, bilgi koleksiyonunuzu iyi anlamak için Veri Kataloğu’nu da kullanabilirsiniz.
- Hız (Velocity): Bundan sonra bilgiler düzenli olarak güncellenir ve gerçek zamanlı işlemeler, akıllı platformlar ile teknoloji gerektirir.
Büyük Veri Türleri
Bu başlık altında yapılandırılmış, yarı yapılandırılmış ve yapılandırılmamış veri olmak üzere üç tür veri vardır. Her türde, farklı projelerde kullanılmak üzere benimseyebileceğiniz birçok faydalı bilgi yer alır.
- Yapılandırılmış veriler sabit biçimlidir ve doğası gereği genellikle sayısaldır. Bu nedenle çoğu durumda insanlar tarafından değil, makineler tarafından ele alınan bir kavramdır. Bu tür veriler kuruluş tarafından SQL veri tabanlarında, veri göllerinde (data lake) ve veri ambarlarında (data warehouse) depolanan veri tabanlarında ve elektronik tablolarda yönetilen bilgilerden oluşur.
- Yapılandırılmamış veriler, örgütlenmemiş ve neredeyse her şey olabileceği için önceden belirlenmiş bir formata girmeyen bilgilerdir. Örneğin, sosyal medya kaynaklarından toplanan verileri içerir ve Hadoop benzeri kümeler veya NoSQL sistemlerinde tutulan metin belgesi dosyalarına konulabilir.
- Yarı yapılandırılmış veriler ise hem web sunucusu günlükleri gibi veri biçimlerini hem de kurduğunuz sensörlerden gelen verileri içerir. Kesin olmak gerekirse belirli bir havuz (veri tabanı) altında sınıflandırılmamış olmasına rağmen yine de veriler içindeki bireysel öğeleri ayıran hayati bilgileri veya etiketleri içeren verileri ifade eder.
Büyük Veri her zaman birden fazla kaynak içerir ve çoğu zaman da farklı türdendir. Bu nedenle çeşitli türlerle çalışmak için ihtiyaç duyduğunuz tüm araçları nasıl entegre edeceğinizi bilmek her zaman kolay bir iş değildir.
Kullanım Örnekleri
Bu örnekler, kullanıcılar ve bir sistem arasındaki etkileşimleri gösterir. Böylece bir dizi görevi temsil ederek herhangi bir hedefi gerçekleştirmeye yardımcı olurlar.
Bu sektörlerden bazıları aşağıda belirtilmiştir:
- Bankacılık
- Sağlık ve sigorta
- Petrol ve gaz endüstrileri
- Altyapı otomasyonu
- Sosyal medya
- Perakende
- Ulaşım
İlginizi Çekebilir: Neden CRM Bu Kadar Önemli?