Günümüzün popüler kavramlarından biri olan Big Data, Türkçe karşılığıyla büyük veri;
Big Data Nedir?
Aslında bu terimin geçmişi oldukça eskiye dayanmaktadır. Big Data’nın geçmişi 1960’lara ve 70’lere kadar uzanıyor. Ancak 2005–2010 yılları arasında Facebook, Twitter, YouTube’un hayatımızda girmesiyle birlikte veriler daha da anlamlaştı. Big data; En Basit anlatımı ile verinin analiz edilip sınıflandırılmış, anlamlı ve işlenebilir hale dönüştürülmüş halidir.
Big datayı besleyen kaynak Nedir?
Akıllı telefonunuzdan, kredi kartı harcamalarınızdan, internette ne aradığınızdan ve hatta sokaklarda sizleri 7/24 izleyen kameralardan hakkınızda veriler toplanıyor. Gerçek şu ki, yasal düzenlemelere dikkat çekilirse ancak veri gizliliğinin ciddiyetini anlıyor, farkına varıyoruz. Ve tüm bu faturalar, banka ödemeleri, sınav sonuçları, e-devlet kayıtları , bloglar, mailler gibi kullanıcıların internet ile olan tüm etkileşimleri bir araya getirilince büyük Veri (Big data) oluşmuş oluyor.
Big Data Neden Bu Kadar Önemli?
Veriler, dünyamızı ve yaşam tarzımızı daha önce görülmemiş oranda etkilemektedir. Hal böyle olunca bu verilerin doğru bir şekilde kullanılması hem topluma hem de ticari organizasyonlara fayda sağlamaktadır. Bugünün şartlarıyla, veriler doğru işlendiği zaman getireceği faydayı ve kazancı düşününce gelişen teknolojiyle birlikte ilerleyen süreçte gayet olumlu gelişmelerle karşılaşacağımız hiç şüphesiz!
Yakın gelecekte savaşların nedeni; eskisi gibi petrol veya toprak değil, veri olabilir.
Peki büyük veri nedir? Ne kadar büyüktür?
Büyük Veri Diyoruz fakat, büyük bir veri olabilmesi için 100 terabayt ile 1 petabayt arasındaki yelpazeyi kapsaması gerekmektedir ancak bu kriter olmasına rağmen verilerin miktarı değil, onu nasıl analiz ettiğiniz önemlidir.
Netflixin bizlere önerdiği dizi ve filmleri nasıl sunduğunu hiç düşündünüz mü ? Bilindiği üzere Netflix big datayı en etkin kullanan,birçok stratejisini bu sayede belirleyen şirketlerden biri. İzleğiniz dizi veya filmin benzerini sürekli karşınıza çıkarması bu algoritmalar sayesinde gerçekleşir. Hangi aralıklarla siteye giriş yaptığınız, peş peşe mi yoksa belli aralıklarda mı izlediğiniz, hangi afişi ne kadar beğendiğiniz, nerede ne zaman hangi cihazı kullanarak seyrettiğiniz, normal yayın akışını nerede durdurup nerede tekrar başlattığınız, hangi bölümleri geri sararak tekrardan izlediğiniz gibi bir çok parametre Netflixin satış politikasını belirlemesinde etkili oluyor.
Sosyal medyanın hayatımızda hiçbirimizin vazgeçemeyeceği bir yeri vardır. Milyonlarca insanın her gün sosyal paylaşım sitelerinde hareketleri exabyte hatta zettabyte büyüklüğündedir. Yukarıdaki infografikte; Twitter’da her dakika 481k twit atılmakta ve Google’da her dakika 3.7 milyon arama yapılmaktadır. Dijital liderler için bu verilerin saklanması yüksek bir maliyet demektir.Dünyadaki Veri kullanımı, exabyte ve zettabyte hakkında detaylı bilgiye BURADA bulunan yazımızdan ulaşabilirsiniz.
Peki Elimizde bulunan her veri Big Data mıdır ?
Mevcut verilerinizin Big Data ekosistemine katkıda bulunabilmesi için aşağıda bulunan 5 bileşenden en az birine sahip olması gerekmektedir (5V kuralı olarak da bilinir).
- Variety(Çeşitlilik): Verilerin belirli bir türde olmasına gerek yoktur. Resimler,text,log dosyaları,ses dosyaları gibi bir çok veri türünde olabilir.
- Velocity(Hız): Yukarıdaki grafikte bir dakikada tüm dünyada neler olduğunu gösteren bir veri miktarı gösterilmişti.Veri tıpkı sosyal medya verileri gibi çok hızlı ve sürekli elde edilmesi gerekir.Tabi aynı hızla da işlenmesi gerekir.
- Volume(Hacim): Bir verinin ‘büyük veri’ olup olmamasının en önemli şartı ciddi boyutlarda olmasıdır. Yani Terabayttan petabaytlara kadar olan veri aralıkları
- Verification(Doğruluk): Bu kadar hızlı ve büyük olan verilerin akışı sırasında, gelen verilerin güvenli olup olmadığını kontrol etmek gerekir.Çünkü kirli ve bozulmuş gelen verinin depolanması ve daha sonra analiz edilmesi ekstra vakit ve hatalı sonuçlara yol açabilir.
- Value(Değer): En önemli bileşenlerden birisi de değer katmanıdır.Veriler yukarıdaki bileşenlerden filtrelendikten sonra analiz edilen verilerin şirket için artı değer sağlıyor olması gereklidir.
Kapanışı Nicola Teslanın mükemmel bir sözü ve Kenneth Cukier in TED Konuşması ile yapıyoruz, Sağlıcakla Kalın..
Gelecekte insanlar cebine sığabilecek kadar küçük bir cihazla, uçsuz bucaksız miktardaki veriye ulaşabilecek ve analiz edebilecekler.
– Nicola Tesla
Hata!
Yorumunuz Çok Kısa, Yorum yapabilmek için en az En az 10 karakter gerekli