Büyük veri nedir?

Son 3-4 yılda pazarlama dünyasının en fazla kafa yorduğu ve tartıştığı konulardan biri de malümunuz “Büyük veri”. Bir ara yalnızca “Büyük veri” başlığı, konferansların, seminerlerin tıka basa dolması, makalelerin binlerce kez okunması için yeterliydi. Şimdilerde büyük veri artık herkes tarafından kanıksandı, konu olarak popüler mecralarda belki eskisi kadar ilgi görmüyor, ama bu konuda yapılan çalışmalar bütün hızıyla devam ediyor elbette. Zira büyük verinin işlenme olanaklarının ve hızının artması önümüzdeki on yılda hayatımızı şekillendirecek en önemli unsurlardan biri.

Bundan üç yıl kadar önce “Büyük veri” tartışmasının cereyan ettiği konferanslardan birini bu köşede yazmıştım. Doksanlı yılların ünlü anlık mesajlaşma platformu ICQ‘nun kurucusu Yossi Vardi, büyük veriyle ilgili esas büyük fırsatın, iki veya daha fazla farklı veri arasında korelasyon sağlayarak insanlara anlık bilgi sunabilecek teknolojilerde olduğunu belirtmişti. Yine aynı yazıda veri işleme kapasitesi arttıkça, daha büyük verilerin depolanabileceğini, elde edilen verilerin geriye doğru işlenmesiyle, bu verinin karar verme aşamasında daha çok kullanılabilir hale geleceğini ifade etmiştim.

Bu dediklerimiz yavaş yavaş çeşitli yönleriyle hayata geçmeye başladı. Ancak bu yazıda büyük verinin uygulama örneklerinden çok, bu kavramın teorik temellerine veya bu kavramla ilgili teorik yorumlara değinmek istiyorum. Zira bu yorumlar, bu kavramın ortaya çıkartacağı sonuçlarla ilgili daha güçlü fikirlere sahip olmamızı sağlıyor.

Geçtiğimiz günlerde Kalkedon Yayınevi tarafından basılan; editörlüğünü Prof. Dr. Nilüfer Timisi’nin yaptığı “Dijital Kavramlar, Olanaklar, Deneyimler” adlı kitabın içinde yer alan “Büyük Veri Nedir? Olanaklar ve Sınırlar” başlıklı makale, büyük veri kavramının teorik çerçevesi hakkında fikir sahibi olmak isteyenler açısından hayli öğretici. İstanbul Bilgi Üniversitesi’nden Yrd. Doç. Dr. Erkan Saka ve Ar. Gör. Anıl Sayan’ın birlikte kaleme aldığı makalede “Büyük veri, her ne kadar yeni medya araçlarının birey hayatında artan yeri ile önem kazansa da, bu gibi temelde bilgisayar sistemlerine dayanan verilerin ilk olarak 1960’lı yıllarda akademik düzeyde tartışılmaya başlandığını belirtebiliriz” sözleriyle kavramın tarihsel köklerine değiniliyor. Her ne kadar insanlığın her döneminde kendine has büyük veri üretiminin sözkonusu olacağı kabul edilse de günümüzde “Büyük veri” dört önemli unsur üzerinden değerlendiriliyor:

1) Veri Üretim Hızı

Veri tarihi incelendiğinde, insanlık hiç bir zaman böylesine yoğun bir bilgi üretiminde bulunmamıştır. 2003 yılına kadar 5 trilyon gigabayt veri üretilirken, sadece 2011-2015 yılları arasında her iki günde 5 trilyon gigabayt veri, 2015’te ise her 10 saniyede bir 5 trilyon gigabayt veri üretilmiştir.

2) Büyük veri organiktir

Her ne kadar büyük veri yapısal olarak dijital olan verilerin bir araya gelmesi sebebiyle karmaşık bir yapıda olsa da, büyük veri istatistiksel veri ile karşılaştırıldığında gerçeklik hakkında daha çok ‘şey’ söyler. Bu verisel karmalık, aslında gerçekliğin de bir yansımasıdır.

3) Büyük veri potansiyel olarak küreseldir

Büyük veri sadedece gerçekliğin organik bir yansıması değil, aynı zamanda potansiyel olarak küresel (Google gibi mecralarla) boyutlara ulaşır.

4) Korelasyon

Büyük veri metodolojik olarak nedensellikten (neden sonuç ilişkisinden) ziyade, korelasyonel (bağımlılığa dayalı) bir ilişki üzerine kuruludur.

Dikkat ederseniz ikinci ve dördüncü maddeler, diğer iki maddeye göre biraz daha karmaşık. İkinci maddede verinin organik olarak yani insan davranışlarıyla üretildiği, ancak çeşitli yöntemlerle sayısallaştırıldığı belirtiliyor. Son maddede ise değişik yöntemlerle toplanan ve sayısallaştırılan “Büyük veri”nin biraraya getirilip aralarında bağıntıların kurulmasıyla “Büyük sonuçların” elde edilebileceği ifade ediliyor.

Yazının sonuç bölümünde ise çevrimiçi alanların farklı katılım formlarına olanak tanıyan kamusal alanın önemli bir uzantısı haline geldiği belirtilerek, özellikle sivil katılıma olanak sağlayan bu alanların sadece veri olarak değil, aynı zamanda toplumsal açıdan algoritmik analize dayalı kaynaklar olarak da değerlendirilebileceğine dikkat çekiliyor. Bu “Analiz kaynağı” olma durumunun olası sonuçları da üç madde halinde sıralanıyor:

1- Hukuk ve siyaset alanındaki think tank araştırmacılar ya da benzeri pozisyonlardaki kişiler, kamuoyunu manipüle edebilmek için veri bilimcileri haline gelecekler.

2- Kolluk güçleri, sosyal hizmetler, avukatlar ve hukuk araştırmacıları; bireysel suç, olasılık ve suç engelleme gibi kavramları yeniden düşünmek zorunda kalacaklar.

3- Devletler, küresel kararlarını bölge uzmanları ya da kanaate dayalı yorumlardan ziyade küresel veri ve algoritmalara dayanacak şekilde verecekler.

Yerimiz kısıtlı olduğu için daha fazla detaya giremiyoruz, ancak konuya ilgi duyanların makalenin tamamını okumasında fayda var.