Veri Gölü ve Veri Ambarı Arasındaki Fark Nedir?

Image for post
Image for post

Veri yönetimi söz konusu olduğunda birbirinden farklı birçok terimle karşılaşırsınız. Bu terimlerin ne anlama geldiğini öğrenmeden veri yönetme konusunda ne derece başarılı olunabilir? Başlıca karşınıza çıkacak olan terimler veri ambarı ve veri gölüdür. Bu yazıda sizlere veri gölü nedir, veri ambarından farkı nedir gibi soruların cevabını vermeye çalışacağız.

Bir veri gölü, yapılandırılmış ve yapılandırılmamış verilerinizi saklayabileceğiniz bir yerdir. Farklı kaynaklardan gelen büyük ve çeşitli verileri düzenlemeyebilmenize imkân tanır.

Veri gölü hakkında daha detaylı bilgi edinmek için aşağıdaki videoyu izleyebilirsiniz.

Wikipedia veri ambarlarını şöyle tanımlar:

“… Bir veya daha fazla farklı kaynaktan entegre verilerin merkezi depoları. Mevcut ve geçmiş verileri depolar, yıllık veya üç aylık karşılaştırmalar gibi üst yönetime sunmak adına trend raporları oluşturmak için kullanılırlar. ”

Bir veri ambarı, içerde ve dışarda bulunan çeşitli kaynaklardan verileri toplar ve bu verileri iş amacına göre optimize eder. Veriler genellikle ilişkisel veri tabanlarında yapılandırılır, ancak aynı zamanda yapılandırılmamış da olabilir.

Veri gölü ve veri ambarı arasında bilinmesi gereken önemli farklardan biri veri ambarının iş analizleri toplamak için tasarlanmış olmasıdır. İşletmelerin verilerini bütünleştirmelerine, yönetmelerine ve birçok düzeyde analiz etmelerine olanak tanır.

Veri ambarı hakkında detaylı bilgi içeren yazımızı okuyun!

Bir veri ambarının geliştirilmesi sırasında, veri kaynaklarını analiz etmek, iş süreçlerini anlamak ve verileri görüntülemek için önemli miktarda zaman harcanmaktadır. Bu zamanın büyük bir kısmı, hangi verilere ekleneceğini ve depoya dahil edilmeyeceği ile ilgili kararlar vermeyi içerir. Genel olarak, veriler belirli soruları yanıtlamak için veya tanımlanmış bir raporda kullanılmazsa, depodan hariç tutulabilir. Bu genellikle disk depolama alanında yer tasarrufu sağlamak için yapılır.

Veri gölü ise tam aksine tüm verileri korur. Sadece bugün kullanılmakta olan veriler değil, aynı zamanda kullanılabilecek ve hatta bir gün kullanılmayacak olan verileri bile korur. Veriler tüm zamanlar için korunduğundan bir gün geriye dönük analiz yapılmak istediğinde tüm verilere ulaşılabilir.

Veri ambarı genellikle işlenmiş veriden oluşur. Nicel ölçümlerden ve bunları tanımlayan özelliklerden oluşur. Web sunucusu günlükleri, sensör verileri, sosyal ağ etkinliği, metin ve görüntüler gibi geleneksel olmayan veri kaynakları büyük ölçüde dikkate alınmaz. Bu veri türleri için yeni kullanım alanları bulunmaya devam ediyor ancak veri ambarlarında bunları saklamak pahalı ve zor olabilir.

Veri gölü yaklaşımı ise geleneksel olmayan bu veri tiplerini de kapsıyor. Tüm veri türlerini ham haliyle saklamaya ve sadece onu kullanılması gerektiğinde veri türünü değiştirmeye olanak sağlıyor.

Çoğu kuruluşta, %80 veya daha fazla kullanıcı “operasyonel” uygulamalar içerisindedir. Bu nedenle güncel raporları almak, önemli performans ölçümlerini görmek veya her gün bir e-tabloda aynı veri kümesini gözlemlemek ister. Veri ambarı genellikle bu kullanıcılar için idealdir, çünkü iyi yapılandırılmış, kullanımı kolay ve anlaşılırdır.

Kuruluştaki diğer kesim ise veriler üzerinde daha detaylı analiz yapar. Araştırmaya dayalı tamamen yeni veri kaynakları oluşturabilirler. Pek çok farklı türde veriyi toplayarak cevaplanacak yeni sorular sorar. Bu kullanıcılar veri ambarını kullanabilirler, ancak genellikle yeteneklerinin ötesine geçmekle yükümlü oldukları için gelişmiş analitik araçları ve istatistiksel analiz araçları kullanmak isterler. Böyle durumlarda veri bilimcileri veri gölüne gidebilir ve ihtiyaç duydukları çok geniş ve çeşitli veri setleri ile çalışabilir.

Veri ambarlarıyla ilgili en önemli şikayetlerden biri, bunları değiştirmek için harcanan zamandır. İyi bir veri ambarı kurulumu yapıldığında değişime kolay adapte olabilir, ancak veri yükleme sürecinin karmaşıklığı ve analiz ve raporlamayı kolaylaştırmak için yapılan çalışma nedeniyle, bu değişiklikler biraz zaman harcar.

Birçok iş sorusu, veri ambarı ekibinin sistemlerini bunlara cevap verecek şekilde uyarlamasını bekleyemez. Daha hızlı cevaplar için giderek artan ihtiyaç, self servis iş zekâsı kavramının doğmasına neden olmuştur.

Öte yandan, veri gölünde, tüm veriler ham haliyle saklandığından onu kullanması gerekenler için her zaman erişilebilir durumdadır. Bu sayede kullanıcılar verileri araştırmak için yeni yollar denemek zorunda kalmaz ve zaman kaybetmeden sorularına cevap bulabilir.

Veri gölleri tüm verileri ve veri türlerini içerdiğinden, kullanıcıların ham verilere erişebilmelerini sağladığı, ayrıştırdığı ve yapılandırdığı için, sonuca geleneksel veri ambarı yaklaşımından daha hızlı ulaşabilmelerini sağlar.

Gelecekte bu teknolojilerden biri diğerlerini sollamak için atağa geçecek mi?

Aslında pek de böyle bir şey olacağını düşünmüyoruz.

Yapılmamış verilerin değeri ve miktarı arttıkça, veri gölü giderek daha popüler hale gelecektir. Ancak veri ambarı ve iş zekâsı da hala önemli bir yere sahip olacaktır.

Yapılandırılmış veriler veri ambarında tutmaya devam edilecek. Ancak son günlerde, daha fazla şirket yapılandırılmamış verilerini bulutta bulunan veri göllerine taşmaya başladı. Veri ambarlarında depolamanın daha maliyetli olması ve gerektiğinde taşınmasının zorlaşması onları bulut veri göllerine yönlendirmiş durumda.

Büyü veri, veri görselleştirme ve veri ambarına dair detaylı bilgi edinmek, güncel bilgileri öğrenmek ve derin bilgiye erişmek için Datateam Blog’u takip etmeye devam edin!

Written by

Transform Data Into the Solution >> datateam.com.tr

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store