Data warehouse adalah wadah penyimpanan informasi elektronik yang aman dari bisnis atau organisasi lain. Tujuan dari data warehousing adalah untuk membuat kumpulan data historis yang dapat diambil dan dianalisis, sehingga memberikan wawasan yang berguna ke dalam operasi organisasi.
Data warehouse adalah komponen penting dari business intelligence. Istilah yang lebih luas itu mencakup infrastruktur informasi yang digunakan oleh bisnis modern untuk melacak keberhasilan dan kegagalan mereka di masa lalu dan juga menginformasikan keputusan mereka untuk masa depan.
Baca Juga: Apa Itu BigQuery?
Cara Kerja Data Warehousing
Kebutuhan data warehouse akan semakin berkembang bagi bisnis yang mulai mengandalkan sistem komputer untuk membuat, menyimpan, dan mengambil dokumen bisnis penting. Konsep data warehousing diperkenalkan pada tahun 1988 oleh peneliti IBM Barry Devlin dan Paul Murph.
Data warehousing dirancang untuk memungkinkan analisis data historis. Membandingkan data yang dikonsolidasikan dari berbagai sumber yang heterogen dapat memberikan wawasan tentang kinerja perusahaan. Gudang data dirancang untuk memungkinkan penggunanya menjalankan kueri dan analisis data historis yang berasal dari sumber transaksional.
Data yang ditambahkan ke warehouse tidak berubah dan tidak dapat diubah. Warehouse adalah sumber yang digunakan untuk menjalankan analitik pada peristiwa di masa lalu, dengan fokus pada perubahan dari waktu ke waktu. Data tersebut harus disimpan dengan cara yang aman, andal, mudah diambil, dan mudah dikelola.
Jenis-Jenis Data Warehouse
Ada tiga jenis Data Warehouse (DWH) utama, antara lain:
1. Enterprise Data Warehouse (EDW)
Enterprise Data Warehouse (EDW) adalah gudang data terpusat. Ini menyediakan layanan dukungan keputusan di seluruh bagian perusahaan. EDW menawarkan pendekatan terpadu untuk mengatur dan mewakili data. EDW juga memberikan kemampuan untuk mengklasifikasikan data sesuai dengan subjek dan memberikan akses sesuai dengan divisi tersebut.
2. Operational Data Store
Operational Data Store, atau juga disebut ODS, tidak lain adalah penyimpanan data yang diperlukan ketika data warehouse maupun sistem OLTP tidak mendukung kebutuhan pelaporan organisasi. Di ODS, data warehouse di-refresh secara real time. Oleh karena itu, ODS banyak disukai untuk melakukan kegiatan rutin seperti menyimpan catatan karyawan.
3. Data Mart:
Data mart adalah bagian dari data warehouse. Ini dirancang khusus untuk lini bisnis tertentu, seperti penjualan, keuangan, penjualan atau keuangan. Dalam data mart independen, data tersebut dapat dikumpulkan langsung dari sumbernya.
Memelihara Data Warehouse
Ada langkah-langkah tertentu yang perlu dilakukan untuk memelihara data warehouse. Salah satu langkahnya adalah ekstraksi data, yang melibatkan pengumpulan data dalam jumlah besar dari berbagai titik sumber. Setelah sekumpulan data dikompilasi, maka selanjutnya kumpulan data tersebut akan melewati pembersihan data, yaitu proses menyisir untuk menemukan kesalahan dan mengoreksinya.
Data yang telah dibersihkan kemudian dikonversi dari format database ke warehouse format. Setelah disimpan di warehouse, data akan melalui penyortiran, konsolidasi, dan peringkasan, sehingga akan lebih mudah digunakan nantinya. Seiring berjalannya waktu, akan ada lebih banyak data yang ditambahkan ke warehouse karena berbagai sumber data terus diperbarui.
Mau Berita Terbaru Lainnya dari Warta Ekonomi? Yuk Follow Kami di Google News dengan Klik Simbol Bintang.
Penulis: Patrick Trusto Jati Wibowo
Editor: Alfi Dinilhaq
Tag Terkait: