Data Warehouse, Big Data dan Relevansinya
- Data Warehouse
Menurut pendekatan Inmon, data warehouse adalah kumpulan atau koleksi data dalam berbagai waktu, yang tidak berubah dan terintegrasi untuk tujuan pengambilan keputusan. Arsitektur data warehouse mengekstraksi data dari berbagai sumber data yang berbasis SQL dan membantu untuk menghasilkan laporan analitik. Biasanya data warehouse diperlukan apabila organisasi ingin mengetahui informasi mengenai hal - hal yang terjadi di perusahaan termasuk perencanaan dan kinerja
Dalam pembentukannya, terdapat beberapa proses yang biasa disebut ETL (Extract, Transform, Load). Extract adalah proses memilih dan mengambil data dari berbagai sumber berdasarkan kebutuhan data yang telah didefinisikan sebelumnya. Transform adalah proses pembersihan dan mengubah data menjadi bentuk yang sesuai dengan kebutuhan data warehouse. Dan yang terakhir adalah Load, yaitu memasukkan data ke dalam data warehouse. Ketiga proses ini sangat penting karena berkaitan dengan kualitas data dalam data warehouse yang nantinya akan digunakan untuk keperluan business intelligence dan analisis lainnya.
Sumber data yang dimiliki oleh data warehouse adalah satu atau beberapa DBMS. Data yang diambil dari sumber dapat berupa data terstruktur atau data relasional. Data yang disajikan pun bersifat subject oriented dimana hanya menyediakan informasi atau data untuk melakukan pengambilan keputusan tanpa berfokus pada operasi yang sedang berjalan. Data warehouse mengidentifikasi data yang disimpan dalam periode waktu tertentu dan data sebelumnya tidak akan terhapus apabila ada data baru yang dimasukkan.
- Big Data
Big data merupakan teknologi yang mendukung volume, velocity dan variety data. Volume mendefinisikan jumlah data yang berasal dari sumber yang berbeda, velocity terkait pada kecepatan pemrosesan data, dan variety mengacu pada jumlah jenis data. Pada umumnya big data digunakan oleh perusahaan untuk membandingkan dengan data yang sangat banyak untuk nantinya membantu dalam pengambilan keputusan seperti meningkatkan revenue, profit dan customer.
Big data dapat menerima data dari berbagai sumber dan dengan tipe data apapun termasuk yang berasal dari data transaksi, media sosial, DBMS, dan sebagainya. Sama seperti data warehouse, big data juga bersifat subject oriented untuk memberikan analisis yang tepat untuk pengambilan keputusan. Big data memiliki banyak pendekatan untuk mengidentifikasi data yang disimpan, salah satunya adalah pengarsipan dengan tanggal dan waktu. Data yang sebelumnya pun tidak akan terhapus apabila ada data baru yang dimasukkan.
Salah satu kegunaan big data adalah untuk memuat data yang sangat besar dalam sistem terdistribusi dengan menggunakan map reduce program.
- Masih Relevan kah Data Warehouse?
Data warehouse sendiri dibangun untuk menerapkan format seragam untuk seluruh data yang dikumpulkan, sehingga memudahkan pengambil keputusan dalam menganalisis dan berbagi wawasan data. Perusahaan yang mempertimbangkan kemungkinan adanya data - data outlier, distribusi tidak normal, dan multi collinear dapat menerapkan data warehouse untuk menjaga konsistensi data.
Selain itu, data warehouse mampu mengelola dan mengintegrasikan dukungan untuk pemrosesan analitik tingkat lanjut melalui fungsi - fungsi atau algoritma basis data. Dengan adanya data warehouse, mampu meningkatkan konsistensi, standardisasi data, keputusan bisnis yang lebih baik, dan meningkatkan keuntungan perusahaan. Sehingga keberadaan data warehouse dapat dikatakan masih relevan.
Terimakasih dan semoga bermanfaat :)
Komentar
Posting Komentar