Apa itu Big Data?
Big Data digunakan untuk menggambarkan volume besar dari data terstruktur dan tidak terstruktur yang begitu besar sehingga sulit untuk diproses menggunakan teknik tradisional. Ini dapat didefinisikan sebagai kumpulan data yang ukuran atau jenisnya melampaui kemampuan database relasional tradisional untuk menangkap, mengelola, dan memproses data dengan latensi rendah.
Big Data memang seperti – a whole lot of data.
Sederhananya, data besar lebih besar, kumpulan data yang lebih kompleks, terutama dari sumber data baru. Kumpulan data ini sangat banyak sehingga perangkat lunak pemrosesan data tradisional tidak dapat mengelolanya. Tetapi volume data yang sangat besar ini dapat digunakan untuk mengatasi masalah bisnis yang sebelumnya tidak dapat Anda atasi.
Konsep Big Data adalah konsep yang relatif baru dan mewakili peningkatan jumlah dan variasi jenis data yang sekarang dikumpulkan. Pendukung Big Data sering menyebut ini sebagai “Datificatioan” dunia. Karena semakin banyak informasi dunia bergerak online dan menjadi digital, itu berarti para analis dapat mulai menggunakannya sebagai data. Hal-hal seperti media sosial, buku online, musik, video, dan peningkatan jumlah sensor semuanya telah menambah peningkatan jumlah data yang tersedia untuk analisis.
Semua yang dilakukan online sekarang disimpan dan dilacak sebagai data. Membaca buku di Kindle Anda menghasilkan data tentang apa yang Anda baca, kapan Anda membacanya, seberapa cepat Anda membacanya, dan seterusnya. Demikian pula, mendengarkan musik menghasilkan data tentang apa yang Anda dengarkan, kapan seberapa sering dan dalam urutan apa. Ponsel pintar Anda terus-menerus mengunggah data tentang di mana Anda berada, seberapa cepat Anda bergerak, dan aplikasi apa yang selalu digunakan.
Big Data adalah bidang analisis dan penggalian informasi dari kumpulan data yang sangat besar. Istilah ini juga mengacu pada sejumlah besar data yang tumbuh secara eksponensial seiring waktu. Data tersebut sangat besar dan kompleks sehingga tidak ada metode konvensional atau alat manajemen data tradisional yang dapat memproses dan menyimpannya secara efektif. Ada banyak contoh Big Data. Dari platform media sosial hingga toko E-commerce, organisasi di berbagai industri menghasilkan dan memanfaatkan data untuk meningkatkan proses mereka.
Menurut Wikipedia :
“Big data is a term that applies to the growing availability of large datasets in information technology.”
Big Data biasanya mencakup kumpulan data dengan ukuran di luar kemampuan alat perangkat lunak yang umum digunakan untuk menangkap, mengkurasi, mengelola, dan memproses data dalam waktu yang dapat ditoleransi. Filosofi Big Data mencakup data tidak terstruktur, semi terstruktur, dan terstruktur; namun, fokus utamanya adalah pada data yang tidak terstruktur.
“Ukuran” data besar adalah target yang terus bergerak; pada 2012 mulai dari beberapa lusin terabyte hingga banyak zettabytes data. Selain itu, Big Data memerlukan serangkaian teknik dan teknologi dengan bentuk integrasi baru untuk mengungkapkan wawasan dari kumpulan data yang beragam, kompleks, dan berskala besar.
Baca juga : Karakteristik Big Data 10 v
Secara umum, Big Data dapat digambarkan sebagai berikut :
- Data (Fakta, sebuah deskripsi fakta dari dunia nyata)
- Information (Informasi, Hasil penyimpanan data dan pengetahuan)
- Knowledge(Pengetahuan, Peta model dunia maupun individual)
Contohnya seperti Pandemi COVID-19.
- Data: Kasus positive, negative, sembuh, dan pasien yang meninggal (Indonesia) serta PPKM (Movement Restrictions Policy)
- Information: Informasi perkembangan pandemi COVID-19 di Indonesia (grafik, histogram)
- Knowledge: Pengaruh PPKM (pembatasan gerak) terhadap naik turunnya kasus COVID-19
- Decisions: Perpanjang/tidak dari PPKM (Movement Restrictions Policy), percepatan vaksinasi, sekolah offline/masih online dan lain-lain.
Meskipun konsep big data itu sendiri relatif baru, asal-usul kumpulan data besar kembali ke tahun 1960-an dan 70-an ketika dunia data baru saja dimulai dengan pusat data pertama dan pengembangan database relasional.
Sekitar tahun 2005, orang mulai menyadari betapa banyak data yang dihasilkan pengguna melalui Facebook, YouTube, dan layanan online lainnya. Hadoop (kerangka kerja sumber terbuka yang dibuat khusus untuk menyimpan dan menganalisis kumpulan data besar) dikembangkan pada tahun yang sama.
NoSQL juga mulai mendapatkan popularitas selama ini. Pengembangan kerangka kerja sumber terbuka, seperti Hadoop (dan baru-baru ini, Spark) sangat penting untuk pertumbuhan data besar karena mereka membuat data besar lebih mudah digunakan dan lebih murah untuk disimpan. Pada tahun-tahun sejak itu, volume data besar telah meroket. Pengguna masih menghasilkan data dalam jumlah besar—tetapi bukan hanya manusia yang melakukannya.
Dengan munculnya Internet of Things (IoT), lebih banyak objek dan perangkat yang terhubung ke internet, mengumpulkan data tentang pola penggunaan pelanggan dan kinerja produk. Munculnya pembelajaran mesin telah menghasilkan lebih banyak data. Sementara itu, Big Data telah berkembang jauh, kegunaannya baru saja dimulai. Komputasi awan telah memperluas kemungkinan data besar lebih jauh.
Cloud menawarkan skalabilitas yang benar-benar elastis, di mana pengembang dapat dengan mudah memutar kluster ad hoc untuk menguji subset data. Dan database grafik menjadi semakin penting juga, dengan kemampuannya untuk menampilkan sejumlah besar data dengan cara yang membuat analitik menjadi cepat dan komprehensif.
Big data hanya akan berupa kumpulan data mentah yang tak berarti apa-apa jika tidak diberdayakan. Meski demikian, pemberdayaan big data bukan perkara mudah karena butuh investasi infrastruktur, sumber daya manusia, dan beragam software. Hingga saat ini pemberdayaan big data didominasi oleh perusahaan-perusahaan jasa berbasis internet seperti Google dan Facebook.
Data yang mereka berdayakan bukanlah data-data internal perusahaan seperti data penjualan. Perusahaan-perusahaan ini memanfaatkan big data untuk mendapatkan informasi tren per-konsumen dengan memanfaatkan atribut-atribut yang melekat pada pribadi tiap konsumen. Misalnya, Amazon menggunakan data atribut yang melekat pada setiap user, sejarah pembelian, perilaku user, dan data lain sebagai bahan untuk membuat rekomendasi yang sesuai dengan karakteristik setiap user.
Baca juga : Penerapan Artificial Intelligence
Google menggunakan akumulasi data dalam skala yang sangat besar untuk melakukan bisnis iklan. Kemudian Facebook menggunakan data user yang sangat besar sebagai dasar untuk meningkatkan keuntungan dari iklan, permainan game, dan penjualan software.
Semoga bermanfaat!!