Mengenal Karakteristik dari Big Data

Daftar Isi

Sebelum kita mengenal karakteristik dari Big Data kita perlu tahu terlebih dahulu mengenal beberapa tipe dari Big Data. Tipe dari Big Data ini tentunya tidak jauh berbeda dengan tipe data pada umumnya yang memiliki tiga pilar.

Tiga Pilar Big Data

Terstruktur

Data terstruktur mengacu pada data yang dapat diproses, disimpan, dan diambil dalam format yang tetap. Informasi yang dihasilkan sangat terorganisir sehingga dapat dengan mudah dan mulus menyimpan dan mengakses dari database dengan menggunakan algoritma sederhana. Ini adalah jenis data yang paling mudah untuk dikelola karena sudah diketahui format data apa yang akan dikerjakan sebelumnya. Misalnya, data yang disimpan perusahaan dalam databasenya dalam bentuk tabel dan spreadsheet adalah data terstruktur.

Tidak Terstruktur

Data dengan struktur yang tidak diketahui disebut data tidak terstruktur. Ukurannya jauh lebih besar dari data terstruktur dan bersifat heterogen. Contoh dari data tidak terstruktur mencakup hasil yang didapatkan saat melakukan penelusuran Google. Misalnya mendapatkan halaman web, video, gambar, teks, dan format data lainnya dengan berbagai ukuran yang tidak tetap.

Semi-Terstruktur

Seperti namanya, data semi-terstruktur berisi kombinasi antara data terstruktur dan tidak terstruktur. Ini adalah data yang belum diklasifikasikan ke dalam basis data tertentu tetapi berisi tag penting yang memisahkan elemen individu di dalamnya. Misalnya, definisi tabel dalam DBMS relasional memiliki data semi-terstruktur.

Sehingga dari sini kita dapat mengetahui karakteristik dari Big Data yang saat ini telah meliputi 10 karakteristik atau disebut dengan ā€œ10 Vā€™sā€.

Kita tahu bahwa sumber data menjadi lebih kompleks daripada sumber data tradisional karena didorong oleh kecerdasan buatan (AI), perangkat seluler, media sosial, dan Internet of Things (IoT). Misalnya, berbagai jenis data berasal dari sensor, perangkat, video/audio, jaringan, file log, aplikasi transaksional, web dan media sosial ā€” sebagian besar dihasilkan secara real time dan dalam skala yang sangat besar. Selain itu, tidak kalah penting untuk diingat adalah bahwa Big Data bukan hanya tentang jumlah data yang kami hasilkan, tetapi juga tentang semua jenis data yang berbeda (teks, video, log penelusuran, log sensor, transaksi pelanggan, dan lain-lain).

Baca juga : Pengertian Big Data

Berikut 10 karakteristik dari Big Data :

Volume

Big Data adalah sesuatu yang memang besar! Dengan pertumbuhan dramatis dari internet, perangkat seluler, media sosial, dan teknologi Internet of Things (IoT), jumlah data yang dihasilkan oleh semua sumber ini telah berkembang sesuai dengan itu. Volume mengacu pada jumlah data yang dimiliki. Nantinya akan di ukur volume data kami dalam Gigabytes, Zettabytes (ZB), dan Yottabytes (YB). Menurut tren industri, volume data akan meningkat secara substansial di tahun-tahun mendatang.

Velocity

Selain semakin besar jumlah data, pembuatan data dan kemampuan organisasi/perusahaan untuk memprosesnya harus semakin cepat. Velocity mengacu pada kecepatan pemrosesan data. Kecepatan tinggi sangat penting untuk kinerja setiap proses data besar. Ini terdiri dari tingkat perubahan, ledakan aktivitas, dan menghubungkan set data yang masuk. Berarti big data memiliki karakteristik cepat sekali berubah baik dari sisi variabel maupun tipe data. Dengan karakteristik ini, perlu sentuhan khusus dalam mengolah big data.

Variety

Data bisa disebut sebagai big data jika memiliki karakteristik yang bermacam-macam dan tidak homogen, tetapi memiliki banyak sekali variabel dan sangat beragam meliputi berbagai jenis data baik data yang telah terstruktur dalam suatu database maupun data yang tidak terorganisir dalam suatu database. Dulu, sebagian besar tipe data dapat ditangkap dengan rapi dalam baris pada tabel terstruktur. Di dunia Big Data, data sering kali datang dalam format tidak terstruktur seperti posting media sosial, data log server, koordinat geografis lintang, foto, audio, video, dan teks bebas. Varietas mengacu pada berbagai jenis data besar. Ini adalah salah satu masalah terbesar yang dihadapi oleh industri data besar karena mempengaruhi kinerja. Sangat penting untuk mengelola berbagai data dengan benar dengan mengaturnya. Ragam adalah berbagai jenis data yang dikumpulkan dari berbagai jenis sumber.

Variability

Makna kata dalam data tidak terstruktur dapat berubah berdasarkan konteks. Big Data akan terus berubah. Data yang dikumpulkan dari sumber sehari yang lalu mungkin berbeda dari apa yang Anda temukan hari ini. Ini disebut variabilitas data, dan ini memengaruhi homogenisasi data tersebut.

Veracity

Dengan banyak jenis data dan sumber data yang berbeda, masalah kualitas data selalu muncul di kumpulan Big Data. Veracity berurusan dengan menjelajahi kumpulan data untuk kualitas data dan secara sistematis membersihkan data itu agar berguna untuk analisis. Veracity mengacu pada keakuratan data. Ini adalah salah satu karakteristik Big Data yang paling penting karena kebenaran yang rendah dapat sangat merusak keakuratan hasil Anda. Oleh sebab itu, Big Data memiliki kerentanan dari sisi keakuratan dan kevaliditasan sehingga memerlukan kedalaman untuk menganalisis big data agar bisa menghasilkan keputusan yang tepat. 

Baca juga : Mengenal Big Data

Visualization

Setelah data dianalisis, data perlu disajikan dalam visualisasi agar pengguna akhir dapat memahami dan menindaklanjutinya. Visualisasi mengacu pada menampilkan wawasan yang dihasilkan oleh Big Data dengn melalui representasi visual seperti bagan dan grafik. Ini telah menjadi lazim baru-baru ini karena para profesional Big Data secara teratur berbagi wawasan mereka dengan audiens non-teknis.

Value

Data harus dikombinasikan dengan pemrosesan dan analisis yang ketat agar bermanfaat. Nilai mengacu pada manfaat yang diperoleh organisasi dari data. Apakah itu sesuai dengan tujuan organisasi? Apakah itu membantu organisasi meningkatkan dirinya sendiri? Ini adalah salah satu karakteristik inti Big Data yang paling penting. Oleh karena itu, big data memiliki nilai yang sangat tinggi apabila diolah dengan cara yang tepat guna. 

Validity

Hal ini untuk mengetahui beberapa valid dan relevan data yang akan digunakan untuk tujuan yang dimaksudkan.

Venue

Hal ini menunjukkan data heterogen yang terdistribusi dari beberapa Platform.

Vocabulary

Menunjukkan adanya model data, semantik yang menggambarkan struktur data.

Vagueness

Teka-teki terhadap teknik meaning Big data dan Tools yang digunakan.

Semoga bermanfaat!!