Apa itu DATA BESAR? Pendahuluan, Jenis, Karakteristik, Contoh

Daftar Isi:

Anonim

Sebelum kita pergi ke pengantar Big Data, Anda harus mengetahuinya terlebih dahulu

Apa itu Data?

Jumlah, karakter, atau simbol yang pengoperasiannya dilakukan oleh komputer, yang dapat disimpan dan ditransmisikan dalam bentuk sinyal listrik dan direkam pada media perekam magnetik, optik, atau mekanis.

Sekarang, mari pelajari pengenalan Big Data

Apa itu Big Data?

Big Data adalah kumpulan data yang sangat besar volumenya, namun tumbuh secara eksponensial seiring waktu. Ini adalah data dengan ukuran dan kompleksitas yang begitu besar sehingga tidak ada alat manajemen data tradisional yang dapat menyimpan atau memprosesnya secara efisien. Data besar juga merupakan data tetapi dengan ukuran yang sangat besar.

Dalam tutorial ini, Anda akan belajar,

  • Apa itu Data?
  • Apa itu Big Data?
  • Contoh Big Data
  • Jenis Data Besar
  • Karakteristik Big Data
  • Keuntungan Pemrosesan Big Data

Contoh Big Data

Berikut adalah beberapa contoh Big Data-

The New York Stock Exchange menghasilkan sekitar satu terabyte data perdagangan baru per hari.

Media sosial

Statistik menunjukkan bahwa 500 + terabyte data baru diserap ke dalam basis data situs media sosial Facebook , setiap hari. Data ini terutama dihasilkan dalam hal unggahan foto dan video, pertukaran pesan, memberi komentar, dll.

Mesin Jet tunggal dapat menghasilkan 10 + terabyte data dalam 30 menit waktu penerbangan. Dengan ribuan penerbangan per hari, generasi data mencapai hingga banyak Petabyte.

Jenis Data Besar

Berikut adalah jenis-jenis Big Data:

  1. Tersusun
  2. Tidak terstruktur
  3. Semi-terstruktur

Tersusun

Setiap data yang dapat disimpan, diakses dan diolah dalam bentuk format tetap disebut sebagai data 'terstruktur'. Selama periode waktu tertentu, bakat dalam ilmu komputer telah mencapai kesuksesan yang lebih besar dalam mengembangkan teknik untuk bekerja dengan jenis data semacam itu (di mana formatnya sudah diketahui sebelumnya) dan juga memperoleh nilai darinya. Namun, saat ini, kami meramalkan masalah ketika ukuran data seperti itu tumbuh sangat besar, ukuran tipikal sedang dalam kemarahan beberapa zettabyte.

Tahukah kamu? 10 21 byte sama dengan 1 zettabyte atau satu miliar terabyte membentuk zettabyte .

Melihat angka-angka ini, orang dapat dengan mudah memahami mengapa nama Big Data diberikan dan membayangkan tantangan yang terlibat dalam penyimpanan dan pemrosesannya.

Tahukah kamu? Data yang disimpan dalam sistem manajemen basis data relasional adalah salah satu contoh data 'terstruktur' .

Contoh Data Terstruktur

Tabel 'Karyawan' dalam database adalah contoh Data Terstruktur

Identitas pegawai Nama karyawan Jenis kelamin Departemen Salary_In_lacs
2365 Rajesh Kulkarni Pria Keuangan 650000
3398 Pratibha Joshi Perempuan Admin 650000
7465 Shushil Roy Pria Admin 500000
7500 Shubhojit Das Pria Keuangan 500000
7699 Priya Waras Perempuan Keuangan 550000

Tidak terstruktur

Setiap data dengan bentuk atau struktur yang tidak diketahui diklasifikasikan sebagai data tidak terstruktur. Selain ukurannya yang besar, data yang tidak terstruktur menimbulkan banyak tantangan dalam hal pemrosesannya untuk mendapatkan nilai darinya. Contoh umum dari data tidak terstruktur adalah sumber data heterogen yang berisi kombinasi file teks sederhana, gambar, video, dll. Sekarang organisasi memiliki banyak data yang tersedia, tetapi sayangnya, mereka tidak tahu bagaimana mendapatkan nilai darinya karena data ini dalam bentuk mentah atau format tidak terstruktur.

Contoh Data Tidak Terstruktur

Keluaran dikembalikan oleh 'Google Search'

Semi-terstruktur

Data semi terstruktur dapat berisi kedua bentuk data tersebut. Kita dapat melihat data semi-terstruktur sebagai bentuk yang terstruktur tetapi sebenarnya tidak didefinisikan dengan misalnya definisi tabel dalam DBMS relasional. Contoh data semi terstruktur adalah data yang direpresentasikan dalam file XML.

Contoh Data Semi-terstruktur

Data pribadi disimpan dalam file XML-

Prashant RaoMale35Seema R.Female41Satish ManeMale29Subrato RoyMale26Jeremiah J.Male35

Pertumbuhan Data selama bertahun-tahun

Harap dicatat bahwa data aplikasi web, yang tidak terstruktur, terdiri dari file log, file riwayat transaksi, dll. Sistem OLTP dibangun untuk bekerja dengan data terstruktur dimana data disimpan dalam relasi (tabel).

Karakteristik Big Data

Big data dapat digambarkan dengan karakteristik sebagai berikut:

  • Volume
  • Variasi
  • Kecepatan
  • Variabilitas

(i) Volume - Nama Big Data itu sendiri terkait dengan ukuran yang sangat besar. Ukuran data memainkan peran yang sangat penting dalam menentukan nilai dari data. Selain itu, apakah data tertentu benar-benar dapat dianggap sebagai Big Data atau tidak, bergantung pada volume datanya. Karenanya, 'Volume' adalah salah satu karakteristik yang perlu dipertimbangkan saat menangani Big Data.

(ii) Variety - Aspek selanjutnya dari Big Data adalah keragamannya .

Variasi mengacu pada sumber heterogen dan sifat data, baik yang terstruktur maupun tidak terstruktur. Selama hari-hari sebelumnya, spreadsheet dan database adalah satu-satunya sumber data yang dipertimbangkan oleh sebagian besar aplikasi. Saat ini, data dalam bentuk email, foto, video, perangkat pemantauan, PDF, audio, dll juga dipertimbangkan dalam aplikasi analisis. Variasi data tidak terstruktur ini menimbulkan masalah tertentu untuk penyimpanan, penambangan, dan analisis data.

(iii) Kecepatan - Istilah 'kecepatan' mengacu pada kecepatan pembuatan data. Seberapa cepat data dihasilkan dan diproses untuk memenuhi permintaan, menentukan potensi nyata dalam data.

Big Data Velocity berkaitan dengan kecepatan aliran data dari sumber seperti proses bisnis, log aplikasi, jaringan, dan situs media sosial, sensor, perangkat seluler, dll. Aliran data sangat besar dan berkelanjutan.

(iv) Variabilitas - Ini mengacu pada ketidakkonsistenan yang dapat ditunjukkan oleh data sewaktu-waktu, sehingga menghambat proses untuk dapat menangani dan mengelola data secara efektif.

Manfaat Pemrosesan Big Data

Kemampuan untuk memproses Big Data membawa banyak manfaat, seperti-

    • Bisnis dapat memanfaatkan kecerdasan luar saat mengambil keputusan

Akses ke data sosial dari mesin pencari dan situs seperti facebook, twitter memungkinkan organisasi untuk menyempurnakan strategi bisnis mereka.

    • Peningkatan layanan pelanggan

Sistem umpan balik pelanggan tradisional digantikan oleh sistem baru yang dirancang dengan teknologi Big Data. Dalam sistem baru ini, Big Data dan teknologi pemrosesan bahasa alami digunakan untuk membaca dan mengevaluasi tanggapan konsumen.

    • Identifikasi awal risiko terhadap produk / layanan, jika ada
    • Efisiensi operasional yang lebih baik

Teknologi Big Data dapat digunakan untuk membuat area pementasan atau zona pendaratan untuk data baru sebelum mengidentifikasi data apa yang harus dipindahkan ke gudang data. Selain itu, integrasi teknologi Big Data dan gudang data membantu organisasi untuk memindahkan data yang jarang diakses.

Ringkasan

  • Definisi Big Data: Big Data diartikan sebagai data yang ukurannya sangat besar. Bigdata adalah istilah yang digunakan untuk mendeskripsikan kumpulan data yang ukurannya sangat besar namun tumbuh secara eksponensial seiring waktu.
  • Contoh analitik Big Data termasuk bursa saham, situs media sosial, mesin jet, dll.
  • Big Data dapat berupa 1) Terstruktur, 2) Tidak Terstruktur, 3) Semi-terstruktur
  • Volume, Variety, Velocity, dan Variability adalah beberapa karakteristik Big Data
  • Layanan pelanggan yang lebih baik, efisiensi operasional yang lebih baik, Pengambilan Keputusan yang Lebih Baik adalah beberapa keuntungan dari Bigdata