30 Pertanyaan Wawancara Hbase Teratas & Jawaban

Anonim

Unduh PDF

Berikut adalah pertanyaan yang sering diajukan dalam wawancara untuk mahasiswa baru serta pengembang HBase yang berpengalaman.

1) Jelaskan apa itu Hbase?

Hbase adalah sistem manajemen database berorientasi kolom yang berjalan di atas HDFS (Hadoop Distribute File System). Hbase bukanlah penyimpanan data relasional, dan tidak mendukung bahasa kueri terstruktur seperti SQL.

Di Hbase, node master mengatur cluster dan server wilayah untuk menyimpan bagian dari tabel dan mengoperasikan pekerjaan pada data.

2) Jelaskan mengapa menggunakan Hbase?

  • Sistem penyimpanan berkapasitas tinggi
  • Desain terdistribusi untuk memenuhi meja besar
  • Toko Berorientasi Kolom
  • Skalabel Secara Horizontal
  • Kinerja & Ketersediaan Tinggi
  • Sasaran dasar Hbase adalah jutaan kolom, ribuan versi, dan miliaran baris
  • Tidak seperti HDFS (Hadoop Distribute File System), ini mendukung operasi CRUD waktu nyata secara acak

3) Sebutkan apa saja komponen kunci dari Hbase?

  • Zookeeper: Ini melakukan pekerjaan koordinasi antara klien dan Hbase Maser
  • Hbase Master: Hbase Master memantau Server Wilayah
  • RegionServer: RegionServer memantau Region
  • Region: Berisi dalam penyimpanan data memori (MemStore) dan Hfile.
  • Tabel Katalog: Tabel katalog terdiri dari ROOT dan META

4) Jelaskan terdiri dari apa Hbase?

  • Hbase terdiri dari satu set tabel
  • Dan setiap tabel berisi baris dan kolom seperti database tradisional
  • Setiap tabel harus berisi elemen yang didefinisikan sebagai Kunci Utama
  • Kolom Hbase menunjukkan atribut dari suatu objek

5) Sebutkan berapa banyak perintah operasional di Hbase?

Perintah operasional di Hbases ada sekitar lima jenis

  • Dapatkan
  • Taruh
  • Menghapus
  • Pindai
  • Kenaikan

6) Jelaskan apa itu WAL dan Hlog di Hbase?

WAL (Write Ahead Log) mirip dengan MySQL BIN log; itu mencatat semua perubahan yang terjadi pada data. Ini adalah file urutan standar oleh Hadoop dan menyimpan HLogkey's. Kunci ini terdiri dari nomor urut serta data aktual dan digunakan untuk memutar ulang data yang belum ada setelah server mogok. Jadi, jika terjadi kegagalan server, WAL bekerja sebagai garis kehidupan dan mengambil data yang hilang.

7) Kapan Anda harus menggunakan Hbase?

  • Ukuran data sangat besar: Jika Anda memiliki berton-ton dan jutaan record untuk dioperasikan
  • Desain Ulang Lengkap: Saat Anda memindahkan RDBMS ke Hbase, Anda menganggapnya sebagai desain ulang lengkap lalu hanya mengubah porta
  • Perintah SQL-Less: Anda memiliki beberapa fitur seperti transaksi; gabungan dalam, kolom yang diketik, dll.
  • Investasi Infrastruktur: Anda harus memiliki cluster yang cukup agar Hbase benar-benar berguna

8) Di Hbase apa itu keluarga kolom?

Keluarga kolom terdiri dari unit dasar penyimpanan fisik di Hbase yang menerapkan fitur seperti kompresi.

9) Jelaskan apa kunci barisnya?

Kunci baris ditentukan oleh aplikasi. Karena kunci gabungan telah ditetapkan sebelumnya oleh rowkey, ini memungkinkan aplikasi untuk menentukan urutan pengurutan yang diinginkan. Ini juga memungkinkan pengelompokan sel secara logis dan memastikan bahwa semua sel dengan kunci baris yang sama ditempatkan bersama di server yang sama.

10) Jelaskan penghapusan di Hbase? Sebutkan apa saja tiga jenis penanda batu nisan di Hbase?

Saat Anda menghapus sel di Hbase, datanya tidak benar-benar dihapus tetapi penanda batu nisan disetel, membuat sel yang dihapus tidak terlihat. Hbase dihapus sebenarnya dihapus selama pemadatan.

Ada tiga jenis penanda batu nisan:

  • Penanda penghapusan versi: Untuk penghapusan, ini menandai satu versi kolom
  • Penanda penghapusan kolom: Untuk penghapusan, ini menandai semua versi kolom
  • Penanda penghapusan keluarga: Untuk penghapusan, ini menandai semua kolom untuk keluarga kolom

11) Jelaskan bagaimana sebenarnya Hbase menghapus baris?

Di Hbase, apa pun yang Anda tulis akan disimpan dari RAM ke disk, penulisan disk ini tidak dapat diubah kecuali pemadatan. Selama proses penghapusan di Hbase, proses pemadatan besar menghapus penanda sedangkan pemadatan kecil tidak. Dalam penghapusan normal, ini menghasilkan penanda batu nisan hapus- data penghapusan yang mereka wakili akan dihapus selama pemadatan.

Selain itu, jika Anda menghapus data dan menambahkan lebih banyak data, tetapi dengan stempel waktu yang lebih awal dari stempel waktu batu nisan, Gets lebih lanjut mungkin disamarkan oleh penanda delete / tombstone dan karenanya Anda tidak akan menerima nilai yang dimasukkan hingga setelah pemadatan besar.

12) Jelaskan apa yang terjadi jika Anda mengubah ukuran blok dari keluarga kolom pada database yang sudah ditempati?

Saat Anda mengubah ukuran blok keluarga kolom, data baru menempati ukuran blok baru sementara data lama tetap dalam ukuran blok lama. Selama pemadatan data, data lama akan mengambil ukuran blok baru. File baru saat dibilas, memiliki ukuran blok baru sedangkan data yang ada akan terus dibaca dengan benar. Semua data harus diubah ke ukuran blok baru, setelah pemadatan besar berikutnya.

13) Sebutkan perbedaan antara Hbase dan Relational Database?

Hbase Database Relasional
  • Ini tanpa skema
  • Ini adalah penyimpanan data berorientasi kolom
  • Ini digunakan untuk menyimpan data yang dinormalisasi
  • Ini berisi tabel yang jarang diisi
  • Partisi otomatis dilakukan di Hbase
  • Ini adalah database berbasis skema
  • Ini adalah penyimpanan data berorientasi baris
  • Ini digunakan untuk menyimpan data yang dinormalisasi
  • Ini berisi tabel tipis
  • Tidak ada ketentuan atau dukungan bawaan untuk partisi

14) Apa itu kelas HBaseFsck?

Ada nama alat yang disebut kembali tersedia di HBase, yang diimplementasikan oleh kelas HBaseFsck. Ini menawarkan beberapa sakelar baris perintah yang memengaruhi perilakunya.

15) Apa struktur kunci utama HBase?

Kunci baris dan kunci Kolom adalah dua struktur kunci terpenting yang digunakan di HBase

16) Diskusikan bagaimana Anda dapat menggunakan filter di Apache HBase

Filter Di Shell HBase. Itu diperkenalkan di Apache HBase 0.92 yang membantu Anda melakukan pemfilteran sisi server untuk mengakses HBase melalui shell atau penghematan HBase.

17) Struktur sintaks dukungan HBase seperti SQL ya atau Tidak?

Tidak, sayangnya, dukungan SQL untuk HBase tidak tersedia saat ini. Namun, dengan menggunakan Apache Phoenix, kami dapat mengambil data dari HBase melalui kueri SQL.

18) Apa arti pemadatan di HBase?

Pada saat penulisan masuk yang berat, tidak mungkin mencapai kinerja yang optimal dengan memiliki satu file per penyimpanan. HBase membantu Anda menggabungkan semua HFiles ini untuk mengurangi jumlah benih disk untuk setiap pembacaan. Proses ini dikenal sebagai Pemadatan di HBase.

19) Bagaimana Anda akan menerapkan bergabung di HBase?

HBase, tidak mendukung bergabung secara langsung tetapi menggunakan kueri gabungan pekerjaan MapReduce dapat diterapkan dengan mengambil data dengan bantuan tabel HBase yang berbeda.

20) Jelaskan JMX tentang HBSE

Ekstensi Manajemen Java atau JMX adalah status ekspor aplikasi Java adalah standar untuk mereka.

21) Apa gunanya MasterServer?

Master sever membantu Anda menetapkan wilayah ke server wilayah juga. Ini juga membantu Anda menangani load balancing yang kami gunakan dengan MasterServer.

22) Tentukan Istilah Hemat

Apache Thrift ditulis dalam C ++. Ini menyediakan kompiler skema untuk berbagai bahasa pemrograman seperti C ++, Perl, PHP, Python, Ruby, dan banyak lagi.

23) Mengapa menggunakan kelas HColumnDescriptor?

Detail mengenai keluarga kolom seperti pengaturan kompresi, Jumlah versi, disimpan di HColumnDescriptor.

24) Apakah sel di HBase?

Sel di HBase adalah unit terkecil dari tabel Hbase. Ini membantu Anda menyimpan sepotong data dalam bentuk tupel {baris, kolom, versi}

25) Apa itu filter Bloom?

HBase mendukung Bloom Filter membantu Anda meningkatkan throughput cluster secara keseluruhan. Filter HBase Bloom adalah mekanisme hemat ruang untuk menguji apakah HFile menyertakan sel baris atau baris-kolom tertentu.

26) Ceritakan tentang jenis Operasi HBase?

Ans. Dua jenis Operasi HBase adalah:

  • Baca Operasi
  • Operasi Tulis

27) Apa gunanya HBase HMaster?

Tanggung jawab utama seorang master adalah:

  1. Mengkoordinasikan server wilayah
  2. Fungsi Admin

28) Teknik apa yang dapat Anda gunakan di HBase untuk mengakses HFile secara langsung tanpa bantuan HBase?

Untuk mengakses HFile secara langsung tanpa menggunakan HBase, kami menggunakan metode HFile.main ().

29) Bisakah server wilayah akan ditempatkan di semua DataNodes?

Ya, Server Wilayah berjalan di server yang sama dengan DataNodes

30) Beri nama filter yang menerima ukuran halaman sebagai parameter di HBase

Filter bernama PageFilter menerima ukuran halaman sebagai parameter.

Dokumen ini telah disusun dengan alat pengubah HTML instan.