50 Pertanyaan Wawancara Machine Learning & Jawaban

Anonim

Unduh PDF

1) Apa itu pembelajaran mesin?

Pembelajaran mesin adalah cabang ilmu komputer yang berhubungan dengan pemrograman sistem untuk belajar secara otomatis dan meningkatkan pengalaman. Misalnya: Robot diprogram sehingga mereka dapat melakukan tugas berdasarkan data yang mereka kumpulkan dari sensor. Secara otomatis mempelajari program dari data.

2) Sebutkan perbedaan antara Data Mining dan Machine learning?

Pembelajaran mesin berkaitan dengan studi, desain, dan pengembangan algoritme yang memberi komputer kemampuan untuk belajar tanpa diprogram secara eksplisit. Sedangkan data mining dapat didefinisikan sebagai proses di mana data tidak terstruktur mencoba mengekstrak pengetahuan atau pola menarik yang tidak diketahui. Selama mesin proses ini, algoritma pembelajaran digunakan.

3) Apa itu 'Overfitting' dalam Machine learning?

Dalam pembelajaran mesin, ketika model statistik mendeskripsikan kesalahan atau gangguan acak alih-alih terjadi 'overfitting' yang mendasari hubungan. Jika model terlalu kompleks, overfitting biasanya diamati, karena memiliki terlalu banyak parameter terkait dengan jumlah tipe data pelatihan. Model tersebut menunjukkan kinerja yang buruk yang telah overfit.

4) Mengapa overfitting terjadi?

Kemungkinan terjadinya overfitting karena kriteria yang digunakan untuk melatih model tidak sama dengan kriteria yang digunakan untuk menilai keefektifan model.

5) Bagaimana Anda menghindari overfitting?

Dengan menggunakan banyak data, overfitting dapat dihindari, overfitting terjadi secara relatif karena Anda memiliki set data yang kecil, dan Anda mencoba untuk belajar darinya. Tetapi jika Anda memiliki database kecil dan Anda terpaksa datang dengan model berdasarkan itu. Dalam situasi seperti itu, Anda dapat menggunakan teknik yang dikenal sebagai validasi silang . Dalam metode ini dataset dibagi menjadi dua bagian, dataset pengujian dan pelatihan, dataset pengujian hanya akan menguji model sedangkan, dalam dataset pelatihan, titik data akan muncul dengan model.

Dalam teknik ini, model biasanya diberi kumpulan data dari data yang diketahui tempat pelatihan (kumpulan data pelatihan) dijalankan dan kumpulan data tidak diketahui yang menjadi dasar pengujian model. Ide dari validasi silang adalah menentukan set data untuk "menguji" model dalam fase pelatihan.

6) Apa itu pembelajaran mesin induktif?

Pembelajaran mesin induktif melibatkan proses pembelajaran dengan contoh, di mana sistem, dari sekumpulan contoh yang diamati mencoba untuk mendorong aturan umum.

7) Apa lima algoritma populer dari Machine Learning?

  • Pohon Keputusan
  • Neural Networks (propagasi mundur)
  • Jaringan probabilistik
  • Tetangga terdekat
  • Mendukung mesin vektor

8) Apa saja teknik Algoritma yang berbeda dalam Pembelajaran Mesin?

Berbagai jenis teknik dalam Pembelajaran Mesin adalah

  • Pembelajaran yang Diawasi
  • Pembelajaran Tanpa Pengawasan
  • Pembelajaran Semi-supervisi
  • Pembelajaran Penguatan
  • Transduksi
  • Belajar untuk Belajar

9) Apa tiga tahap untuk membangun hipotesis atau model dalam pembelajaran mesin?

  • Pembuatan model
  • Pengujian model
  • Menerapkan model

10) Apa pendekatan standar untuk supervised learning?

Pendekatan standar untuk pembelajaran yang diawasi adalah dengan membagi perangkat contoh menjadi set pelatihan dan tes.

11) Apa itu 'Training set' dan 'Test set'?

Di berbagai bidang ilmu informasi seperti pembelajaran mesin, sekumpulan data digunakan untuk menemukan hubungan yang berpotensi prediktif yang dikenal sebagai 'Kumpulan Pelatihan'. Perangkat pelatihan adalah contoh yang diberikan kepada peserta didik, sedangkan set Tes digunakan untuk menguji keakuratan hipotesis yang dihasilkan oleh peserta didik, dan set contoh yang ditahan dari peserta didik. Set pelatihan berbeda dari set Test.

12) Sebutkan berbagai pendekatan untuk pembelajaran mesin?

Pendekatan yang berbeda dalam Pembelajaran Mesin adalah

  • Konsep Vs Klasifikasi Pembelajaran
  • Pembelajaran Simbolik Vs Statistik
  • Pembelajaran Induktif Vs Analitik

13) Apa yang bukan Machine Learning?

  • Kecerdasan buatan
  • Inferensi berbasis aturan

14) Jelaskan apa fungsi dari 'Unsupervised Learning'?

  • Temukan kelompok data
  • Temukan representasi data berdimensi rendah
  • Temukan petunjuk menarik dalam data
  • Koordinat dan korelasi yang menarik
  • Temukan observasi baru / pembersihan database

15) Jelaskan apa fungsi 'Supervised Learning'?

  • Klasifikasi
  • Pengenalan suara
  • Regresi
  • Memprediksi deret waktu
  • Anotasi string

16) Apa itu pembelajaran mesin independen algoritma?

Pembelajaran mesin di mana dasar matematika tidak bergantung pada pengklasifikasi tertentu atau algoritme pembelajaran disebut sebagai pembelajaran mesin mandiri algoritme?

17) Apa perbedaan antara pembelajaran buatan dan pembelajaran mesin?

Merancang dan mengembangkan algoritma sesuai dengan perilaku berdasarkan data empiris dikenal dengan Machine Learning. Sedangkan kecerdasan buatan selain pembelajaran mesin, juga mencakup aspek lain seperti representasi pengetahuan, pemrosesan bahasa alami, perencanaan, robotika, dll.

18) Apa yang dimaksud pengklasifikasi dalam pembelajaran mesin?

Pengklasifikasi dalam Pembelajaran Mesin adalah sistem yang memasukkan vektor nilai fitur diskrit atau kontinu dan mengeluarkan nilai diskrit tunggal, yaitu kelas.

19) Apa keuntungan dari Naive Bayes?

Dalam pengklasifikasi Naïve Bayes akan menyatu lebih cepat daripada model diskriminatif seperti regresi logistik, jadi Anda memerlukan lebih sedikit data pelatihan. Keuntungan utamanya adalah tidak dapat mempelajari interaksi antar fitur.

20) Di bidang apa Pengenalan Pola digunakan?

Pengenalan Pola dapat digunakan di

  • Visi Komputer
  • Pengenalan suara
  • Penambangan Data
  • Statistik
  • Pengambilan Informal
  • Bio-Informatika

21) Apa itu Pemrograman Genetik?

Pemrograman genetik adalah salah satu dari dua teknik yang digunakan dalam pembelajaran mesin. Model ini didasarkan pada pengujian dan pemilihan pilihan terbaik di antara serangkaian hasil.

22) Apa itu Pemrograman Logika Induktif dalam Pembelajaran Mesin?

Inductive Logic Programming (ILP) adalah subbidang pembelajaran mesin yang menggunakan pemrograman logis yang mewakili pengetahuan latar belakang dan contoh.

23) Apa itu Pemilihan Model dalam Pembelajaran Mesin?

Proses pemilihan model di antara model matematika yang berbeda, yang digunakan untuk mendeskripsikan kumpulan data yang sama dikenal sebagai Pemilihan Model. Pemilihan model diterapkan pada bidang statistik, pembelajaran mesin, dan penggalian data.

24) Apa dua metode yang digunakan untuk kalibrasi dalam Supervised Learning?

Dua metode yang digunakan untuk memprediksi probabilitas yang baik dalam Supervised Learning adalah

  • Kalibrasi Platt
  • Regresi Isotonik

Metode ini dirancang untuk klasifikasi biner, dan tidak sepele.

25) Metode mana yang sering digunakan untuk mencegah overfitting?

Ketika ada data yang cukup 'Regresi Isotonik' digunakan untuk mencegah masalah overfitting.

26) Apa perbedaan antara heuristik untuk pembelajaran aturan dan heuristik untuk pohon keputusan?

Perbedaannya adalah bahwa heuristik untuk pohon keputusan mengevaluasi kualitas rata-rata dari sejumlah himpunan terputus-putus sementara pembelajar aturan hanya mengevaluasi kualitas himpunan contoh yang dicakup dengan aturan kandidat.

27) Apa itu Perceptron dalam Pembelajaran Mesin?

Dalam Pembelajaran Mesin, Perceptron adalah algoritme untuk klasifikasi masukan yang diawasi menjadi salah satu dari beberapa kemungkinan keluaran non-biner.

28) Jelaskan dua komponen program logika Bayesian?

Program logika bayesian terdiri dari dua komponen. Komponen pertama adalah yang logis; itu terdiri dari satu set Klausul Bayesian, yang menangkap struktur kualitatif domain. Komponen kedua adalah kuantitatif, yang mengkodekan informasi kuantitatif tentang domain.

29) Apa itu Bayesian Networks (BN)?

Jaringan Bayesian digunakan untuk merepresentasikan model grafis untuk hubungan probabilitas antara sekumpulan variabel.

30) Mengapa algoritma pembelajaran berbasis contoh kadang-kadang disebut sebagai algoritma pembelajaran Malas?

Algoritma pembelajaran berbasis instans juga disebut sebagai algoritma pembelajaran malas karena mereka menunda proses induksi atau generalisasi hingga klasifikasi dilakukan.

31) Apa dua metode klasifikasi yang dapat ditangani oleh SVM (Support Vector Machine)?

  • Menggabungkan pengklasifikasi biner
  • Memodifikasi biner untuk menggabungkan pembelajaran multikelas

32) Apa itu pembelajaran ensemble?

Untuk menyelesaikan program komputasi tertentu, beberapa model seperti pengklasifikasi atau pakar dibuat dan digabungkan secara strategis. Proses ini dikenal sebagai pembelajaran ensemble.

33) Mengapa pembelajaran ensemble digunakan?

Pembelajaran ensemble digunakan untuk meningkatkan klasifikasi, prediksi, pendekatan fungsi, dll dari suatu model.

34) Kapan menggunakan pembelajaran ensemble?

Pembelajaran ensemble digunakan saat Anda membuat pengklasifikasi komponen yang lebih akurat dan independen satu sama lain.

35) Apa dua paradigma metode ensemble?

Dua paradigma metode ansambel adalah

  • Metode ensembel berurutan
  • Metode ansambel paralel

36) Apa prinsip umum metode ensemble dan apa itu bagging and boosting dalam metode ensemble?

Prinsip umum metode ensembel adalah menggabungkan prediksi beberapa model yang dibangun dengan algoritme pembelajaran yang diberikan untuk meningkatkan ketahanan terhadap satu model. Bagging adalah metode dalam ensemble untuk meningkatkan estimasi atau skema klasifikasi yang tidak stabil. Sedangkan metode boosting digunakan secara berurutan untuk mengurangi bias model gabungan. Meningkatkan dan Mengantongi keduanya dapat mengurangi kesalahan dengan mengurangi istilah varian.

37) Apa dekomposisi bias-varians dari kesalahan klasifikasi dalam metode ensemble?

Kesalahan yang diharapkan dari algoritma pembelajaran dapat diuraikan menjadi bias dan varians. Istilah bias mengukur seberapa dekat pengklasifikasi rata-rata yang dihasilkan oleh algoritme pembelajaran cocok dengan fungsi target. Istilah varians mengukur seberapa banyak prediksi algoritme pembelajaran berfluktuasi untuk set pelatihan yang berbeda.

38) Apa yang dimaksud dengan algoritma Pembelajaran Inkremental dalam ensembel?

Metode pembelajaran inkremental adalah kemampuan suatu algoritma untuk belajar dari data baru yang mungkin tersedia setelah pengklasifikasi telah dihasilkan dari dataset yang telah tersedia.

39) Untuk apa PCA, KPCA dan ICA digunakan?

PCA (Analisis Komponen Utama), KPCA (Analisis Komponen Utama berbasis Kernel) dan ICA (Analisis Komponen Independen) adalah teknik ekstraksi fitur penting yang digunakan untuk pengurangan dimensi.

40) Apa itu pengurangan dimensi dalam Pembelajaran Mesin?

Dalam Machine Learning dan statistik, reduksi dimensi adalah proses pengurangan jumlah variabel acak yang sedang dipertimbangkan dan dapat dibagi menjadi pemilihan fitur dan ekstraksi fitur.

41) Apa yang dimaksud dengan mesin vektor dukungan?

Mesin vektor pendukung adalah algoritma pembelajaran yang diawasi yang digunakan untuk klasifikasi dan analisis regresi.

42) Apa saja komponen dari teknik evaluasi relasional?

Komponen penting dari teknik evaluasi relasional adalah

  • Akuisisi Data
  • Akuisisi Kebenaran Darat
  • Teknik Validasi Silang
  • Jenis Kueri
  • Metrik Penilaian
  • Uji Signifikansi

43) Apa sajakah metode berbeda untuk Sequential Supervised Learning?

Metode yang berbeda untuk memecahkan masalah Sequential Supervised Learning adalah

  • Metode jendela geser
  • Jendela geser berulang
  • Model Markow Tersembunyi
  • Model Markow entropi maksimum
  • Bidang acak bersyarat
  • Grafik jaringan transformator

44) Apa area dalam robotika dan pemrosesan informasi di mana masalah prediksi sekuensial muncul?

Area dalam robotika dan pemrosesan informasi di mana masalah prediksi sekuensial muncul adalah

  • Pembelajaran Imitasi
  • Prediksi terstruktur
  • Pembelajaran penguatan berbasis model

45) Apa itu pembelajaran statistik batch?

Teknik pembelajaran statistik memungkinkan mempelajari fungsi atau prediktor dari sekumpulan data yang diamati yang dapat membuat prediksi tentang data yang tidak terlihat atau yang akan datang. Teknik ini memberikan jaminan pada kinerja prediktor yang dipelajari pada data tak terlihat di masa depan berdasarkan asumsi statistik pada proses pembuatan data.

46) Apa itu Pembelajaran PAC?

Pembelajaran PAC (Mungkin Kira-kira Benar) adalah kerangka kerja pembelajaran yang telah diperkenalkan untuk menganalisis algoritma pembelajaran dan efisiensi statistiknya.

47) Apa saja kategori berbeda yang dapat Anda kategorikan dalam proses pembelajaran berurutan?

  • Prediksi urutan
  • Generasi urutan
  • Pengenalan urutan
  • Keputusan berurutan

48) Apa itu pembelajaran urutan?

Pembelajaran sekuens merupakan metode belajar mengajar secara logis.

49) Apa dua teknik Machine Learning?

Dua teknik Pembelajaran Mesin adalah

  • Pemrograman Genetik
  • Pembelajaran Induktif
50) Berikan aplikasi populer dari pembelajaran mesin yang Anda lihat setiap hari?

Mesin rekomendasi yang diterapkan oleh situs web e-niaga utama menggunakan Pembelajaran Mesin.