Pembelajaran yang Diawasi vs Pembelajaran Tanpa Pengawasan: Perbedaan Utama

Daftar Isi:

Anonim

Apa itu Pembelajaran Mesin yang Diawasi?

Dalam Supervised learning, Anda melatih mesin menggunakan data yang "diberi label" dengan baik . Artinya beberapa data sudah diberi tag dengan jawaban yang benar. Ini bisa dibandingkan dengan pembelajaran yang berlangsung di hadapan pengawas atau guru.

Algoritme pembelajaran yang diawasi belajar dari data pelatihan berlabel, membantu Anda memprediksi hasil untuk data yang tidak terduga. Berhasil membangun, menskalakan, dan menerapkan model machine learning yang diawasi secara akurat membutuhkan waktu dan keahlian teknis dari tim data scientist yang sangat terampil. Selain itu, Data scientist harus membangun kembali model untuk memastikan wawasan yang diberikan tetap benar hingga datanya berubah.

Dalam tutorial ini, Anda akan belajar

  • Apa itu Pembelajaran Mesin yang Diawasi?
  • Apa itu Pembelajaran Tanpa Pengawasan?
  • Mengapa Supervised Learning?
  • Mengapa Pembelajaran Tanpa Pengawasan?
  • Bagaimana cara kerja Supervised Learning?
  • Bagaimana cara kerja Pembelajaran Tanpa Pengawasan?
  • Jenis Teknik Pembelajaran Mesin yang Diawasi
  • Jenis Teknik Pembelajaran Mesin Tanpa Pengawasan
  • Pembelajaran yang Diawasi vs. Tidak Diawasi

Apa itu Pembelajaran Tanpa Pengawasan?

Pembelajaran tanpa pengawasan adalah teknik pembelajaran mesin, di mana Anda tidak perlu mengawasi modelnya. Sebaliknya, Anda perlu mengizinkan model bekerja sendiri untuk menemukan informasi. Ini terutama berkaitan dengan data yang tidak berlabel.

Algoritme pembelajaran tanpa pengawasan memungkinkan Anda melakukan tugas pemrosesan yang lebih kompleks dibandingkan dengan pembelajaran yang diawasi. Meskipun, pembelajaran tanpa pengawasan bisa lebih tidak terduga dibandingkan dengan pembelajaran alami lainnya dalam pembelajaran dan metode pembelajaran penguatan.

Mengapa Supervised Learning?

  • Pembelajaran yang diawasi memungkinkan Anda mengumpulkan data atau menghasilkan keluaran data dari pengalaman sebelumnya.
  • Membantu Anda mengoptimalkan kriteria kinerja menggunakan pengalaman
  • Pembelajaran mesin yang diawasi membantu Anda memecahkan berbagai jenis masalah komputasi dunia nyata.

Mengapa Pembelajaran Tanpa Pengawasan?

Di sini, adalah alasan utama untuk menggunakan Pembelajaran Tanpa Pengawasan:

  • Pembelajaran mesin tanpa pengawasan menemukan semua jenis pola yang tidak diketahui dalam data.
  • Metode tanpa pengawasan membantu Anda menemukan fitur yang dapat berguna untuk kategorisasi.
  • Ini berlangsung secara real time, sehingga semua data masukan dianalisis dan diberi label di hadapan peserta didik.
  • Lebih mudah untuk mendapatkan data tidak berlabel dari komputer daripada data berlabel, yang membutuhkan intervensi manual.

Bagaimana cara kerja Supervised Learning?

Misalnya, Anda ingin melatih mesin untuk membantu Anda memprediksi berapa lama waktu yang dibutuhkan untuk berkendara pulang dari tempat kerja Anda. Di sini, Anda mulai dengan membuat sekumpulan data berlabel. Data ini termasuk

  • Kondisi cuaca
  • Waktu dalam hari
  • Liburan

Semua detail ini adalah masukan Anda. Outputnya adalah jumlah waktu yang dibutuhkan untuk pulang ke rumah pada hari tertentu.

Anda secara naluriah tahu bahwa jika hujan di luar, maka Anda akan membutuhkan waktu lebih lama untuk berkendara pulang. Tetapi mesin membutuhkan data dan statistik.

Mari kita lihat sekarang bagaimana Anda dapat mengembangkan model pembelajaran yang diawasi dari contoh ini yang membantu pengguna untuk menentukan waktu perjalanan. Hal pertama yang Anda perlukan untuk membuat adalah kumpulan data pelatihan. Set pelatihan ini akan berisi total waktu perjalanan dan faktor terkait seperti cuaca, waktu, dll. Berdasarkan set pelatihan ini, mesin Anda mungkin melihat ada hubungan langsung antara jumlah hujan dan waktu yang Anda perlukan untuk pulang.

Jadi, ini memastikan bahwa semakin banyak hujan, semakin lama Anda akan berkendara untuk kembali ke rumah. Mungkin juga melihat hubungan antara waktu Anda pulang kerja dan waktu Anda dalam perjalanan.

Semakin dekat Anda dengan jam 6 sore, semakin lama waktu yang Anda butuhkan untuk sampai di rumah. Mesin Anda mungkin menemukan beberapa hubungan dengan data berlabel Anda.

Ini adalah awal Model Data Anda. Ini mulai memengaruhi bagaimana hujan memengaruhi cara orang mengemudi. Itu juga mulai melihat bahwa lebih banyak orang bepergian selama waktu tertentu dalam sehari.

Bagaimana cara kerja Pembelajaran Tanpa Pengawasan?

Mari, ambil kasus bayi dan anjing keluarganya.

Dia tahu dan mengidentifikasi anjing ini. Beberapa minggu kemudian seorang teman keluarga membawa serta seekor anjing dan mencoba bermain dengan bayinya.

Baby belum pernah melihat anjing ini sebelumnya. Tetapi ia mengakui banyak ciri (2 telinga, mata, berjalan dengan 4 kaki) seperti anjing peliharaannya. Dia mengidentifikasi hewan baru seperti anjing. Ini adalah pembelajaran tanpa pengawasan, di mana Anda tidak diajar tetapi Anda belajar dari data (dalam hal ini data tentang seekor anjing.) Seandainya ini pembelajaran yang diawasi, teman keluarga akan memberi tahu bayi itu bahwa itu seekor anjing.

Jenis Teknik Pembelajaran Mesin yang Diawasi

Regresi:

Teknik regresi memprediksi nilai keluaran tunggal menggunakan data pelatihan.

Contoh: Anda dapat menggunakan regresi untuk memprediksi harga rumah dari data pelatihan. Variabel masukan adalah lokalitas, ukuran rumah, dll.

Klasifikasi:

Klasifikasi artinya mengelompokkan keluaran di dalam kelas. Jika algoritme mencoba memberi label input ke dalam dua kelas yang berbeda, itu disebut klasifikasi biner. Memilih di antara lebih dari dua kelas disebut sebagai klasifikasi multikelas.

Contoh : Menentukan apakah seseorang akan membatalkan pinjaman atau tidak.

Kekuatan : Keluaran selalu memiliki interpretasi probabilistik, dan algoritme dapat diatur untuk menghindari overfitting.

Kelemahan : Regresi logistik mungkin berkinerja buruk jika ada beberapa batasan keputusan atau non-linier. Metode ini tidak fleksibel, jadi tidak menangkap hubungan yang lebih kompleks.

Jenis Teknik Pembelajaran Mesin Tanpa Pengawasan

Masalah pembelajaran yang tidak diawasi selanjutnya dikelompokkan menjadi masalah pengelompokan dan asosiasi.

Kekelompokan

Pengelompokan adalah konsep penting dalam hal pembelajaran tanpa pengawasan. Ini terutama berkaitan dengan menemukan struktur atau pola dalam kumpulan data yang tidak dikategorikan. Algoritme pengelompokan akan memproses data Anda dan menemukan kluster (grup) alami jika ada dalam data. Anda juga dapat mengubah berapa banyak cluster yang harus diidentifikasi oleh algoritme Anda. Ini memungkinkan Anda untuk menyesuaikan perincian grup ini.

Asosiasi

Aturan asosiasi memungkinkan Anda membuat asosiasi di antara objek data di dalam database besar. Teknik tanpa pengawasan ini adalah tentang menemukan hubungan yang menarik antara variabel dalam database yang besar. Misalnya, orang yang membeli rumah baru kemungkinan besar akan membeli furnitur baru.

Contoh Lain:

  • Subkelompok pasien kanker yang dikelompokkan berdasarkan pengukuran ekspresi gen mereka
  • Kelompok pembelanja berdasarkan riwayat penjelajahan dan pembelian mereka
  • Kelompok film menurut peringkat yang diberikan oleh pemirsa film

Pembelajaran yang Diawasi vs. Tidak Diawasi

Parameter Teknik pembelajaran mesin yang diawasi Teknik pembelajaran mesin tanpa pengawasan
Proses Dalam model pembelajaran terbimbing akan diberikan variabel input dan output. Pada model pembelajaran tanpa pengawasan, hanya data masukan yang akan diberikan
Memasukan data Algoritme dilatih menggunakan data berlabel. Algoritma digunakan terhadap data yang tidak diberi label
Algoritma yang Digunakan Mendukung mesin vektor, jaringan saraf, regresi linier dan logistik, hutan acak, dan pohon klasifikasi. Algoritme yang tidak diawasi dapat dibagi menjadi beberapa kategori: seperti Algoritme klaster, K-means, Pengelompokan hierarki, dll.
Kompleksitas Komputasi Pembelajaran yang diawasi adalah metode yang lebih sederhana. Pembelajaran tanpa pengawasan sangat kompleks secara komputasi
Penggunaan Data Model pembelajaran terbimbing menggunakan data pelatihan untuk mempelajari keterkaitan antara input dan output. Pembelajaran tanpa pengawasan tidak menggunakan data keluaran.
Akurasi Hasil Metode yang sangat akurat dan dapat dipercaya. Metode yang kurang akurat dan dapat dipercaya.
Pembelajaran Waktu Nyata Metode pembelajaran berlangsung secara offline. Metode pembelajaran berlangsung secara real time.
Jumlah Kelas Jumlah kelas diketahui. Jumlah kelas tidak diketahui.
Kelemahan Utama Mengklasifikasikan big data bisa menjadi tantangan nyata dalam Supervised Learning. Anda tidak bisa mendapatkan informasi yang tepat tentang pengurutan data, dan keluaran sebagai data yang digunakan dalam pembelajaran tanpa pengawasan diberi label dan tidak diketahui.

Ringkasan

  • Dalam Supervised learning, Anda melatih mesin menggunakan data yang "diberi label" dengan baik.
  • Pembelajaran tanpa pengawasan adalah teknik pembelajaran mesin, di mana Anda tidak perlu mengawasi modelnya.
  • Pembelajaran yang diawasi memungkinkan Anda mengumpulkan data atau menghasilkan keluaran data dari pengalaman sebelumnya.
  • Pembelajaran mesin tanpa pengawasan membantu Anda menemukan semua jenis pola yang tidak diketahui dalam data.
  • Misalnya, Anda dapat menentukan waktu yang dibutuhkan untuk datang kembali berdasarkan kondisi cuaca, waktu hari dan hari libur.
  • Misalnya, Baby dapat mengidentifikasi anjing lain berdasarkan pembelajaran yang diawasi sebelumnya.
  • Regresi dan Klasifikasi adalah dua jenis teknik pembelajaran mesin yang diawasi.
  • Pengelompokan dan Asosiasi adalah dua jenis pembelajaran Tanpa pengawasan.
  • Pada model pembelajaran terbimbing akan diberikan variabel input dan output sedangkan pada model pembelajaran unsupervised hanya data input yang akan diberikan.