Seri Pembelajaran Mesin!!!

Halo Teman-teman, Sekali lagi saya memposting topik pembelajaran mesin yang luar biasa dan kontroversial untuk ilmuwan data Pemula. Jadi, saya memperjelas di artikel ini apa itu bias, apa itu varians. setelah membaca ini Anda dapat memahami apa itu bias dan varians dan apa manfaatnya. Jadi, mari kita mulai..

Garis besar

  1. Apa itu Definisi Bias dan Varians?
  2. Kesalahan Bias Dengan Contoh
  3. Kesalahan Varians dengan Contoh
  4. Terlalu Pas dan Kurang Pas
  5. Gambaran Besar Bias dan Varians.

1.Apa yang dimaksud dengan Bias dan Varians?

Dalam Statistik, Bias dan varians adalah milik model prediktif dan pembelajaran mesin yang dihitung untuk mengawasi algoritma pembelajaran mesin.

Gambaran ini seharusnya menjadi cara yang bagus untuk menjelaskan bias-varians kepada anak berusia 5 tahun.

Untuk kelompok orang pintar yang memiliki pemahaman dasar tentang pemodelan, statistik, dan ML, mari kita lihat lebih dalam

kesalahan(X) = kebisingan(X) + bias(X)2+ varians(X)

  1. Bias:Kesalahan tinggi karena asumsi.
  2. Varians : Kesalahan karena terlalu kompleks yang mencoba menyesuaikan data pelatihan sedekat mungkin.
  3. Trade-off:keseimbangan yang dicapai antara dua fitur yang diinginkan namun tidak kompatibel; sebuah kompromi.

2.Bias Kesalahan Dengan Contoh

Catatan: Bias menyebabkan data tidak sesuai. Bias yang tinggi berarti algoritme pembelajaran kami kehilangan tren penting di antara fitur-fiturnya.

Simply Bias adalah perbedaan antara nilai prediksi dan perbedaan nilai aktual dari data pelatihan, tempat kita dilatih model pembelajaran mesin. Bias adalah penyederhanaan asumsi yang dibuat oleh suatu model untuk membuat fungsi target lebih mudah dipelajari.

Bias(X)=E[f^(x)]−f(x)

Algoritme bias tinggi lebih mudah dipelajari tetapi kurang fleksibel, sehingga memiliki kinerja prediktif yang lebih rendah pada masalah yang kompleks. Algoritma linier dan model yang terlalu disederhanakan menyebabkan bias yang tinggi pada model. Mari kita lihat tabel bias di bawah ini. Sehingga kita dapat membuat gambaran yang lebih jelas.

Contoh algoritme pembelajaran mesin dengan bias rendah meliputi: Pohon Keputusan, k-Nearest Neighbors, dan Support Vector Machines.

Contoh algoritme pembelajaran mesin dengan bias tinggi meliputi: Regresi Linier, Analisis Diskriminan Linier, dan Regresi Logistik.

3. Kesalahan Varians dengan Contoh

Simply Variance adalah ketika data pelatihan Anda diubah model Anda memberikan hasil yang berbeda dan hasil yang berbeda dari hasil pertama memiliki variasi. Estimasi fungsi target akan berubah jika data pelatihan yang digunakan berbeda.

Var(X)=E[(f^(x)−E[f^(x)])2]

Umumnya algoritma pembelajaran mesin non-parametrik yang memiliki banyak fleksibilitas memiliki variansi yang tinggi. Misalnya, pohon keputusan memiliki varians yang tinggi, bahkan lebih tinggi lagi jika pohon tersebut tidak dipangkas sebelum digunakan.

Contoh algoritme pembelajaran mesin varian rendah meliputi: Regresi Linier, Analisis Diskriminan Linier, dan Regresi Logistik.

Contoh algoritme pembelajaran mesin varian tinggi meliputi:Pohon Keputusan, k-Nearest Neighbors, dan Mesin Vektor Dukungan.

4. Definisi Sederhana Over-fitting dan under-fitting

Overfitting: Performa bagus pada data pelatihan, hasil buruk saat memberikan data lain.
Underfitting: Performa buruk pada data pelatihan dan hasil buruk saat memberikan data lain .

Secara detail tentang overfitting dan underfitting saya akan menulis artikel lebih lanjut. Sekarang pahami definisi dasar ini.

4.1 Sifat masalahnya

Ketika sifat masalahnya berubah, trade-off pun berubah.

  • kebenarannya tidak jelas dan tingkat kebisingannya tinggi, sehingga kuadrat melakukan yang terbaik

  • kebenarannya lebih lancar, sehingga model linier bekerja dengan sangat baik

  • kebenarannya tidak jelas dan kebisingannya rendah, jadi semakin fleksibel lakukan yang terbaik

5. Gambaran Besar Bias dan Varians.

Gambar mengatakan lebih dari seribu kata lihat di sini di bawah gambar dan Anda memahami apa gambaran besarnya. Gambar bagus yang dibuat oleh ilmu data elit di sini dilampirkan dengan artikel ini.

Referensi:

  1. https://www.quora.com/What-is-bias-and-variance
  2. https://www.quora.com/What-is-the-simplest-way-to-understand-bias-variance-trade-off-in-machine-learning
  3. https://machinelearningmastery.com/gentle-introduction-to-the-bias-variance-trade-off-in-machine-learning/
  4. https://machinelearningmastery.com/gentle-introduction-to-the-bias-variance-trade-off-in-machine-learning/
  5. https://en.wikipedia.org/wiki/Bias%E2%80%93variance_tradeoff
  6. https://gerardnico.com/data_mining/bias_trade-off