1. Mesin vektor pendukung

Dengan adanya sekumpulan contoh pelatihan, masing-masing ditandai sebagai milik salah satu dari dua kategori, algoritma pelatihan SVM membangun model yang memberikan contoh baru ke satu kategori atau kategori lainnya, menjadikannya pengklasifikasi linier biner non-probabilistik (walaupun metode seperti Platt penskalaan ada untuk menggunakan SVM dalam pengaturan klasifikasi probabilistik). SVM memetakan contoh pelatihan ke titik-titik dalam ruang untuk memaksimalkan lebar kesenjangan antara dua kategori. Contoh-contoh baru kemudian dipetakan ke dalam ruang yang sama dan diprediksi termasuk dalam kategori berdasarkan pada sisi kesenjangan mana contoh-contoh tersebut berada.

Selain melakukan klasifikasi linier, SVM dapat secara efisien melakukan klasifikasi non-linier menggunakan apa yang disebut trik kernel, yang secara implisit memetakan masukannya ke dalam ruang fitur berdimensi tinggi.

Tautan ke seluruh artikel: https://en.wikipedia.org/wiki/Support-vector_machine

2. Peningkatan gradien

Peningkatan gradien adalah teknik pembelajaran mesin yang digunakan antara lain dalam tugas regresi dan klasifikasi. Ini memberikan model prediksi dalam bentuk kumpulan model prediksi lemah, yang biasanya berupa pohon keputusan. Jika pohon keputusan merupakan pembelajar yang lemah, algoritma yang dihasilkan disebut pohon yang ditingkatkan gradien; biasanya kinerjanya melebihi hutan acak. Model pohon dengan peningkatan gradien dibangun secara bertahap seperti pada metode peningkatan lainnya, namun model ini menggeneralisasi metode lain dengan memungkinkan optimalisasi fungsi kerugian yang dapat dibedakan secara arbitrer.

Tautan ke seluruh artikel:https://en.wikipedia.org/wiki/Gradient_boosting

3. Statistik multivariat

Statistik multivariat adalah subdivisi statistik yang mencakup pengamatan dan analisis lebih dari satu variabel hasil secara simultan.

Statistik multivariat berkaitan dengan pemahaman berbagai tujuan dan latar belakang dari masing-masing bentuk analisis multivariat, dan bagaimana kaitannya satu sama lain. Penerapan praktis statistik multivariat pada suatu masalah tertentu mungkin melibatkan beberapa jenis analisis univariat dan multivariat untuk memahami hubungan antar variabel dan relevansinya dengan masalah yang sedang diteliti.

Selain itu, statistik multivariat berkaitan dengan distribusi probabilitas multivariat, dalam kaitannya dengan keduanya

  1. Bagaimana hal ini dapat digunakan untuk mewakili distribusi data yang diamati?
  2. Bagaimana mereka dapat digunakan sebagai bagian dari inferensi statistik, khususnya ketika beberapa besaran berbeda diperlukan untuk analisis yang sama?

Jenis masalah tertentu yang melibatkan data multivariat, misalnya regresi linier sederhana dan regresi berganda, biasanya tidak dianggap sebagai kasus khusus statistik multivariat karena analisisnya ditangani dengan mempertimbangkan distribusi kondisional (univariat) dari satu variabel hasil mengingat variabel lain.

Tautan ke seluruh artikel: https://en.wikipedia.org/wiki/Multivariate_statistics