Pembelajaran Penguatan: Agen vs Lingkungan

Reinforcement Learning (RL) adalah bagian dari Machine Learning, di mana terdapat agen yang menerima masukan dari suatu lingkungan, beserta bahaya dan imbalannya. Tugas agen adalah mencapai tujuan tertentu dengan menggunakan cara terpendek dan paling efisien. Artinya, ia harus belajar menghindari bahaya dan memaksimalkan imbalannya.

Kami menggunakan berbagai algoritme pembelajaran mesin untuk melatih model, yang tujuannya adalah menavigasi agen melalui lingkungan. Model ini mendefinisikan jalur dengan hambatan paling kecil, dan terus belajar dari kesalahannya. Nama “Reinforcement Learning” berasal dari kenyataan bahwa model tersebut terus berusaha dan memperkuat dirinya dengan cara terbaik.

Contoh RL adalah Maze Solver, Chess Bots, Self-Driving Cars, Robotic Arms, dll.

Ada 2 jenis penguatan yang diberikan oleh lingkungan.

Penguatan Positif: Ketika peristiwa tersebut berdampak positif pada agen (Bot Catur berhasil memeriksa lawan atau tiang kereta menyeimbangkan tiang).

2. Penguatan Negatif: Ketika peristiwa berdampak negatif pada agen, menghambat kemajuannya (Maze Solver menabrak dinding atau rintangan)

RL berperan besar dalam industri otomasi, dan merupakan salah satu bagian Machine Learning yang paling menarik. Tersedia berbagai model sumber terbuka dan lingkungan pengembangan dengan simulasi grafis, dan permintaan akan keterampilan ini semakin meningkat seiring dengan pertumbuhan Pembelajaran Mesin. Sebagai calon pengembang ML, saat ini saya sedang mempelajari keterampilan baru dan menguji model berdasarkan RL. Anda dapat melihat proyek saya di github.

GitHub - tanush-r/cart-pole-rl
Berkontribusi pada pengembangan tanush-r/cart-pole-rl dengan membuat akun di GitHub.github .com

Terima kasih telah membaca,

Tanush R.

Pembelajaran Penguatan: Agen vs Lingkungan

Pertanyaan tentang topik tersebut