Saya mencoba menulis program untuk melacak posisi relatif objek tertentu saat saya memainkan game populer, League of Legends. Secara khusus, saya ingin melacak koordinat layar x,y dari "minion" mana pun yang saat ini ada di layar ("Minion" adalah orang-orang kecil di tengah gambar dengan bilah kecil berwarna merah dan hijau di atas kepala mereka).
Saat ini saya menggunakan kelas Robot Java untuk mengirim tangkapan layar ke program saya saat saya bermain, dan saya mencoba mencari algoritma terbaik untuk menemukan minion dan melacaknya selama mereka tetap berada di layar.
Pemikiran saya saat ini adalah menggunakan jaringan saraf konvolusional untuk mengidentifikasi dan menemukan lokasi minion berdasarkan bilah berwarna di sana. Namun, saya harus mengidentifikasi ulang dan menemukan minion di setiap frame baru, dan sepertinya ini akan memakan biaya komputasi yang mahal jika saya ingin melakukan ini secara real time (~10-60 fps).
Algoritme visi komputer semacam ini sebenarnya bukan spesialisasi saya, tetapi tampaknya masuk akal jika ada algoritma yang mengeksploitasi fakta bahwa objek dalam video bergerak secara terus menerus (yaitu tidak melompat-lompat dari bingkai ke bingkai).
Jadi, apakah ada algoritma yang mudah diimplementasikan untuk menyelesaikan tugas ini?