scipy km berarti iterasi artinya?

Saya menggunakan algoritma kmeans2 dari scipy untuk mengelompokkan warna piksel pada gambar untuk mendapatkan rata-rata warna teratas pada gambar.

http://docs.scipy.org/doc/scipy/reference/generated/scipy.cluster.vq.kmeans2.html#scipy.cluster.vq.kmeans2

Saya bingung arti parameter ini:

iter : int
Number of iterations of the k-means algrithm to run. Note that this differs in meaning from the iters parameter to the kmeans function.

Jika saya ingin algoritma kmeans berjalan hingga cluster tidak berubah, apakah saya akan menetapkan nilai iter tinggi? Apakah ada cara untuk menemukan nilai terbaik iter?


person Michael Johnston    schedule 13.07.2013    source sumber


Jawaban (1)


Algoritme K-means bekerja dengan menginisialisasi beberapa titik K dan mengelompokkan data Anda berdasarkan jaraknya dari titik tersebut. Kemudian dilakukan iterasi dengan menghitung pusat massa setiap cluster dan mendefinisikan ulang cluster berdasarkan jarak dari pusat massa tersebut. Hal ini tidak dijamin akan menyatu dengan cepat, meskipun hal ini sering terjadi, sehingga memerlukan nilai iterasi maksimum.

sunting: nilai iterasi maksimum. salah menurut saya, ini benar-benar akan diulang iter kali. Namun, defaultnya 10 adalah nilai iter yang umum.

Semakin tinggi nilai iter maka semakin baik clusteringnya. Anda dapat mencoba menjalankan K-means pada beberapa data Anda dengan berbagai nilai iter dan melihat di mana waktu untuk menghitung peningkatan kualitas cluster terlalu tinggi untuk kebutuhan Anda.

person seth    schedule 13.07.2013
comment
Ah oke, jadi jika saya menyetel iter=9999, itu tidak akan selalu mengulangi 9999, tetapi sampai menyatu - person Michael Johnston; 13.07.2013
comment
Apakah ada cara untuk mengulanginya tanpa batas? Adakah juga cara untuk menunjukkan berapa banyak iterasi yang terjadi saat konvergen? - person Michael Johnston; 13.07.2013
comment
Saya tidak yakin tentang scipy, namun sebaiknya langsung mengimplementasikan kembali kmeans sesuai keinginan Anda, tetapi dengan modul numpy dan scipy untuk menjaga kecepatan. - person seth; 13.07.2013