Menemukan cluster memanjang menggunakan MATLAB

Izinkan saya menjelaskan apa yang saya coba lakukan. Saya memiliki plot titik/piksel Gambar di ruang RGB. Apa yang saya coba lakukan adalah menemukan cluster memanjang di ruang ini. Saya cukup baru dalam teknik pengelompokan dan mungkin saya tidak melakukan sesuatu dengan benar, saya mencoba mengelompokkan menggunakan pengelompokan k-means bawaan MATLAB tetapi tampaknya itu bukan pendekatan terbaik dalam kasus ini.

Yang perlu saya lakukan adalah menemukan "kelompok warna".

Inilah yang saya dapatkan setelah menerapkan K-means pada sebuah gambar. masukkan deskripsi gambar di sini

Seperti inilah tampilannya:

masukkan deskripsi gambar di sini

untuk gambar seperti ini:

masukkan deskripsi gambar di sini

Dapatkah seseorang memberi tahu saya di mana kesalahan saya, dan apa yang dapat saya lakukan untuk meningkatkan hasil saya?


Catatan: Maaf untuk gambar beresolusi rendah, ini adalah yang terbaik yang saya miliki.


person ffledgling    schedule 16.11.2013    source sumber
comment
Jika itu bisa membantu, saya dapat merujuk Anda ke slide dan kode Matlab tentang berbagai teknik pengelompokan di Matlab.   -  person GilLevi    schedule 17.11.2013
comment
Tentu, saya akan mengambil apa yang bisa saya dapatkan.   -  person ffledgling    schedule 17.11.2013
comment
Oke, silakan kirim email kepada saya: gil.levi100 di gmail.com dan saya akan mengirimkan kembali apa yang saya miliki.   -  person GilLevi    schedule 17.11.2013


Jawaban (3)


k-means pada dasarnya mengasumsikan cluster berbentuk kira-kira berbentuk bola. Dalam kasus Anda, mereka pasti TIDAK. Coba paskan Gaussian ke setiap cluster dengan matriks kovarians non-bola. Pada dasarnya, Anda akan mengikuti langkah-langkah pemaksimalan ekspektasi (EM) yang sama seperti di k-means dengan satu-satunya pengecualian bahwa Anda akan memodelkan dan menyesuaikan matriks kovarians juga.

Berikut ini garis besar algoritmanya

  1. init: tetapkan setiap titik secara acak ke salah satu dari k cluster.
  2. Untuk setiap cluster memperkirakan mean dan kovarians
  3. Untuk setiap titik perkirakan kemungkinannya untuk menjadi bagian dari setiap cluster
    perhatikan bahwa kemungkinan ini tidak hanya didasarkan pada jarak ke pusat (rata-rata) tetapi juga pada bentuk cluster seperti yang dikodekan oleh matriks kovarians
  4. ulangi tahap 2 dan 3 hingga konvergensi atau hingga melebihi jumlah iterasi yang telah ditentukan
person Shai    schedule 16.11.2013

Apakah Anda mencoba meniru hasil makalah ini? Menurut saya, lakukan saja apa yang mereka lakukan.

Namun, saya akan menambahkan karena ada beberapa masalah dengan jawaban saat ini.

1) Ya, cluster Anda tidak berbentuk bola- yang merupakan asumsi yang dibuat oleh k-means. DBSCAN dan MeanShift adalah dua metode yang lebih umum untuk menangani data tersebut, karena keduanya dapat menangani data non sferis. Namun, data Anda tampaknya memiliki satu rumpun pusat besar yang menyebar ke arah luar dalam beberapa arah yang terbatas.

Bagi DBSCAN, ini berarti ia akan memasukkan semuanya ke dalam satu cluster, atau semuanya menjadi clusternya sendiri. Karena DBSCAN memiliki asumsi kepadatan yang seragam dan mengharuskan cluster dipisahkan dengan margin tertentu.

MeanShift kemungkinan besar akan mengalami kesulitan karena segala sesuatu tampaknya berasal dari satu gumpalan pusat - sehingga akan menjadi area dengan kepadatan tertinggi yang menjadi tujuan pergeseran titik-titik tersebut, dan menyatu menjadi satu cluster besar.

Saran saya adalah mengubah ruang warna. RGB mengalami masalah, dan asumsi yang dibuat sebagian besar algoritma mungkin tidak akan bertahan dengan baik. Algoritme pengelompokan apa yang harus Anda gunakan kemungkinan besar akan berubah di ruang fitur yang berbeda, namun mudah-mudahan ini akan membuat masalah lebih mudah ditangani.

person Raff.Edward    schedule 16.11.2013
comment
itulah makalah yang saya coba terapkan sebagai bagian dari makalah lain, namun saya mengalami kesulitan serius dalam memahami apa yang penulis lakukan. - person ffledgling; 17.11.2013
comment
Apa yang Anda tanyakan tidak sama dengan apa yang dilakukan di makalah itu. Jika Anda memiliki pertanyaan atau bagian yang tidak Anda pahami di makalah - itu akan menjadi pertanyaan yang berbeda. Mengetahui latar belakang juga membantu - tetapi makalah ini cukup mudah. Meskipun nilai parameter pasti yang digunakan tidak disebutkan, nilai parameter tersebut diberikan secara garis besar langkah demi langkah di bagian 3. - person Raff.Edward; 17.11.2013
comment
Sepertinya saya salah menafsirkan makalah ini, saya pikir bagian 3 diterapkan setelah memperoleh cluster ortogonal. - person ffledgling; 17.11.2013
comment
Anda harus berbicara dengan penasihat Anda, Anda memerlukan bantuan mempelajari cara membaca makalah dan memahami pengetahuan tambahan. Tidak ada apa pun tentang ortogonalitas dalam makalah itu, dan tidak ada langkah yang dapat digambarkan sebagai menemukan komponen apa pun yang ortogonal satu sama lain. - person Raff.Edward; 17.11.2013
comment
1. Koreksi tentang gugus ortogonal, yang saya maksud adalah gugus yang kira-kira ortogonal hingga cangkang bola. (Gambar 7.) 2. Penasihat sayalah yang meminta saya menggunakan beberapa bentuk pengelompokan K-means untuk menemukan kelompok yang memanjang. :-/ - person ffledgling; 17.11.2013
comment
Carilah penasihat baru. Saya sudah menjawab pertanyaan yang Anda ajukan. Jika Anda tidak memahami apa yang ingin terjadi di koran - Anda memerlukan lebih dari sekadar mendapatkan satu atau 2 jawaban. Jika penasihat Anda mengira k-means akan meniru hasil makalah tersebut - mereka 1) tidak membacanya, 2) tidak peduli, atau 3) tidak tahu apa yang mereka bicarakan. - person Raff.Edward; 17.11.2013
comment
Memang. Terima kasih atas semua informasinya. - person ffledgling; 17.11.2013
comment
@ Raff.Edward Saya pikir Anda terlalu keras terhadap supervisor orang ini padahal Anda sebenarnya tidak memiliki kontak dengannya. Sungguh kasar jika berbicara seperti itu kepada seseorang yang hanya memiliki sedikit pengetahuan tentang seluk-beluk pengawasannya. - person Shai; 17.11.2013
comment
@Shai Mungkin. Saya hanya tahu separuh informasinya (bahkan tidak juga). Jika saya menganggap pernyataannya begitu saja, maka ada masalah. Jika versinya tidak akurat, maka itu masalah lain. - person Raff.Edward; 17.11.2013
comment
@Raff.Edward jika versinya akurat... Itu adalah jika yang sangat besar ketika Anda mengetahui paling banyak separuh cerita. Bagaimana perasaan Anda jika Anda menjadi supervisor orang ini? Saya yakin dia perlu melakukan diskusi yang lebih menyeluruh dengan profesornya, namun saya akan memberikan penghargaan pada profesornya. - person Shai; 17.11.2013
comment
@ Raff.Edward dan Shai, Anda berdua bersikap sedikit kasar, izinkan saya menjelaskan, Pembelajaran Mesin dan AI bukanlah bidang spesialisasi penasihat saya dan juga bukan bidang spesialisasi saya. Aku sudah berdiskusi dengan penasihatku, dan dia mengarahkanku sebaik mungkin, Seandainya menyelesaikan masalah yang aku hadapi semudah berbicara dengan penasihatku, percayalah aku pasti sudah melakukannya sejak lama. - person ffledgling; 17.11.2013

Lihatlah algoritma pengelompokan berbasis kepadatan, seperti DBSCAN dan MeanShift. Jika Anda melakukan ini untuk segmentasi, Anda mungkin ingin menambahkan koordinat piksel ke vektor Anda.

person Don Reba    schedule 16.11.2013