การค้นหาคลัสเตอร์ที่มีความยาวโดยใช้ MATLAB

ให้ฉันอธิบายสิ่งที่ฉันพยายามทำ ฉันมีพล็อตของจุด/พิกเซลของรูปภาพในพื้นที่ RGB สิ่งที่ฉันพยายามทำคือค้นหากลุ่มที่มีความยาวในพื้นที่นี้ ฉันค่อนข้างใหม่กับเทคนิคการจัดกลุ่มและบางทีฉันอาจทำสิ่งไม่ถูกต้อง ฉันกำลังพยายามจัดกลุ่มโดยใช้การจัดกลุ่ม k-means ในตัวของ MATLAB แต่ดูเหมือนว่านั่นไม่ใช่แนวทางที่ดีที่สุดในกรณีนี้

สิ่งที่ฉันต้องทำคือค้นหา "กลุ่มสี"

นี่คือสิ่งที่ฉันได้รับหลังจากใช้ K-mean กับรูปภาพ ป้อนคำอธิบายรูปภาพที่นี่

นี่คือลักษณะที่ควรจะเป็น:

ป้อนคำอธิบายรูปภาพที่นี่

สำหรับภาพเช่นนี้:

ป้อนคำอธิบายรูปภาพที่นี่

ใครช่วยบอกฉันได้ไหมว่าฉันผิดพลาดตรงไหน และฉันสามารถปรับปรุงผลลัพธ์ของฉันได้อย่างไร


หมายเหตุ: ขออภัยสำหรับภาพความละเอียดต่ำ นี่เป็นสิ่งที่ดีที่สุดที่ฉันมี


comment
หากสามารถช่วยได้ ฉันสามารถอ้างอิงถึงสไลด์และโค้ด Matlab เกี่ยวกับเทคนิคการจัดกลุ่มต่างๆ ใน ​​Matlab ได้   -  person GilLevi    schedule 17.11.2013
comment
แน่นอน ฉันจะเอาเท่าที่หาได้   -  person ffledgling    schedule 17.11.2013
comment
ตกลง โปรดส่งอีเมลถึงฉัน: gil.levi100 ที่ gmail.com แล้วฉันจะส่งของที่ฉันมีกลับไปให้คุณ   -  person GilLevi    schedule 17.11.2013


คำตอบ (3)


โดยพื้นฐานแล้วเคมีนจะถือว่ากระจุกดาวมีลักษณะเป็นทรงกลมโดยประมาณ ในกรณีของคุณมันไม่ใช่อย่างแน่นอน ลองปรับ Gaussian ให้พอดีกับแต่ละคลัสเตอร์ด้วยเมทริกซ์ความแปรปรวนร่วมที่ไม่ใช่ทรงกลม โดยพื้นฐานแล้ว คุณจะต้องทำตามขั้นตอนการเพิ่มความคาดหวัง-สูงสุด (EM) เช่นเดียวกับในเคมีน โดยมีข้อยกเว้นเพียงอย่างเดียวว่าคุณจะต้องสร้างแบบจำลองและปรับเมทริกซ์ความแปรปรวนร่วมด้วยเช่นกัน

นี่คือโครงร่างสำหรับอัลกอริทึม

  1. init: สุ่มกำหนดแต่ละจุดให้กับหนึ่งใน k คลัสเตอร์
  2. สำหรับแต่ละค่าเฉลี่ยการประมาณค่าคลัสเตอร์และความแปรปรวนร่วม
  3. สำหรับแต่ละจุดประมาณการความน่าจะเป็นของแต่ละคลัสเตอร์
    โปรดทราบว่าความน่าจะเป็นนี้ไม่ได้ขึ้นอยู่กับระยะทางไปยังจุดศูนย์กลางเท่านั้น (ค่าเฉลี่ย) แต่ยังขึ้นอยู่กับรูปร่างของคลัสเตอร์ด้วยเมื่อถูกเข้ารหัสโดยเมทริกซ์ความแปรปรวนร่วม
  4. ทำซ้ำขั้นตอนที่ 2 และ 3 จนกว่าจะบรรจบกันหรือจนกว่าจะเกินจำนวนการวนซ้ำที่กำหนดไว้ล่วงหน้า
person Shai    schedule 16.11.2013

คุณกำลังพยายามจำลองผลลัพธ์ของบทความนี้หรือไม่? ฉันจะบอกว่าแค่ทำสิ่งที่พวกเขาทำ

อย่างไรก็ตาม ฉันจะเพิ่มเนื่องจากคำตอบปัจจุบันมีปัญหาบางอย่าง

1) ใช่ กระจุกของคุณไม่ใช่ทรงกลม ซึ่งเป็นข้อสันนิษฐานว่าเคมีนทำ DBSCAN และ MeanShift เป็นอีกสองวิธีที่ใช้กันทั่วไปในการจัดการข้อมูลดังกล่าว เนื่องจากสามารถจัดการข้อมูลที่ไม่ใช่ทรงกลมได้ อย่างไรก็ตาม ข้อมูลของคุณดูเหมือนจะมีกระจุกตรงกลางขนาดใหญ่กลุ่มหนึ่งที่กระจายออกไปในทิศทางที่จำกัดเพียงไม่กี่ทิศทาง

สำหรับ DBSCAN นี่หมายความว่าจะรวมทุกอย่างไว้ในคลัสเตอร์เดียว หรือทุกอย่างจะเป็นคลัสเตอร์ของตัวเอง เนื่องจาก DBSCAN สันนิษฐานว่ามีความหนาแน่นสม่ำเสมอ และกำหนดให้คลัสเตอร์ถูกแยกออกจากกันด้วยระยะขอบบางส่วน

MeanShift น่าจะมีปัญหาเพราะทุกอย่างดูเหมือนจะมาจากก้อนเดียวที่อยู่ตรงกลาง นั่นจะเป็นพื้นที่ที่มีความหนาแน่นสูงสุดที่จุดต่างๆ จะเลื่อนไปทาง และมาบรรจบกันเป็นกระจุกขนาดใหญ่

คำแนะนำของฉันคือเปลี่ยนปริภูมิสี RGB มีปัญหา และสมมติฐานที่อัลกอริธึมส่วนใหญ่ทำอาจจะทนได้ไม่ดีนัก อัลกอริธึมการจัดกลุ่มที่คุณควรใช้มีแนวโน้มที่จะเปลี่ยนแปลงในพื้นที่ฟีเจอร์ต่างๆ แต่หวังว่าจะทำให้ปัญหาจัดการได้ง่ายขึ้น

person Raff.Edward    schedule 16.11.2013
comment
คือ บทความที่ฉันพยายามนำไปใช้โดยเป็นส่วนหนึ่งของบทความอื่น แต่ฉันมีปัญหาร้ายแรงในการทำความเข้าใจว่าผู้เขียนกำลังทำอะไรอยู่ - person ffledgling; 17.11.2013
comment
สิ่งที่คุณถามไม่เหมือนกับสิ่งที่คุณทำในรายงานนั้น หากคุณมีคำถามหรือส่วนที่ไม่เข้าใจในรายงาน นั่นอาจเป็นชุดคำถามอื่น การรู้ภูมิหลังก็ช่วยได้เช่นกัน แต่บทความนี้ค่อนข้างตรงไปตรงมา แม้ว่าไม่ได้ระบุค่าพารามิเตอร์ที่แน่นอนที่ใช้ แต่ก็มีการอธิบายโครงร่างทีละขั้นตอนในส่วนที่ 3 - person Raff.Edward; 17.11.2013
comment
ดูเหมือนว่าฉันจะตีความบทความนี้ผิด ฉันคิดว่าส่วนที่ 3 ถูกนำมาใช้ หลังจาก ได้รับกระจุกมุมฉากแล้ว - person ffledgling; 17.11.2013
comment
คุณควรพูดคุยกับที่ปรึกษาของคุณ คุณต้องการความช่วยเหลือในการเรียนรู้วิธีอ่านเอกสารและทำความเข้าใจความรู้ที่จำเป็น บทความนั้นไม่มีสิ่งใดเกี่ยวกับความเป็นมุมตั้งฉาก และไม่มีขั้นตอนใดๆ ที่สามารถอธิบายได้ว่าเป็นการค้นหาส่วนประกอบใดๆ ที่ตั้งฉากซึ่งกันและกัน - person Raff.Edward; 17.11.2013
comment
1. การแก้ไขเกี่ยวกับกระจุกมุมฉาก ฉันหมายถึงกระจุกที่มีประมาณมุมตั้งฉากถึงเปลือกทรงกลม (รูปที่ 7) 2. ที่ปรึกษาของผมเองที่บอกให้ผมใช้การจัดกลุ่มเคมีนแบบบางรูปแบบเพื่อค้นหากระจุกที่มีความยาว :-/ - person ffledgling; 17.11.2013
comment
หาที่ปรึกษาใหม่. ฉันตอบคำถามที่คุณถามแล้ว หากคุณไม่เข้าใจความต้องการที่เกิดขึ้นในรายงาน คุณต้องการมากกว่าแค่การถามคำถามหรือคำตอบ 2 ข้อ หากที่ปรึกษาของคุณคิดว่าเคมีนกำลังจะจำลองผลลัพธ์ของรายงานนี้ พวกเขา 1) ไม่ได้อ่านมัน 2) ไม่สนใจ หรือ 3) ไม่รู้ว่าพวกเขากำลังพูดถึงอะไร - person Raff.Edward; 17.11.2013
comment
อย่างแท้จริง. ขอบคุณสำหรับข้อมูลทั้งหมด - person ffledgling; 17.11.2013
comment
@ Raff.Edward ฉันคิดว่าคุณเข้มงวดกับหัวหน้าของผู้ชายคนนี้มากเกินไปเมื่อคุณไม่ได้ติดต่อกับเขาเลย เป็นการยากที่จะพูดถึงบุคคลแบบนั้นโดยมีความรู้เพียงเล็กน้อยเกี่ยวกับรายละเอียดการควบคุมดูแลของเขา - person Shai; 17.11.2013
comment
@ชัยน่าจะ.. ฉันรู้ข้อมูลเพียงครึ่งเดียว (ไม่จริงด้วยซ้ำ) ถ้าฉันใช้คำพูดของเขาตามมูลค่า - ก็มีปัญหา ถ้าเวอร์ชันของเขาไม่ถูกต้อง นั่นก็เป็นอีกปัญหาหนึ่ง - person Raff.Edward; 17.11.2013
comment
@Raff.Edward ถ้า เวอร์ชันของเขาถูกต้อง... นั่นเป็นเรื่องใหญ่มาก ถ้า เมื่อคุณรู้เรื่องราวมากที่สุดเพียงครึ่งเดียว คุณจะรู้สึกอย่างไรถ้าคุณเป็นหัวหน้าของผู้ชายคนนี้? ฉันเชื่อว่าเขาจำเป็นต้องพูดคุยกับอาจารย์ของเขาอย่างละเอียดมากขึ้น แต่อย่างน้อยฉันก็จะให้เครดิตอาจารย์ของเขาบ้าง - person Shai; 17.11.2013
comment
@ Raff.Edward และ Shai คุณทั้งคู่ดูรุนแรงกันนิดหน่อย ให้ฉันชี้แจงหน่อยว่า Machine Learning และ AI ไม่ใช่สาขาความเชี่ยวชาญของที่ปรึกษาของฉัน และไม่ใช่ของฉันด้วย ฉันได้พูดคุยกับที่ปรึกษาของฉัน และเขาก็ชี้แนะฉันให้ดีที่สุดเท่าที่จะทำได้ หากการแก้ปัญหาที่ฉันกำลังเผชิญนั้นง่ายเหมือนกับการพูดคุยกับที่ปรึกษา เชื่อฉันเถอะว่าฉันจะทำแบบนั้นไปนานแล้ว - person ffledgling; 17.11.2013

ดูอัลกอริธึมการจัดคลัสเตอร์ ตามความหนาแน่น เช่น DBSCAN และ MeanShift หากคุณกำลังทำเช่นนี้เพื่อการแบ่งส่วน คุณอาจต้องการเพิ่มพิกัดพิกเซลให้กับเวกเตอร์ของคุณ

person Don Reba    schedule 16.11.2013