สิ่งตีพิมพ์ในหัวข้อ 'clustering'


สูตรโกงสำหรับอัลกอริธึมการจัดกลุ่ม
อัลกอริธึมการจัดกลุ่มเป็นหนึ่งในอัลกอริธึมยอดนิยมที่ผู้ปฏิบัติงานด้านแมชชีนเลิร์นนิงทั่วโลกใช้เพื่อแก้ปัญหาการจำแนกประเภท อัลกอริธึมการจัดกลุ่มที่ได้รับความนิยมมากที่สุดในบรรดาอัลกอริธึมการจัดกลุ่มทั้งหมดคือการจัดกลุ่มแบบ K-means แต่ในเรื่องนี้เราจะมาดูกันว่ามันทำงานอย่างไร มีตัวเลือกอื่นๆ ที่มีให้เลือกใช้เมื่อใด แตกต่างกันอย่างไร และอื่นๆ อีกมากมาย เคมีน มันต้องการให้เรารู้ว่ามีกี่กลุ่มที่เป็นไปได้ที่สามารถสร้างขึ้นได้ก่อนที่จะใช้อัลกอริธึมด้วยซ้ำ โดยถือว่ากระจุกมีรูปร่างนูน..

ทำนายความนิยมของเพลง
ความเข้าใจทางธุรกิจ ศิลปิน โปรดิวเซอร์ และค่ายเพลงหลายแห่งในวงการเพลงมุ่งมั่นที่จะสร้างเพลงฮิต แต่อะไรคือความสมดุลที่สมบูรณ์แบบของความสามารถในการเต้น พลังงาน จังหวะ ระยะเวลา และปัจจัยอื่นๆ ที่สามารถรับประกันความนิยมได้ ตามรายงานของ Business Insider ศิลปินมักจะมีรายได้ระหว่าง 0.003 ถึง 0.005 เหรียญสหรัฐฯ ต่อการสตรีม ซึ่งหมายความว่าต้องใช้เวลาประมาณ 250 สตรีมจึงจะมีรายได้เพียง 1 เหรียญสหรัฐฯ เงินนี้มาจากค่าธรรมเนียมการสมัครสมาชิกของ Spotify และรายได้ที่รวบรวมจากการแสดงโฆษณา..

การจัดกลุ่มแบบลำดับชั้น
กลุ่มการจัดกลุ่มแบบลำดับชั้น (การรวมกลุ่มหรือเรียกอีกอย่างว่าแนวทางจากล่างขึ้นบน) หรือการแบ่ง (การแบ่งกลุ่มหรือเรียกอีกอย่างว่าวิธีจากบนลงล่าง) กลุ่มตามการวัดระยะทาง ในการทำคลัสเตอร์แบบ Agglomerative จุดข้อมูลแต่ละจุดจะทำหน้าที่เป็นคลัสเตอร์ตั้งแต่แรก จากนั้นจึงจัดกลุ่มคลัสเตอร์ทีละรายการ Divisive เป็นสิ่งที่ตรงกันข้ามกับ Agglomerative โดยเริ่มจากจุดทั้งหมดออกเป็นกระจุกเดียวแล้วแบ่งออกเพื่อสร้างกระจุกเพิ่มเติม อัลกอริธึมเหล่านี้สร้างเมทริกซ์ระยะทางของคลัสเตอร์ที่มีอยู่ทั้งหมด..

การแบ่งส่วนลูกค้า — ส่วนที่ 1
การแบ่งกลุ่มลูกค้าออนไลน์ตามคำอธิบายรายการ การแนะนำ การแบ่งส่วนลูกค้าเป็นหนึ่งในการใช้งานทั่วไปของการวิเคราะห์ข้อมูล/วิทยาศาสตร์ข้อมูล ในสองโพสต์นี้ เราจะดูตัวอย่างการแบ่งส่วนลูกค้า เราจะใช้ "ชุดข้อมูลการค้าปลีกออนไลน์ II" ซึ่งประกอบด้วยธุรกรรมของการค้าปลีกออนไลน์ในสหราชอาณาจักรระหว่างวันที่ 1/12/2552 ถึง 09/12/2554 ชุดข้อมูลประกอบด้วย 1.067.371 แถวเกี่ยวกับการซื้อของลูกค้า 5.943 ราย ดังที่เราเห็น ชุดข้อมูลประกอบด้วยใบสั่งใบแจ้งหนี้ที่สามารถขยายได้หลายแถว..

การแบ่งกลุ่ม Kmeans
การแบ่งครึ่งเคมีน เป็นวิธีการแบบผสมระหว่างการแบ่งกลุ่มแบบลำดับชั้นแบบแยก (การจัดกลุ่มจากบนลงล่าง) และการจัดกลุ่มแบบเคมีนแบบแยกส่วน แทนที่จะแบ่งพาร์ติชันชุดข้อมูลออกเป็น K คลัสเตอร์ในการวนซ้ำแต่ละครั้ง การแบ่งอัลกอริทึม k-mean จะแบ่งคลัสเตอร์หนึ่งคลัสเตอร์ออกเป็นสองคลัสเตอร์ย่อยในแต่ละขั้นตอนการแบ่งครึ่ง (โดยใช้ k-mean) จนกระทั่งได้ k คลัสเตอร์ การจัดกลุ่มแบบลำดับชั้นแบบแบ่งแยก Divisive Clustering เริ่มต้นที่ระดับบนสุดด้วยคลัสเตอร์เดียวและแบ่งไปยังระดับล่างสุด..