ความก้าวหน้าของการแยกตัวประกอบไบนารี่เมทริกซ์ ตอนที่ 3 (คณิตศาสตร์ขั้นสูงสำหรับการเรียนรู้ของเครื่อง)

การแยกตัวประกอบเมทริกซ์แบบไบนารีแบบไม่ลบแบบมีพารามิเตอร์แบบเบย์ (arXiv)

ผู้แต่ง : Alberto Lumbreras, Louis Filstroff, Cédric Févotte

บทคัดย่อ : เมทริกซ์ข้อมูลไบนารีสามารถแสดงข้อมูลได้หลายประเภท เช่น เครือข่ายสังคม การโหวต หรือการแสดงออกของยีน ในบางกรณี การวิเคราะห์เมทริกซ์ไบนารีสามารถจัดการได้ด้วยการแยกตัวประกอบเมทริกซ์ที่ไม่เป็นลบ (NMF) โดยที่เมทริกซ์ข้อมูลที่สังเกตได้จะถูกประมาณด้วยผลคูณของเมทริกซ์ที่ไม่เป็นลบที่มีขนาดเล็กกว่าสองตัว ในบริบทนี้ NMF ที่น่าจะเป็นจะสันนิษฐานว่าเป็นแบบจำลองเชิงกำเนิดซึ่งข้อมูลมักจะถูกกระจายแบบเบอร์นูลลี บ่อยครั้ง ฟังก์ชันลิงก์ถูกใช้เพื่อจับคู่การแยกตัวประกอบกับช่วง [0,1] เพื่อให้มั่นใจว่าพารามิเตอร์เบอร์นูลลีเฉลี่ยถูกต้อง อย่างไรก็ตาม ฟังก์ชันลิงก์มีข้อเสียที่อาจนำไปสู่โมเดลที่ไม่สามารถตีความได้ ในทางกลับกัน NMF ที่มีพารามิเตอร์เฉลี่ยสามารถเอาชนะปัญหานี้ได้ เราเสนอกรอบการทำงานแบบรวมสำหรับแบบจำลองการแยกตัวประกอบเมทริกซ์แบบไบนารี่ที่มีค่าเฉลี่ยแบบเบย์ที่ไม่เป็นลบ (NBMF) เราวิเคราะห์แบบจำลองสามแบบซึ่งสอดคล้องกับข้อจำกัดที่เป็นไปได้สามประการซึ่งคำนึงถึงค่าเฉลี่ย-พารามิเตอร์โดยไม่จำเป็นต้องใช้ฟังก์ชันลิงก์ นอกจากนี้เรายังได้ตัวอย่าง Gibbs ที่ยุบตัวใหม่และอัลกอริธึมการเปลี่ยนแปลงแบบยุบเพื่ออนุมานการกระจายตัวของปัจจัยด้านหลัง ต่อไป เราจะขยายแบบจำลองที่นำเสนอไปสู่การตั้งค่าแบบไม่มีพารามิเตอร์ โดยที่จำนวนมิติแฝงที่ใช้จะถูกขับเคลื่อนโดยข้อมูลที่สังเกตได้โดยอัตโนมัติ เราวิเคราะห์ประสิทธิภาพของวิธี NBMF ของเราในชุดข้อมูลหลายชุดสำหรับงานที่แตกต่างกัน เช่น การเรียนรู้พจนานุกรมและการทำนายข้อมูลที่ขาดหายไป การทดลองแสดงให้เห็นว่าวิธีการของเราให้ผลลัพธ์ที่คล้ายคลึงหรือเหนือกว่าเทคโนโลยีที่ทันสมัย ขณะเดียวกันก็ตรวจจับจำนวนส่วนประกอบที่เกี่ยวข้องโดยอัตโนมัติ

2. การแยกตัวประกอบเมทริกซ์ไบนารีผ่านการเรียนรู้ด้วยพจนานุกรม (arXiv)

ผู้แต่ง : “อิกนาซิโอ รามิเรซ”

บทคัดย่อ : การแยกตัวประกอบเมทริกซ์เป็นเครื่องมือสำคัญในการวิเคราะห์ข้อมูล การใช้งานประกอบด้วยระบบผู้แนะนำ การวิเคราะห์สหสัมพันธ์ การประมวลผลสัญญาณ และอื่นๆ เมทริกซ์ไบนารี่เป็นกรณีพิเศษที่ได้รับความสนใจอย่างมากมานานกว่าสามสิบปี โดยเฉพาะอย่างยิ่งในด้านการขุดข้อมูล การเรียนรู้พจนานุกรมหมายถึงกลุ่มวิธีการเรียนรู้พื้นฐานที่ครบถ้วนสมบูรณ์ (เรียกอีกอย่างว่าเฟรม) เพื่อเข้ารหัสตัวอย่างประเภทที่กำหนดอย่างมีประสิทธิภาพ พื้นที่นี้ ซึ่งปัจจุบันมีอายุประมาณ 20 ปีเช่นกัน ส่วนใหญ่ได้รับการพัฒนาในด้านการประมวลผลสัญญาณ ในงานนี้ เราขอเสนอวิธีการแยกตัวประกอบเมทริกซ์แบบไบนารีสองวิธีโดยอาศัยการปรับแบบไบนารีของกระบวนทัศน์การเรียนรู้จากพจนานุกรมไปเป็นเมทริกซ์แบบไบนารี อัลกอริธึมที่นำเสนอมุ่งเน้นไปที่ความเร็วและความสามารถในการขยายขนาด พวกมันทำงานร่วมกับปัจจัยไบนารี่รวมกับการดำเนินการที่ชาญฉลาดและจำนวนเต็มเสริมบางตัว นอกจากนี้ วิธีการนี้ยังใช้ได้กับการแยกตัวประกอบเมทริกซ์ไบนารีออนไลน์อีกด้วย ประเด็นสำคัญอีกประการหนึ่งในการแยกตัวประกอบเมทริกซ์คือการเลือกอันดับสำหรับปัจจัยต่างๆ เราแก้ไขปัญหาการเลือกแบบจำลองนี้ด้วยวิธีที่มีประสิทธิภาพตามหลักการความยาวคำอธิบายขั้นต่ำ ผลลัพธ์เบื้องต้นของเราแสดงให้เห็นว่าวิธีการที่เสนอมีประสิทธิภาพในการสร้างการแยกตัวประกอบที่ตีความได้ของข้อมูลประเภทต่างๆ ที่มีลักษณะแตกต่างกัน

ความก้าวหน้าของการแยกตัวประกอบไบนารี่เมทริกซ์ ตอนที่ 3 (คณิตศาสตร์ขั้นสูงสำหรับการเรียนรู้ของเครื่อง)

คำถามในหัวข้อ