1. Swin Deformable Attention Hybrid U-Net สำหรับการแบ่งส่วนภาพทางการแพทย์ (arXiv)

ผู้แต่ง: หลี่เชา หวาง, "เจียห่าวหวง", "กวงหยาง"

บทคัดย่อ: วิธีการประสานกลไกการโน้มน้าวใจและกลไกการสนใจตนเองแบบหลายหัวให้สอดคล้องกัน ได้กลายเป็นงานวิจัยที่สำคัญในสาขาการแบ่งส่วนภาพทางการแพทย์เมื่อเร็ว ๆ นี้ มีการเสนอวิธีการผสมผสานต่างๆ อย่างไรก็ตาม มีข้อบกพร่องทั่วไปในงานเหล่านี้ คือ ไม่สามารถให้คำอธิบายโดยตรงสำหรับแบบจำลองไฮบริด ซึ่งมีความสำคัญอย่างยิ่งในสถานการณ์ทางคลินิก Deformable Attention สามารถปรับปรุงประสิทธิภาพการแบ่งส่วนและให้คำอธิบายตามฟิลด์การเปลี่ยนรูป การรวมความสนใจที่เปลี่ยนรูปได้เข้ากับโมเดลไฮบริดอาจส่งผลให้เกิดการทำงานร่วมกันเพื่อเพิ่มประสิทธิภาพการแบ่งส่วนในขณะที่เพิ่มความสามารถในการอธิบาย ในการศึกษานี้ เราเสนอการรวม Swin Deformable Attention เข้ากับสถาปัตยกรรมไฮบริด เพื่อปรับปรุงประสิทธิภาพการแบ่งส่วนในขณะที่สร้างความสามารถในการอธิบาย ในส่วนของการทดลอง Swin Deformable Attention Hybrid UNet (SDAH-UNet) ที่เรานำเสนอนั้น แสดงให้เห็นถึงประสิทธิภาพที่ล้ำสมัยทั้งในด้านกายวิภาคและการแบ่งส่วนรอยโรค

2. Slim U-Net: คุณสมบัติทางกายวิภาคที่มีประสิทธิภาพในการรักษาสถาปัตยกรรม U-net สำหรับการแบ่งส่วนภาพอัลตราซาวนด์ (arXiv)

ผู้แต่ง: Deepak Raina, Kashish Verma, SH Chandrashekhara, Subir Kumar Saha

บทคัดย่อ : เราตรวจสอบการบังคับใช้แบบจำลองที่ใช้ U-Net เพื่อแบ่งส่วนกระเพาะปัสสาวะ (UB) ในภาพอัลตราซาวนด์ในมุมมองอุ้งเชิงกรานชาย การแบ่งส่วนของ UB ในภาพของสหรัฐอเมริกาช่วยให้นักรังสีวิทยาสามารถวินิจฉัย UB ได้ อย่างไรก็ตาม รูปภาพ UB ในสหรัฐอเมริกามีรูปร่างที่ไม่แน่นอน มีขอบเขตไม่ชัดเจน และความแปรปรวนระหว่างและภายในวัตถุมีขนาดใหญ่มาก ทำให้การแบ่งส่วนเป็นงานที่ท้าทายมาก การศึกษาเครือข่ายการแบ่งส่วนที่ทันสมัย ​​(SOTA) ของเรา U-Net สำหรับปัญหานี้พบว่า มักจะล้มเหลวในการจับภาพลักษณะเด่นของ UB เนื่องจากรูปร่างและขนาดทางกายวิภาคที่แตกต่างกันในภาพที่มีเสียงดังของสหรัฐอเมริกา . นอกจากนี้ U-net ยังมีพารามิเตอร์ที่สามารถฝึกอบรมได้มากเกินไป ส่งผลให้ประสิทธิภาพการคำนวณต่ำในระหว่างการฝึกอบรม เราเสนอ Slim U-Net เพื่อจัดการกับความท้าทายของการแบ่งส่วน UB Slim U-Net เสนอให้รักษาคุณลักษณะเด่นของ UB ไว้อย่างมีประสิทธิภาพโดยการปรับโครงสร้างของ U-Net ใหม่โดยใช้เลเยอร์ Convolution 2D จำนวนน้อยลงในเส้นทางการหดตัว เพื่อที่จะรักษาและกำหนดไว้บนเส้นทางการขยาย เพื่อแยกแยะขอบเขตที่เบลอได้อย่างมีประสิทธิภาพ เราขอเสนอวิธีการใส่คำอธิบายประกอบแบบใหม่ ซึ่งรวมถึงพื้นที่พื้นหลังของรูปภาพที่ขอบเขตของพื้นที่ที่มีเครื่องหมาย (RoI) ซึ่งจะช่วยขับเคลื่อนความสนใจของแบบจำลองไปยังขอบเขต นอกจากนี้เรายังแนะนำการผสมผสานฟังก์ชันการสูญเสียสำหรับการฝึกอบรมเครือข่ายในการแบ่งส่วนที่ซับซ้อนของ UB ผลการทดลองแสดงให้เห็นว่า Slim U-net นั้นเหนือกว่า U-net ในเชิงสถิติสำหรับการแบ่งส่วน UB Slim U-net ยังช่วยลดจำนวนพารามิเตอร์ที่ฝึกได้และเวลาการฝึกอีก 54% และ 57.7% ตามลำดับ เมื่อเทียบกับ U-Net มาตรฐาน โดยไม่กระทบต่อความแม่นยำในการแบ่งส่วน