สิ่งตีพิมพ์ในหัวข้อ 'computer-vision'


คอมพิวเตอร์วิทัศน์กับใบหน้ามนุษย์ (1/3)
ภาพรวมของคอมพิวเตอร์วิทัศน์โดยใช้รูปภาพใบหน้าของเรา ใบหน้าอาจเป็นส่วนหนึ่งของร่างกายมนุษย์ที่ส่งข้อมูลภาพที่เกี่ยวข้องส่วนใหญ่ของบุคคล จึงไม่น่าแปลกใจที่เอกสารประจำตัวทุกฉบับจะมีรูปถ่ายของเจ้าของ ในคอมพิวเตอร์วิทัศน์ หลายระบบใช้ประโยชน์จากข้อมูลจากใบหน้าเพื่อแก้ไขงานประเภทต่างๆ ในซีรีส์นี้ เราจะมาสำรวจประเภทของข้อมูลและการใช้งานที่เกี่ยวข้องกับใบหน้ามนุษย์ ในคอมพิวเตอร์วิทัศน์ มีแอปพลิเคชั่นมากมายที่ใช้ข้อมูลจากใบหน้าเพื่อวัตถุประสงค์ที่แตกต่างกัน: ความบันเทิง การเฝ้าระวัง แฟชั่น..

คุณนับฝูงชนอย่างไร?
ศิลปะการเรียนรู้ของเครื่อง คุณนับฝูงชนอย่างไร? วิธีการใหม่ของการนับฝูงชนตามภาพ วิธีการของจาคอบส์ ซึ่งตั้งชื่อตามชายผู้คิดค้นวิธีนี้ เป็นวิธีที่ใช้กันทั่วไปในการนับจำนวนผู้คน ในการประท้วงและการชุมนุม วิธีการของ Jacobs คือการแบ่งพื้นที่ที่ฝูงชนออกเป็นส่วนๆ หาจำนวนคนโดยเฉลี่ยในแต่ละส่วน แล้วคูณจำนวนนั้นด้วยจำนวน...

การออกกลางคันที่ดีกว่า! การใช้งาน DropBlock ใน PyTorch
การออกกลางคันที่ดีกว่า! การใช้งาน DropBlock ใน PyTorch สามารถดูบทความแบบโต้ตอบได้ใน "ที่นี่" DropBlock ใช้งานได้กับ แว่นตา ในไลบรารีคอมพิวเตอร์วิทัศน์ของฉัน! การแนะนำ วันนี้เราจะติดตั้ง DropBlock ใน PyTorch! DropBlock นำเสนอโดย Ghiasi et al เป็นเครื่องมือสร้างเทคนิคการทำให้เป็นมาตรฐานโดยเฉพาะสำหรับรูปภาพที่ใช้งานเชิงประจักษ์ได้ดีกว่า Dropout เหตุใด Dropout จึงไม่เพียงพอ? ปัญหาเรื่อง Dropout บนรูปภาพ Dropout เป็นเทคนิคการทำให้เป็นมาตรฐานซึ่งจะสุ่มปล่อยส่วนของอินพุต..

ปัญญาประดิษฐ์คือดาบสองคมแห่งอนาคตของเรา
เป็นเวลา ศตวรรษ นักวิทยาศาสตร์ได้สงสัยถึงความล้ำลึกของสติปัญญาของมนุษย์ ตั้งแต่การสร้างกราฟิกไปจนถึงการสร้างสถาปัตยกรรม คณิตศาสตร์ และภาษา มนุษย์ถูกมองว่าเป็นสัตว์ที่ฉลาดที่สุดและกล้าหาญที่สุดมาโดยตลอด เป็นเวลา ทศวรรษ นักวิทยาศาสตร์สามารถสร้างเทคโนโลยีใหม่เพื่อช่วยเหลือมนุษย์ ตั้งแต่เครื่องคิดเลข หุ่นยนต์อัตโนมัติ ไปจนถึงโดรนรุ่นใหม่ ตอนนี้ คำถามกลายเป็นว่า เราจะทำให้เทคโนโลยีนี้ฉลาดเหมือนมนุษย์ได้หรือไม่? นักวิทยาศาสตร์และนักวิจัยอยู่ที่นี่มานานหลายปี..

สถาปัตยกรรมแบบหลายงาน
โมเดลน้ำหนักเบาสำหรับการอนุมานหลายงานแบบเรียลไทม์ การแนะนำ คุณเคยสงสัยบ้างไหมว่าจะฝึก deep neural network ให้ทำอะไรหลายๆ อย่างได้อย่างไร? แบบจำลองดังกล่าวเรียกว่าสถาปัตยกรรมแบบหลายงาน และอาจมีประโยชน์มากกว่าแนวทางแบบเดิมที่ใช้แบบจำลองแต่ละแบบสำหรับแต่ละงาน สถาปัตยกรรมแบบหลายงานเป็นส่วนย่อยของการเรียนรู้แบบหลายงานซึ่งเป็นแนวทางทั่วไปในการฝึกอบรมแบบจำลองหรือชุดแบบจำลองเพื่อทำงานหลายอย่างพร้อมกัน ในโพสต์นี้..

การแสดงภาพและการประมวลผลล่วงหน้า: การสำรวจรูปแบบและเทคนิค
การแสดงภาพและการประมวลผลล่วงหน้า: การสำรวจรูปแบบและเทคนิค บทนำ: ในโลกดิจิทัลปัจจุบัน รูปภาพมีบทบาทสำคัญในแอปพลิเคชันต่างๆ ตั้งแต่การถ่ายภาพและการออกแบบเว็บไซต์ ไปจนถึงคอมพิวเตอร์วิทัศน์และการเรียนรู้ของเครื่อง การทำความเข้าใจรูปแบบภาพต่างๆ และใช้เทคนิคการประมวลผลล่วงหน้าที่เหมาะสมถือเป็นสิ่งสำคัญในการเพิ่มประสิทธิภาพข้อมูลภาพและบรรลุผลลัพธ์ที่ต้องการ ในด้านคอมพิวเตอร์วิทัศน์และการเรียนรู้ของเครื่อง รูปภาพทำหน้าที่เป็นแหล่งข้อมูลภาพขั้นพื้นฐาน อย่างไรก็ตาม..

GAN — ทำไมการฝึกอบรม Generative Adversarial Networks จึงเป็นเรื่องยาก!
การจดจำภาพวาดของโมเนต์นั้นง่ายกว่าการวาดภาพ แบบจำลองเชิงกำเนิด (การสร้างข้อมูล) นั้นถือว่ายากกว่ามากเมื่อเปรียบเทียบกับแบบจำลองที่เลือกปฏิบัติ (การประมวลผลข้อมูล) การฝึกอบรม GAN ก็ยากเช่นกัน บทความนี้เป็นส่วนหนึ่งของ ซีรีส์ GAN และเราจะตรวจสอบว่าเหตุใดการฝึกอบรมจึงเข้าใจยากมาก จากการศึกษานี้ เราเข้าใจปัญหาพื้นฐานบางประการที่ขับเคลื่อนทิศทางของนักวิจัยหลายคน เราจะตรวจสอบข้อขัดแย้งบางประการเพื่อที่เราจะได้ทราบว่าการวิจัยมุ่งหน้าไปยังจุดใด ก่อนที่จะพิจารณาปัญหา เรามาสรุปสมการ GAN..