คำถามนี้เกี่ยวข้องกับการตรวจจับวัตถุ และโดยพื้นฐานแล้วคือการตรวจจับวัตถุที่ "รู้จัก" ใด ๆ ตัวอย่างเช่น ลองจินตนาการว่าฉันมีวัตถุด้านล่าง
- โต๊ะ
- ขวด.
- กล้อง
- รถ
ฉันจะถ่ายรูป 4 รูปจากวัตถุแต่ละชิ้นเหล่านี้ คนหนึ่งจากซ้าย อีกคนจากขวา และอีก 2 คนจากบนและล่าง เดิมทีฉันคิดว่าเป็นไปได้ที่จะจดจำวัตถุเหล่านี้ด้วยภาพถ่ายทั้ง 4 ภาพต่อภาพ เพราะคุณมีภาพถ่ายทั้ง 4 มุม ไม่ว่าคุณจะมองเห็นวัตถุด้วยวิธีใดก็ตาม คุณก็ตรวจจับมันได้
แต่ฉันสับสนกับความคิดของใครบางคนเกี่ยวกับการฝึกเครื่องยนต์ด้วยภาพเชิงบวกและเชิงลบนับพันจากแต่ละวัตถุ ฉันไม่คิดว่าสิ่งนี้เป็นสิ่งจำเป็น
พูดง่ายๆ ก็คือ คำถามของฉันคือ ในการที่จะระบุวัตถุนั้น ฉันจำเป็นต้องมีวัตถุเชิงบวกและเชิงลบหลายพันรายการเหล่านี้หรือไม่? หรือแค่ 4 รูปจาก 4 มุมก็เพียงพอแล้ว?
ฉันคาดว่าจะใช้ OpenCV สำหรับสิ่งนี้
อัปเดต
จริงๆ แล้วหลักๆ ก็ประมาณนี้ครับ.. ลองนึกภาพผมมีโน้ตบุ๊ก 2 เครื่อง หนึ่งคือ Dell และอีกอันคือ HP ทั้งสองเครื่องเป็นแล็ปท็อป แต่คุณรู้ไหมว่าทั้งสองเครื่องมีความแตกต่างที่มองเห็นได้ชัดเจนรวมถึงโลโก้ด้วย เราสามารถทำได้โดยใช้ คำอธิบายฟีเจอร์ ได้ไหม ถ้าไม่ กระบวนการ "ฝึกฝน" จะ "ยาก" แค่ไหน? ต้องมีกี่รูป?
อัปเดต 2 ฉันต้องตรวจจับวัตถุ "เฉพาะ" ไม่ใช่รถทุกคัน ทุกขวด เป็นต้น เช่น "รถมารูติ รุ่น 123" และ "รถเฟอร์รารี รุ่น 234" ต่างก็เป็นรถคนละคันแต่ต่างกัน ลองนึกภาพฉันมีรูปภาพของ Maruti และ Ferrari ของรถรุ่นที่กล่าวมาข้างต้น แล้วฉันต้องตรวจจับพวกมัน ฉันไม่ต้องกังวลกับรถหรือรถรุ่นอื่น หรือแม้แต่รุ่นอื่นๆ ของ Maruti และ Ferrari แต่ที่กล่าวมาข้างต้น "รถยนต์รุ่น Maruti 123" ควรระบุเป็น "รถยนต์รุ่น Maruti 123" และที่กล่าวมาข้างต้น "รถยนต์รุ่น Ferrari 234" ควรระบุเป็น "รถยนต์รุ่น Ferrari 234" ฉันต้องมีรูปภาพจำนวนเท่าใดเพื่อสิ่งนี้?