อัปเดต: บทความนี้เป็นส่วนหนึ่งของซีรี่ส์ ดูซีรีส์ทั้งหมด: "ตอนที่ 1" และ "ตอนที่ 2"

OCR , Optical Character Recognizer เป็นหนึ่งในหัวข้อที่ร้อนแรงในปัจจุบัน มันมีอยู่ในรูปภาพมานานแล้ว พูดง่ายๆ ก็คือ OCR จะประมวลผลรูปภาพ, PDF หรือไฟล์อื่น ๆ และดึงข้อมูลที่เป็นข้อความออกมา เป็นเรื่องง่ายมากสำหรับมนุษย์ที่จะจดจำคำที่พวกเขารู้ แต่แล้วคำจากภาษาต่างๆ ที่เราไม่รู้ล่ะ เช่นเดียวกับกรณีของคอมพิวเตอร์ พวกเขาไม่รู้อะไรเลยเกี่ยวกับคำหรือตัวอักษรเหล่านี้ อยู่ที่นี่แล้ว มาพร้อม Machine Learning ในภาพ เราสามารถฝึกเครื่องของเราได้เหมือนเด็กทารกโดยแสดงภาพต่างๆ ให้เขาดู ไม่ดีขนาดนี้!!!.

เราไม่สามารถจินตนาการถึงการใช้งาน OCR ทั้งหมดได้ ลองจินตนาการถึงบุคคลที่ไม่มีการมองเห็นชี้มือถือของเขาไปทางซองยา จากนั้นมือถือจะอ่านข้อมูลสำคัญทั้งหมดให้เขาฟัง เช่น ชื่อยา วันหมดอายุ ราคา และอาจถึง กำลังค้นหาใบสั่งยาของยานั้นทางอินเทอร์เน็ต เครื่องจักรที่แปลงหนังสือล้ำค่าเก่าๆ ให้เป็น PDF เพื่อให้คนทั้งโลกสามารถเพลิดเพลินกับหนังสือเล่มนั้นได้ และแม้แต่ตอนที่ฉันไปร้านอาหารที่จีนและแปลงเมนูที่เขียนเป็นภาษาจีนเป็นภาษาอังกฤษหรือฮินดีเพื่อที่ฉันจะได้สั่งอาหารได้

หากคุณนั่งคิดเกี่ยวกับแอปพลิเคชัน OCR ทั้งหมดนี้ คุณจะพบว่ามีหลายสิ่งที่สามารถเปลี่ยนแปลงชีวิตของทุกคนได้

ในบล็อกชุดนี้ ฉันจะพูดถึงวิธีการต่างๆ สำหรับ OCR ตั้งแต่วิธีพื้นฐานที่สุดไปจนถึงวิธีที่มีประสิทธิภาพสูงสุด ฉันจะพูดถึงแง่มุมต่างๆ และการใช้งานของ OCR และวิธีการนำไปใช้ ในตอนต้นของซีรีส์นี้ ฉันจะใช้ kNN สำหรับ OCR และจะก้าวไปข้างหน้ากับโมเดล Machine Learning ต่างๆ

ฉันหวังว่าคุณจะสนุกกับการเดินทางครั้งนี้ :)

เพื่อเริ่มต้นการเดินทางของคุณใน OCR โปรดเยี่ยมชมบล็อกถัดไปของฉัน ซึ่งฉันได้กล่าวถึง OCR พื้นฐานโดยใช้ kNN ใน OpenCV python