ฉันได้พัฒนาแอพ iphone พร้อมคุณสมบัติการสแกน OCR ใช้ Tesseract api รับข้อความจากภาพที่ถ่าย แต่ตอนนี้ฉันต้องแยกแต่ละข้อความเกี่ยวกับชื่อ ที่อยู่ อีเมล หมายเลขโทรศัพท์ ฯลฯ เนื่องจากโครงสร้าง/รูปแบบนามบัตรไม่ได้เจาะจง จึงค่อนข้างจะคาดเดาได้ยาก
อย่างไรก็ตาม มีบางสิ่งที่ถือว่า 1) "@" ที่มีสตริงส่วนใหญ่จะเป็นรหัสอีเมล 2) ตัวเลขทั้งหมดที่มีเครื่องหมายปีกกาหรือเครื่องหมาย + ส่วนใหญ่จะเป็นหมายเลขโทรศัพท์.. แต่ก็ยังมีความเป็นไปได้อีกมากมาย