ตัวแยกวิเคราะห์นามบัตร จะดึงข้อมูลที่เกี่ยวข้องจากข้อความที่รู้จักนามบัตรได้อย่างไร

ฉันได้พัฒนาแอพ iphone พร้อมคุณสมบัติการสแกน OCR ใช้ Tesseract api รับข้อความจากภาพที่ถ่าย แต่ตอนนี้ฉันต้องแยกแต่ละข้อความเกี่ยวกับชื่อ ที่อยู่ อีเมล หมายเลขโทรศัพท์ ฯลฯ เนื่องจากโครงสร้าง/รูปแบบนามบัตรไม่ได้เจาะจง จึงค่อนข้างจะคาดเดาได้ยาก

อย่างไรก็ตาม มีบางสิ่งที่ถือว่า 1) "@" ที่มีสตริงส่วนใหญ่จะเป็นรหัสอีเมล 2) ตัวเลขทั้งหมดที่มีเครื่องหมายปีกกาหรือเครื่องหมาย + ส่วนใหญ่จะเป็นหมายเลขโทรศัพท์.. แต่ก็ยังมีความเป็นไปได้อีกมากมาย


person Matrix    schedule 06.04.2012    source แหล่งที่มา
comment
ใช้ g8Tesseract รับข้อความจากรูปภาพ แต่จะแยกชื่อ ที่อยู่ และชื่อแต่ละข้อความได้อย่างไร พวกเขาปฏิบัติตามกระบวนการใดสำหรับ camcard , bizcamcard หรือแอปอื่น ๆ ที่มีอยู่ใน appstore ฉันได้ลอง R&D มากแล้วแต่ก็ไม่มีประโยชน์   -  person Sujatha Girijala    schedule 04.01.2017


คำตอบ (2)


คุณจะต้องได้รับความช่วยเหลือจาก NSLInguisticTagger class .. นี่เป็นทางออกที่ดีที่สุดของคุณ ไม่เช่นนั้นคุณจะต้องสร้างตรรกะที่คล้ายกันสำหรับแต่ละส่วนตามที่คุณระบุไว้ข้างต้น

person Ankit Srivastava    schedule 06.04.2012
comment
+1 สำหรับชั้นเรียนนี้ วันนี้ฉันได้เรียนรู้สิ่งใหม่ด้วย :) แย่สำหรับผู้ถาม มีให้บริการตั้งแต่ 5.0 เท่านั้น - person MrTJ; 06.04.2012
comment
ตกลง ดูเหมือนว่าฉันต้องเขียนตรรกะของตัวเองเพื่อดึงข้อมูลจากข้อความที่รู้จักในนามบัตร แต่มีข้อกำหนดใดๆ เกี่ยวกับรูปแบบนามบัตร (ประเภท RFC...) หรือไม่ - person Matrix; 06.04.2012
comment
ฉันไม่ทราบรูปแบบนามบัตรใด ๆ แต่สิ่งหนึ่งที่ฉันสามารถแนะนำให้คุณได้คือลองและรวมเครื่องสแกน QRCode ไว้ในแอปของคุณเพราะทุกวันนี้การ์ดส่วนใหญ่มี QRCodes อยู่ - person Ankit Srivastava; 06.04.2012
comment
@Matrix ด้วยความอยากรู้ .. คุณทำงานในบริษัทไหนในอินเดีย ... ? - person Ankit Srivastava; 06.04.2012
comment
@Matrix ฉันก็ทำงานเดียวกันเช่นกัน ฉันจะค้นหาชื่อ ที่อยู่ และการกำหนดได้อย่างไร มีวิธีแก้ไขปัญหานี้หรือไม่? - person Sujatha Girijala; 04.01.2017

คุณสามารถตรวจสอบตรรกะที่เราใช้ในไลบรารี Javascript BCR นี้ได้โดยอิงจาก tesseract (การพอร์ตใน js)

https://github.com/syneo-tools-gmbh/Javascript-BCR-Library

person Renzo Sala    schedule 28.02.2019