Saya sedang menjelajahi Google Vision API untuk OCR. Kami memiliki banyak formulir yang dibuat dan diisi oleh komputer oleh pengguna. Seperti Laporan Medis dan Formulir Pendaftaran. Kita perlu memproses gambar-gambar itu dan mengeluarkan karakter darinya. Saya sudah mencoba Google Vision API dan berfungsi dengan baik jika formulir dibuat oleh komputer, tetapi formulir yang diisi dengan tangan menimbulkan masalah. Seperti Jika mengisi formulir dengan data sedikit di atas sumbu y maka kata-katanya dianggap sebagai baris sebelumnya/berikutnya. Seperti di bawah ini adalah outputnya
Study Contact Name:
Test
mengharapkan
Study Contact Name: Test
Referensi kode: https://cloud.google.com/vision/docs/detecting-text#vision-text-detection-java
Apakah ada cara untuk menempatkan ini dalam satu baris, atau memahami apakah itu bagian dari baris itu?
Adakah API lain yang dapat membantu dalam skenario ini?