Я изучаю API Google Vision для распознавания текста. У нас есть множество форм, которые создаются и заполняются пользователями на компьютере. Как медицинские отчеты и регистрационные формы. Нам нужно обработать эти изображения и извлечь из них персонажа. Я пробовал Google Vision API, и он отлично работает в случае компьютерной формы, но те, которые заполняются вручную, создают проблемы. Like Если заполнить форму данными немного выше оси y, слова будут считаться предыдущей / следующей строкой. Как показано ниже, результат
Study Contact Name:
Test
ожидал
Study Contact Name: Test
Ссылка на код: https://cloud.google.com/vision/docs/detecting-text#vision-text-detection-java
Есть ли способ записать это в одну строку или понять, является ли это частью этой строки?
Любой другой API, который может помочь в этом сценарии?