Обновление: эта статья является частью серии. Ознакомьтесь с полной серией: Часть 1 и Часть 2

OCR, Оптическое распознавание символов - одна из самых горячих тем в наши дни. Он присутствует на картинке очень давно. Проще говоря, OCR обрабатывает изображение, PDF или любой другой файл и извлекает из него текстовую информацию. Людям очень легко распознать слово, которое они знают, но как насчет слова из другого языка, которого мы не знаем. То же самое и в случае с компьютерами, они ничего не знают об этих словах или символах. На картинке появляется машинное обучение. Мы можем тренировать нашу машину, как ребенка, показывая ему разные изображения. Разве это не здорово !!!.

Мы даже не можем представить себе все приложения OCR. Представьте, что человек без зрения направляет свой мобильный телефон на пакет с лекарством, а затем мобильный считывает ему всю важную информацию, такую ​​как название лекарства, срок его годности, его цена, а затем может быть ищу в Интернете рецепт на это лекарство. Машина, конвертирующая очень старую драгоценную книгу в PDF, чтобы весь мир мог наслаждаться этой книгой. И даже когда я посещаю ресторан в Китае и конвертирую меню, написанное с китайского на английский или хинди, чтобы я мог заказать что-нибудь поесть.

Если вы сядете и подумаете обо всех этих приложениях OCR, вы обнаружите, что многие из них могут изменить жизнь каждого.

В этой серии блогов я расскажу о различных методах распознавания текста. От самого простого до самого эффективного, я расскажу о различных аспектах и ​​приложениях OCR, а также о том, как его можно реализовать. В начале этой серии я буду использовать kNN для распознавания текста и перейду к различным моделям машинного обучения.

Надеюсь, вам понравится это путешествие :).

Чтобы начать свое путешествие в области распознавания текста, посетите мой следующий блог, в котором я рассмотрел основы распознавания текста с использованием kNN в OpenCV python.