OCR, Как и зачем использовать
VisionBot, FineReader и data2data
Как ты уже знаешь, скринридер может прочитать любую информацию, которая отдаёт ему операционная система, включая текст. Но что, если тебе нужно прочитать текст на картинке? Например, тебе необходимо отсканировать бумажный документ или книгу или тебе прислал отсканированную копию твой преподаватель/коллега. К сожалению, скринридеры напрямую не умеет читать текст на картинках.
Для этого существует технология оптического распознавания символов (OCR). Она позволяет превратить картинку с текстом, например, изображение страницы, в обычный текст. Благодаря этой технологии можно читать как небольшие картинки, такие как скриншоты или бумажные документы, так и целые книги.
Для разных задач удобно применять разные сервисы и программы.
VisionBot
Сервис для распознавания небольших отдельных картинок, разработанный Алексеем Самойловым. Сервис умеет не только распознавать текст на картинке, но и описывать объекты: людей, животных и другие. Отлично подходит для чтения текста на отдельных картинках: скриншотах, отсканированных документах. Можно загрузить интересующую картинку на официальном сайте: https://visionbot.ru
На этом же сайте можно найти другие, более удобные варианты использования сервиса: дополнение CloudVision для NVDA, скрипты для JAWS, ботов для социальной сети ВКонтакте и мессенджера Telegram.
Немного подробнее остановимся на использовании дополнения CloudVision для NVDA. После установки дополнения и перезагрузки скринридера, ты можешь, находясь на какой-либо картинке, нажать сочетание клавиш CTRL+NVDA+I. Через некоторое время NVDA озвучит описание картинки. Нажми эту комбинацию дважды быстро, чтобы просмотреть описание картинки (включая текст) в отдельном окне, в котором ты можешь перемещаться по тексту, выделять и копировать его.
ABBYY FineReader
Профессиональная программа, с помощью которой можно распознавать целые книги. Программа умеет переводить сканированные PDF-документы в файлы в формате Microsoft Word, HTML, в простые текстовые документы и в множество других форматов. Умеет распознавать текст на многих языках. К минусам программы можно отнести тот факт, что она платная, а также имеет большой размер и потребляет большое количества ресурсов. Если у тебя не очень мощный компьютер, система может серьёзно тормозить, пока выполняется распознавание.
Data2Data
Бесплатный онлайн-сервис, разработанный командой «Тифло Хост» специально для незрячих. Как и FineReader, он тоже предназначен для распознавания больших текстов. Сервис умеет переводить сканированные тексты в форматах PDF и DJVU в простой текст (TXT) или в PDF с читаемым текстовым слоем.
Воспользоваться сервисом можно здесь: https://data2data.ru/ocr/
Сложно сказать, какой инструмент даёт лучший результат. Практика показывает, что с некоторыми текстами лучше справляется FineReader, а с другими — сервис Data2Data. Рекомендуется самостоятельно попробовать все решения и выбрать, какой сервис лучше подходит для твоих задач.
Задание к уроку
Выбери правильный ответ из предложенных вариантов.
Если у тебя возникли какие-то сложности при прохождении этой темы и хотелось бы получить поддержку со стороны кураторов курса, ты можешь пройти простую регистрацию, и в ближайшее время с тобой свяжется куратор курса по цифровым навыкам.
1. Какой почтовый сервис имеет лучшую адаптацию для незрячих пользователей?
Как ты оцениваешь, ты усвоил урок?
Нужна помощь?
Обратись за ней к нашей команде кураторов! Мы поможем в онлайн-формате или подключим волонтера в твоем городе.