Logiss.ru

Ваша компьютерная помощь
0 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Программы для распознавания текста

Распознавание документов на частном примере — обзор доступных платных и бесплатных решений

Всем привет! Типичная ситуация сложилась в компании, в которой я работаю. В бухгалтерии вечный аврал, людей не хватает, все занимаются чем-то безусловно важным, но по сути бесполезным. Такое положение дел не устраивало руководство.

Если подробнее, то проблема в том, что ресурсов бухгалтерии не хватает на текущие задачи, а выделять ставки под новых людей никто не хочет. Поэтому сверху приняли решение порезать некоторые задачи и освободить время бухгалтеров для более полезных дел. Под нож попала такая работа как сканирование и распознавание документов, копирование, внесение их в прочие рутинные радости.

Так передо мной, как аналитиком, встала задача: найти решение для распознавания документа типичного для моей компании — счет-фактуры — структурировать его в имеющиеся хранилища, а также в 1С. Решение, которое будет удобным, понятным, и не влетит компании в копеечку.

Опыт получился занятным, решил поделиться тем, что удалось собрать. Возможно я что-то упустил, поэтому велком в комментарии, если есть, что добавить.

Программы сканирования документов, программы распознавания документов — не новое решение на рынке, его можно найти как в бесплатных программах, так и встроенных в системы.

Начал я с бесплатных программ:

  • glmageReader
  • Paperwork
  • VietOCR
  • CuneiForm.
  • В таких программах как VietOCR, Paperwork, glmageReader можно настроить хранение отсканированных документов в определенные папки, Paperwork умеет их даже сортировать, согласно меткам.
  • В основном они хорошо справляются с текстом, а там, где текст распознан некорректно, в некоторых программах можно вручную изменить содержимое, прежде чем экспортировать файл.

Однако есть и проблемы:

  • Есть разница между работой с pdf сканами и png. Не всегда удается удачно конвертировать png в pdf.
  • Большинство таких программ сложно справляются с распознаванием документов табличного вида, даже самого простого формата. В результате мы получаем распознанный текст без размеченных полей.

image

Технология сработала достаточно хорошо, Учитывая, что программы бесплатные, описанные выше проблемы допустимы. Однако, я искал более упорядоченного решения.

Затем я исследовал распознавание в ABBYY FineReader 15 Corporate

За 7-дневный срок триала я изучил и эту платформу.

  • Когда я открыл png файл, он отлично был считан и в результате удачно конвертирован в pdf без потери качества изображения и текста.
  • Программа отлично знает, как отсканировать документ для редактирования текста. Причем в режиме редактирования файла формата png текст удается отредактировать без проблем, но иногда слетает разметка.
  • Однако то же самое я не могу сказать про редактирование файла-скана pdf. При попытке редактирования летели слои.
  • Табличный вид распознается качественно, вся структура сохраняется, меня это порадовало.
  • OCR редактор хорошо распознал мой сформированный pdf счет-фактуры. Где-то пару символов требовалось поправить вручную.

Я стал искать альтернативу. Как освободить руки сотрудника, получить качественное распознавание документов и не переживать за сохранность и структуру данных.

И тут я решил получше разглядеть ELMA RPA, которую я уже изучал ранее.

Вендор предлагает перекинуть значительную часть работы по экспорту данных в ERP с плеч бухгалтеров на роботов. По сути, именно это решает поставленную передо мной задачу. Чтобы познакомиться с распознаванием в этой системе, я взял у вендора триальную версию системы.

Здесь я обнаружил, что распознавание не преследует цели конвертировать полученные данные в новый документ-файл.

Здесь главная цель — распознавание реквизитов документа и их передача в другие системы/сайты/приложения. Кроме того, роботы складывают всю информацию куда надо: автоматически находят нужные папки и сохраняют в необходимых форматах.

Какие виды распознавания в системе я посмотрел:

Распознавание по шаблону

Нам предлагается на основании шаблона документа распознать подгружаемый документ. Насколько мне известно, этот вид распознавания бесплатный, внутрь зашит движок Tesseract.

  • Этот вид распознавания работает именно со сканами формата jpg и png, pdf он пока не рассматривает. Но продукт еще молодой, думаю, все впереди.
  • Этот вид распознавания входит в бесплатную версию Community Edition
  • Удобно размечен текст по блокам, которые можно сопоставить, согласно переменным, которые мы создали в контексте робота. Таким образом вручную настроить, что именно тянем в распознавание.
  • Нашу счет-фактуру он распознал 50/50, некоторые слова подменил как посчитал нужным. 🙂

Однако, вендор на данный кейс сообщил, что этот вид распознавания адаптирован под простые документы, с текстовой структурой или с легкими формами. И посоветовал для распознавания счета-фактуры использовать другой вид распознавания — intellect lab.

Процесс тот же, загружаем шаблон и по нему распознаем. Но здесь шаблон отправляется на облачный сервер.

От сервера получаем ответ (распознает такой тип документа или нет), и если распознается, то передается структура шаблона (переменные для маппинга), для сопоставления переменных, которые необходимо будет записать в RPA процессе.

В процессе воспроизведения мы отправляем уже документ, который хотели бы распознать и получаем ответ от iLab сервера о распознавании.

Что отметил по поводу этого распознавания:

  • Здесь уже распознавание работает как программа сканирования документов pdf, и при этом работает и с форматами jpg и png.
  • Качество документа не влияет на эффективность распознавания. Даже документы с плохим качеством распознаются корректно.
  • Счет-фактура распозналась полностью и без подмен переменных.
  • Робот сумел получить скан с почты, распознать его и создать его экземпляр в 1С. То есть автоматически сохранил файл там, где мы ему задали, что, естественно, крайне удобно.
  • Входит в бесплатную Community Edition в виде распознавания документа в облаке. Подходит, если используем стандартные типы (СФ, УПД, АВР и др.), и, например до 100 документов в месяц или до 500 в год. (Стоит заметить, что считаем не в страницах, а в документах непосредственно.)

Соответственно, эти же данные робот записывает в 1С, создавая там новый документ:

Что удалось выяснить по ценам: Если мы, например, хотим работать масштабно именно с ilab распознаванием, то за наши 10 000 документов придется выложить:

Программы для распознавания текста

В этой статье мы собрали 8 лучших программ распознавания текста с изображений и отсканированных документов. Они с легкостью переведут pdf, jpg, png или «бумажный файл» в редактируемый формат для Word и прочих офисных приложений.

Общие сведения:

Функции сканирования распознавания:

Дополнительные возможности:

Программа ABBYY FineReader – признанный флагман отрасли и лидер по количеству и качеству задействованных технологий оптического распознавания, сжатия и перевода. Приложение работает со сканером, поддерживает формат изображений jpg, jpeg, png, gif, bmp, переводит pdf в Word, Excell и даже упаковывает свежие сканы в редактируемую ПДФ-ку, HTML страницу. У него всего два недостатка – это стоимость и системные требования. В остальном, равных Файн Ридеру просто нет.

Преимущества продукта ABBYY FineReader:

  • Работа с большим количеством разнообразных источников текста;
  • Практически неограниченное количество языков распознавания (больше 170);
  • Встроенная проверка правописания;
  • Способность сжимать оригинальные файлы изображений без видимой потери качества;
  • Поддерживается распознавание многостраничных документов;
  • В пробной версии полностью функциональна.

OCR CuneiForm, пожалуй, лучшая бесплатная программа – аналог FineReader. Она менее требовательна, менее сложна, но и не столь развита. Это простая, удобная утилита захвата текста с интуитивно понятным интерфейсом и приятным внешним видом. Умеет сканировать документ в Microsoft Word или другое приложение из офисного пакета, обрабатывать сразу несколько файлов форматов jpeg, tiff и т.д., проверять редактируемый текст на ошибки. Лучшего бесплатного решения для дома просто нет.

Особенности OCR CuneiForm:

  • Работает как программа сканирования и распознавания текста (в любом из режимов);
  • Хорошая реализация оптического распознавания символов, низкий процент брака;
  • Программа поддерживает небольшое количество языков (около 20), включая русский;
  • Текст сразу готов для последующего редактирования, ведь передается в офисное приложение;
  • Отлично «отсеивает» текст на изображении от пятен, образовавшихся в процессе ксерокопирования.

Readiris Pro – чрезвычайно мощная, но и недешевая программа распознавания текста со сканера, документа pdf, djvu, tiff, jpeg. Единственная среди аналогов включает интеллектуальную систему распознавания отсканированного бумажного документа (рукописного текста), причем, выполняет подобную работу на качественно высоком уровне. Конечно, если вы не собираетесь «скармливать» приложению изображение текста с назначения лечащего врача. Каллиграфически верный почерк воспринимается хорошо, украинский и русский поддерживаются.

Характеристики приложения Readiris:

  • Хорошее качество распознавания на 100+ языках, включая таблицы и рукописные документы;
  • Возможность извлечь текст с картинки в разных форматах, из электронной книги djvu;
  • Полученный текст можно экспортировать не только в Microsoft Office Word, Excel, но и PDF, OpenOffice, XPS;
  • Инструмент компрессии сжимает изображения со сканера в 200 раз без потерь;
  • Программа платная, но простая в использовании – все действия выполняют в 2 клика.

Freemore OCR, как и другие бесплатные программы распознавания текста, не блещет количеством функций, но и не требует от вас приобретения дорогостоящей подписки. Согласно заявленным характеристикам, технология Side-by-Side помогает приложению отлично отделять картинки от символов, чтобы не захватывать лишние блоки. Утилита сохраняет распознанные документы текстовом формате doc, txt или pdf. Разработчики особо акцентируют внимание на отсутствии необходимости установки редакторов ПДФ от Adobe, мол, все нужные функции уже включены.

Особенности Freemore OCR:

  • Позволяет распознать документ, pdf, изображение почти всех поддерживаемых форматов;
  • Отсутствует полноценный захват русского текста, только латиница;
  • Меню программы простое и понятное, для работы не нужны знания английского;
  • Заявлены полезные «бизнес» функции – шифрование пдф, добавление водяного знака;
  • Программное обеспечение часто обновляется с официального сайта.

ABBYY Screenshot Reader — программа распознавания текста со скриншотов! Работает по следующему принципу: вы нажимаете комбинацию клавиш, захватываете необходимую область экрана, ждете несколько секунд и сохраняете полученный результат в виде текста из окна утилиты в любой редактор через буфер обмена. Интерфейса обмена данными здесь нет, зато есть переводчик, словарь и другие приятные фишки от ABBYY.

Преимущества и недостатки Screenshot Reader:

  • Использует минимум ресурсов, срабатывает моментально;
  • Не требует запуска с рабочего стола, если вы выполните необходимые настройки горячих клавиш;
  • Может распознать текст с любого открытого на вашем компьютере файла или защищенной веб-страницы;
  • Интегрированы функции перевода и проверки орфографии;
  • Здесь не получится открыть файл – только захват области экрана в ручном режиме;
  • Пакетная обработка также отсутствует, устройство считывания не подключается;
  • Чтобы сохранить полученные данные в редактор, нужно скопировать их вручную.

Мы бы не рекомендовали использовать Adobe Acrobat как полноценный сервис распознания текста, но если пакет уже установлен на ПК, а вам нужно позарез сейчас выполнить работу, он может достойно справиться с поставленной задачей. О том, как активировать функцию, читайте в онлайн-справке Adobe. Справится с ней легко, но вы должны понимать, что на выходе получите не полноценный текстовый документ, а редактируемый pdf, содержимое которого можно импортировать в Блокнот и Word.

Характеристики Adobe Acrobat Pro DC:

  • Представляет собой пакет для создания и редактирования pdf;
  • Включает функцию импорта с внешних устройств;
  • Предлагает большое количество профильных возможностей, например, загрузку файлов в облако Creative Cloud (аналог Google Диск для продуктов Adobe);
  • Утилита полностью совместима со всеми новыми версиями ОС Windows.

Scanitto Pro — программа для распознания текста с ксерокопии. Представляет собой альтернативный интерфейс сканера с опцией захвата текста для импорта в стандартный форматы редакторов. Позволяет выделять, разворачивать элементы на странице, помечать фрагменты, которые требуется распознать.

Особенности Scanitto Pro:

  • Распознание по любому выбранному языку из 7 интегрированных (включая русский);
  • Множество форматов экспорта готового материала;
  • Удобный интерфейс работы с подключаемыми устройствами;
  • Высокая скорость ответов на запросы, низкие требования к ПК;
  • Недорогая лицензия.

RiDoc, возможно, не самый функциональный продукт из представленных, но он явно лучше любого free online ocr (онлайн сервиса бесплатного распознания). У приложения много собственных интересных «фишек» — каталогизатор документов, инструментарий наложения водяных знаков, собственный виртуальный принтер, сохранение пресетов для качественного распознавания в пакетном режиме. Но в некоторых случаях возможностей РиДока явно мало.

Полезные функции RiDoc:

  • Собственный интерфейс обмена с внешним считывающим устройством;
  • Наложение водяных знаков, цифровой подписи, создание ключа шифрования;
  • Создание одинаковых настроек распознания для неограниченного количества страниц;
  • Экспорт результата в MS Word, bmp, jpeg, tiff, png и, конечно, pdf.

По результатам нашего небольшого исследования, на первое место рейтинга заслуженно претендует ABBYY FineReader. Он стоит недешево, но умеет распознавать тексты лучше конкурентов, поддерживает больше языков и все необходимые форматы – pdf, doc и распространенные расширения графических файлов.

Если сканирование, экспорт и пакетный режим вам не нужны, обратите внимание на ABBYY Screenshot Reader. Он захватит любую область экрана и переведет её в обычный текст за считаные секунды. Как и «старший брат» продукт снабжен словарем и переводчиком, но стоит в разы дешевле.

CuneiForm, бесспорно, работает лучше, чем любые другие бесплатные сервисы распознавания текста. Продукт функционально приближен к утилитам от ABBYY, но сделан немного проще. Это хороший выбор для дома.

Readiris Pro и Freemore OCR можно назвать альтернативой FineReader и CuneiForm для западного рынка. Проводя параллели, вы поймете, насколько приложения принципиально похожи. Правда, у Readiris есть большой козырь в рукаве – крутая система чтения рукописного текста!

Acrobat, как мы уже говорили, предназначен для других целей, но интегрированная функция распознавания неплохо работает, хоть и менее удобна, чем у других решений из нашей подборки.

Scanitto Pro и RiDoc сделают из документа, изображения или листа бумаги с символами читаемый текст довольно быстро. Утилиты легкие, не требовательные, но откровенно сыроваты в плане возможностей.

7 инструментов для распознавания текста онлайн и офлайн

7 инструментов для распознавания текста онлайн и офлайн

Этот сервис от компании Microsoft превращает камеру смартфона или ПК в бесплатный сканер документов. С помощью Office Lens вы можете распознать текст на любом физическом носителе и сохранить его в одном из «офисных» форматов или в PDF. Итоговые текстовые файлы доступны для редактирования в Word, OneNote и других сервисах Microsoft, интегрированных с Office Lens. К сожалению, с русским языком программа справляется не так хорошо, как с английским.

В Telegram-канале «Лайфхакер» только лучшие тексты о технологиях, отношениях, спорте, кино и многом другом. Подписывайтесь!

В нашем Pinterest только лучшие тексты об отношениях, спорте, кино, здоровье и многом другом. Подписывайтесь!

2. Adobe Scan

  • Платформы: Android, iOS.
  • Распознаёт: снимки камеры.
  • Сохраняет: PDF.

Adobe Scan тоже использует камеру смартфона, чтобы сканировать бумажные документы, но сохраняет их копии только в формате PDF. Приложение полностью бесплатно. Результаты удобно экспортировать в кросс‑платформенный сервис Adobe Acrobat, который позволяет редактировать PDF‑файлы: выделять, подчёркивать и зачёркивать слова, выполнять поиск по тексту и добавлять комментарии.

3. FineReader

  • Платформы: веб, Android, iOS, Windows.
  • Распознаёт: JPG, TIF, BMP, PNG, PDF, снимки камеры.
  • Сохраняет: DOC, DOCX, XLS, XLSX, ODT, TXT, RTF, PDF, PDF/A, PPTX, EPUB, FB2.

FineReader славится высокой точностью распознавания. Увы, бесплатные возможности инструмента ограниченны: после регистрации вам позволят отсканировать всего 10 страниц. Зато каждый месяц будут начислять ещё по пять страниц в качестве бонуса. Подписка стоимостью 129 евро позволяет сканировать до 5 000 страниц в год, а также открывает доступ к десктопному редактору PDF‑файлов.

4. Online OCR

  • Платформы: веб.
  • Распознаёт: JPG, GIF, TIFF, BMP, PNG, PCX, PDF.
  • Сохраняет: TXT, DOC, DOCX, XLSX, PDF.

Веб‑сервис для распознавания текстов и таблиц. Без регистрации Online OCR позволяет конвертировать до 15 документов в час — бесплатно. Создав аккаунт, вы сможете отсканировать 50 страниц без ограничений по времени и разблокируете все выходные форматы. За каждую дополнительную страницу сервис просит от 0,8 цента: чем больше покупаете, тем ниже стоимость.

5. img2txt

  • Платформы: веб.
  • Распознаёт: JPEG, PNG, PDF.
  • Сохраняет: PDF, TXT, DOCX, ODF.

Бесплатный онлайн‑конвертер, существующий за счёт рекламы. img2txt быстро обрабатывает файлы, но точность распознавания не всегда можно назвать удовлетворительной. Сервис допускает меньше ошибок, если текст на загруженных снимках написан на одном языке, расположен горизонтально и не прерывается картинками.

6. Microsoft OneNote

  • Платформы: Windows, macOS.
  • Распознаёт: популярные форматы изображений.
  • Сохраняет: DOC, PDF.

В настольной версии популярного блокнота OneNote тоже есть функция распознавания текста, которая работает с загруженными в заметки изображениями. Если кликнуть правой кнопкой мыши по снимку документа и выбрать в появившемся меню «Копировать текст из рисунка», то всё текстовое содержимое окажется в буфере обмена. Программа доступна бесплатно.

7. Readiris 17

  • Платформы: Windows, macOS.
  • Распознаёт: JPEG, PNG, PDF и другие.
  • Сохраняет: PDF, TXT, PPTX, DOCX, XLSX и другие.

Мощная профессиональная программа для работы с PDF и распознавания текста. С высокой точностью конвертирует документы на разных языках, включая русский. Но и стоит Readiris 17 соответственно — от 49 до 199 евро в зависимости от количества функций. Вы можете установить пробную версию, которая будет работать бесплатно 10 дней. Для этого нужно зарегистрироваться на сайте Readiris, скачать программу на компьютер и ввести в ней данные от своей учётной записи.

Как перевести изображение в текст: 5 сервисов для распознавания фото

Чтобы не перепечатывать текст с бумаги, я использую специальные сервисы — они сканируют информацию и извлекают содержимое в текстовый редактор.

Сервисы неидеальны: какие-то слова не распознают вообще, какие-то определяют как набор букв с пробелами. Но отредактировать результат все равно быстрее, чем перепечатывать все с нуля.

Я сравнил работу 5 таких программ на двух образцах текста. Текст взял одинаковый, только в первом случае он четко выделяется на отсканированном документе, а во втором — еле виден на фотографии.

FineReader

Где работает: в онлайне, Windows, Android, iOS
Сколько стоит: от 3190 Р в год
Демодоступ: бесплатно распознает 10 страниц, после — 5 страниц в месяц

Что умеет. Бесплатная версия даст загрузить файлы в онлайн-версию или распознать фото в мобильном приложении. Умеет выгружать текст в «Блокнот», Word, Excel и в форматы электронных книг: FB2 или ePUB. Результаты будут доступны в течение двух недель.

За деньги сервис сможет распознавать PDF-файлы — от 2000 страниц в год.

Сколько слов определил. Фотографию плохого качества не смог распознать вообще, трижды выдал ошибку. Скан хорошего качества распознал полностью, включая знаки препинания.

Как победить выгорание

Office Lens

Где работает: Android, iOS. С 2021 года официального приложения на Windows больше нет, Microsoft поддерживает только мобильные решения
Сколько стоит: бесплатно

Что умеет. Сервис превращает камеру смартфона в сканер. Можно преобразовать изображения в файлы DOC и PPT, сохранить их в OneNote или конвертировать в PDF, обрезать снимки, увеличить или уменьшить их яркость. Еще сервис частично распознает рукописный текст.

Формы для загрузки файлов в приложении нет. Но можно сначала сбросить картинку в телефон, а после загрузить ее в Lens из галереи.

Сколько слов определил. Со сканом хорошего качества Lens справился практически идеально — один раз не определил заглавную букву и вместо знака «№» написал «NQ».

С фотографией плохого качества сервис справился хуже: превратил два элемента списка в один, часть слов записал заглавными буквами, добавил дефисы. Результат можно редактировать, но придется потратить на это время.

CamScanner

Что умеет. Можно сканировать текст с помощью камеры или загружать готовые картинки. Приложение повысит резкость и яркость у снимков плохого качества. Есть автоматическое выравнивание — итоговый файл будет выглядеть так, будто вы не фотографировали, а положили документ в сканер.

Без регистрации дадут распознать два текста, после — три в месяц. За деньги — тысячу в месяц, плюс снимки будут храниться в облачном пространстве сервиса. Бесплатно доступно только 200 Мб.

Сколько слов определил. Файл в хорошем качестве CamScanner распознал без ошибок. Плохую фотографию придется редактировать, но немного: не расшифровал знак «№», добавил пару лишних букв и поставил лишнюю точку в конце.

Online OCR

Где работает: в онлайне
Сколько стоит: бесплатно

Что умеет. Сервис распознает текст из PDF-сканов и изображений — для этого даже не нужно создавать аккаунт. После регистрации можно распознавать PDF-файлы объемом больше 15 страниц и изображения в ZIP-архивах.

Сколько слов определил. Хорошее качество распознал почти без ошибок — лишний пробел в начале и ошибка в знаке вопроса. В снимке плохого качества сервис сделал четыре ошибки, из них две критические — когда слово совсем непонятно. Но в остальном все отлично, поэтому редактировать придется недолго.

Go4convert

Где работает: в онлайне
Сколько стоит: бесплатно

Что умеет. Распознает текст со сканов и картинок, включая редкий формат BMP. Результат предлагает скачать только в «Блокнот» в формате TXT.

Сколько слов определил. Файл хорошего качества распознал с одной ошибкой — превратил знак вопроса в английскую N. Из файла с плохим качеством практически без ошибок вытащил только список. Четыре слова превратил в беспорядочный набор букв, а фон — в набор символов.

Читайте так же:
Расшифровка сигналов BIOS
Ссылка на основную публикацию
Adblock
detector