|
Полный спектр технологий распознавания
- Печатного текста (OCR);
- Рукопечатного текста (ICR);
- Меток (OMR);
- Штрихкодов (OBR);
- Выбо режима распознавания для настройки скорости и точности обработки;
- Полнотекстовое распознавание;
- Зональное распознавание для распознавания специфических данных, расположенных в той или иной области на документе.
|
|
Инструменты обработки PDF
- Конвертация в PDF;
- Импорт и обработка PDF;
- Экспорт в PDF;
- MRC-СЖАТИЕ PDF (PDF/A);
- Отладка качества и скорости обработки документов.
|
|
Искусственный интеллект и машинное обучение для точного воссоздания документов и высокой точности распознавания
- Алгоритмы на базе искусственного интеллекта, машинного обучения и адаптивной технологии распознавания документов Adaptive Document Recognition Technology (ADRT);
- Разбивка документа на отдельные страницы на этапе анализа и проверка оформления каждой из них - где расположен текст, изображения, штрихкоды и элементы таблиц;
- Проверка логической структуры документа;
- Определение роли текстовых элементов — например, колонтитулы определяются как колонтитулы, а не как фрагменты отдельных страниц;
- Сохранение и использование информации о тексте, изображениях и элементах форматирования на этапе итогового воссоздания документа.
|
|
Параллельная обработка документа с помощью многоядерных процессоров
- Конвертация многостраничных документов с большим числом страниц;
- Конвертация большого числа одностраничных документов.
|
|
Поддержка облака и виртуальной среды
- Новый тип лицензирования Cloud-ready, которая предназначена для приложений, установленных в облачной среде, работающих на платформах Microsoft Azure и Amazon EC2, а также может быть использована как на рабочих станциях, так и на виртуальных машинах, при условии наличия соединения с интернетом;
- Использование лицензии Cloud-ready множеством пользователей одновременно;
- Использование лицензии одновременно несколькими облачными инстансами или рабочими станциями, подключенными через интернет.
|
|
Предобработка изображений
- Предварительная обработка изображений для улучшения качества документа и оптимизации процесса распознавания данных;
- Эффективная обработка и распознавание изображения самого низкого качества и документов, сфотографированных на смартфон в максимально высоком качестве;
- Базовые функций обработки изображений, таких как:изменение масштаба, обрезка изображения, отправка изображения, создание изображения для предпросмотра, поворот изображения, выпрямление текстовой строки, создание зеркального отражения, удаление шумов, повышение контрастности;
- Продвинутые функции обработки изображений, таких как: технология Camera-OCR,предварительная обработка документов с печатями и рукописными комментариями, автоматическое разделение двойных страниц, автоматическое определение ориентации страниц, автоматическое выравнивание изображений (до +/- 20 градусов), удаление пятен, очистка изображений в отдельных блоках, фильтрация текстур и адаптивная бинаризация, редактирование текста и цвета фона, распознавание информации из полей с разными границами и рамками;
- Интеллектуальная технология, которая позволяет определять фотографии сделанные на цифровую камеру, и активировать алгоритмы обработки таких изображений, чтобы устранять искажения, размытость, искривление текстовых строк, отсутствие информации о разрешении или ошибки, возникшие из-за недостаточного освещения.
|
|
Профили распознавания для быстрого внедрения
- Выбор профиля в ходе интеграции OCR SDK для конкретной задачи —оптимальные значения параметров выставятся автоматически;
- Выбор профилей для оптимизации качества распознавания или для оптимизации скорости обработки;
- Профили преобразования документов для архивного хранения;
- Профили преобразования документов для повторного использования контента;
- Профили распознавания опорного текста для определения полей и классификации документов;
- Профиля распознавания полей;
- Профили для создания сильно сжатых PDF в виде изображений;
- Профили для распознавания визитных карточек (BCR).
|
|
Решения для обработки визитных карточек
- Распознавание визитных карточек от предварительной обработки до обеспечения доступа к распознанной информации;
- Сохранение распознанных данных в формате vCard, который используется для передачи контактных данных по электронной почте;
- Авторазделение визитных карточек, отсканированных на одной странице;
- Распознавание визитных карточек на 27 языках.
|
|
Возможность классификации документов с помощью технологий машинного обучения и обработки естественного языка
- Возможность создания приложения для автоматического распределения документов по предопределенным категориям и классам;
- Наличие технологии машинного обучения и обработки естественного языка, которые позволяют выявить малейшие отличия между документами разных категорий и настроить гибкие процессы классификации;
- Наличие нового интеллектуального классификатора по внешнему виду (Image Classifier), который позволяет собирать и обрабатывать визуальную информацию об изображениях документов и быстро классифицировать их;
- Наличие текстового классификатора (Text Classifier), который работает с текстовой информацией на документах, в том числа анализируя смысл текста, что позволяет повысить точность классификации;
- Возможность использования классификаторов по внешнему виду и текстового для использования отдельно и совместно.
|
|
Наличие визуальных компонентов на базе ActiveX
- Наличие компонентов, которые позволяют создать интерфейс пользователя для просмотра и предварительной обработки изображений, а также редактирования и верификации распознанного текста и отслеживания процесса;
- Наличие инструмента Image Viewer, который отображает полное изображение страницы документа и позволяет её просматривать и редактировать (изменять поворот, обрезать и разделять изображения; редактировать области распознавания или выбирать типы блоков — текст, таблица или штрихкод; кнопки панели инструментов можно отображать или скрывать посредством кода, можно создать пользовательские кнопки);
- Наличие инструмента ZoomViewer для просмотра изображения в мельчайших деталях, корректировки расположения рассматриваемой области или сравнения неуверенно распознанных символов с увеличенным исходным изображением;
- Наличие инструмента Document Viewer для просмотра структуры документа в целом и результата обработки;
- Наличие инструмента Text Editor для подчеркивания неуверенно распознанных символов и форматирования текста;
- Возможность контроля размеров текстового окна, доступных кнопок и наборов действий пользователя;
- Наличие инструмента Text Validator для проверки неуверенно распознанных символов и правописания;
- Возможность проверки орфографии и просмотра проверенного текста в увеличенном масштабе.
|
|
Наличие библиотек примеров кода
- Возможность ознакомления с библиотекой примеров кода в файле справки Help, которая поставляется вместе с продуктом;
- Наличие набора примеров, демонстрирующих наиболее типичные сценарии использования SDK;
- Наличие разделов в библиотеке, которые содержат один или несколько примеров кода, сопровождаемых пошаговой инструкцией по решению той или иной задачи;
- Наличие примеров кода для Windows;
- Наличие примеров кода для Linux;
- Наличие примеров кода для MAC OS.
|
Наличие подробной документации SDK и поддержка
- Возможность интеграции распознавания текста с приложениями даже новичкам.
|