Распознавание удмуртских текстов

ABBYY FineReader 11 Professional Edition распознает документы на 188 языках на основе кириллицы, латиницы, греческого и армянского алфавитов, а также языки на основе иероглифического письма, искусственные языки и языки программирования, причём для 44 языков предусмотрена словарная поддержка и проверка орфографии.

Удмуртский языка есть в списке ABBYY, но словарная поддержка для него по умолчанию не предусмотрена. В настоящее время выходом может стать добавление нового пользовательского языка на основе языка "Удмуртский".

Добавление пользовательского языка

Чтобы качественно распознавать удмуртские тексты необходимо создать новый пользовательский язык:

«Сервис → Редактор языков → Пользовательские языки → Новый».

Откроется окно Свойство языка

Выбираем базовый язык — Удмурский. В имени нового языка вместо Копия (Удмуртский) пишем, например, Удмурт кыл.

Выбираем меню "Свойства".

Добавление словаря поддержки

В Свойствах языка в разделе Словарь вместо Нет маркируйем Пользовательский словарь

Кликнем его Cвойства.

В открывшемся окне Словарь для языка "Удмурт кыл" нажимаем Импорт и загружаем предварительно скачанный [отсюда] и распакованный файл словаря поддержки удмуртского языка. Загрузка словаря занимает не менее 5 минут.

Закроем окно словаря и нажимаем ОК в свойствах языка. Теперь Удмурт кыл появится в списке пользовательских языков.

При распознании коми текста выбираем Удмурт кыл из списка.

Дабы не пришлось создавать пользовательский язык каждый раз, сохраните пакет, в котором Вы создали польз. язык "Удмурт кыл". Теперь данный язык останется в этом пакете и автоматически появится в тех, которые будут создаваться позже.

Распознавание удмуртского текста

Качество распознавания досаточно высокое. Пример см. на изображении:

Ссылки

ABBYY FineReader 11 Professional Edition

Распознавание удмуртских текстов

Содержание

Добавление пользовательского языка

Добавление словаря поддержки

Распознавание удмуртского текста

Ссылки

Навигация

Распознавание удмуртских текстов

Добавление пользовательского языка

Добавление словаря поддержки

Распознавание удмуртского текста

Ссылки

Навигация

Поиск