Распознавание удмуртских текстов: различия между версиями

Материал из Wiki FU-Lab
Перейти к навигации Перейти к поиску
Строка 31: Строка 31:
==Добавление словаря поддержки==
==Добавление словаря поддержки==


В ''"Сервис → Редактор языков → Пользовательские языки"'' отмечаем ''"Удмурт кыл"'' (см. выше) и выбираем меню "''Свойства''".
В '''Сервис → Редактор языков → Пользовательские языки''' отмечаем '''Удмурт кыл''' (см. выше) и выбираем меню '''Свойства'''.


В '''Свойствах языка''' в разделе '''Словарь''' вместо '''Нет''' маркируем '''Пользовательский словарь'''  
В '''Свойствах языка''' в разделе '''Словарь''' вместо '''Нет''' маркируем '''Пользовательский словарь'''  

Версия от 16:50, 18 октября 2014

OCR.jpg

ABBYY FineReader 11 Professional Edition распознает документы на 188 языках на основе кириллицы, латиницы, греческого и армянского алфавитов, а также языки на основе иероглифического письма, искусственные языки и языки программирования, причём для 44 языков предусмотрена словарная поддержка и проверка орфографии.

Удмуртский язык есть в списке ABBYY, но словарная поддержка для него по умолчанию не предусмотрена. В настоящее время выходом может стать добавление нового пользовательского языка на основе языка "Удмуртский".

Добавление пользовательского языка "Удмурт кыл"

Чтобы качественно распознавать удмуртские тексты необходимо создать новый пользовательский язык:

В меню "Сервис" кликнем "Редактор языков". В окне Редактора языков нажимаем "Новый".

Abbyy udm0.png

В появившемся меню "Новый язык или группа языков" выбираем базовым языком "Удмуртский" и нажимаем ОК.

Abbyy udm.png

Откроется окно Свойство языка

В имени нового языка вместо Копия (Удмуртский) пишем, например, Удмурт кыл.

Abbyy udm1.png

Нажимаем ОК.

Теперь Удмурт кыл появится в списке пользовательских языков.

Abbyy udm4.png

Добавление словаря поддержки

В Сервис → Редактор языков → Пользовательские языки отмечаем Удмурт кыл (см. выше) и выбираем меню Свойства.

В Свойствах языка в разделе Словарь вместо Нет маркируем Пользовательский словарь

Abbyy udm2.png

Кликнем его Cвойства. Появится окно Словарь для языка "Удмурт кыл":

Abbyy udm3.png

Нажимаем Импорт и загружаем предварительно скачанный [отсюда] и распакованный файл словаря поддержки удмуртского языка. Загрузка словаря занимает не менее 5 минут.

Abbyy udm5.png

Закроем окно словаря и нажимаем ОК в свойствах языка. Теперь удмуртские тексты будут распознаваться с учетом словоформ, заложенных в словарь поддержки.

Сохранение пользовательского языка

Дабы не пришлось создавать пользовательский язык каждый раз, сохраните пакет, в котором Вы создали польз. язык "Удмурт кыл". Теперь данный язык останется в этом пакете и автоматически появится в тех, которые будут создаваться позже.

Распознавание удмуртского текста

Для распознания удмуртского текста устанавливаем Удмурт кыл как язык документа:

Язык документа -> Выбор языков... (внизу) -> Редактор языков -> Пользовательские языки (внизу) -> Удмурт кыл -> ОК).

Качество распознавания достаточно высокое. Пример см. на изображении:

Abbyy udm6.png

Ссылки