Распознавание коми текстов: различия между версиями

Материал из Wiki FU-Lab
Перейти к навигации Перейти к поиску
Нет описания правки
Нет описания правки
Строка 23: Строка 23:
[[Файл:Abbyy3.png]]
[[Файл:Abbyy3.png]]


Выбераем из таблицы специфические коми символы : '''Ӧӧ''' — U04E6, ӧ — U04E7), '''Іі''' U0406, і — U0456). ''Буквы ''''' и '''і''' следует выбрать на кириллической кодовой странице''.
На кириллической кодовой странице выделим в таблице специфические коми символы : '''Ӧ''' — U04E6, '''ӧ''' — U04E7, '''І''' — U0406, '''і''' — U0456.  


Нажав ОК, возвращаемся в '''Свойство языка'''.
Нажав ОК, возвращаемся в '''Свойство языка'''.

Версия от 12:26, 21 апреля 2014

OCR.jpg

ABBYY FineReader 11 Professional Edition распознает документы на 188 языках на основе кириллицы, латиницы, греческого и армянского алфавитов, а также языки на основе иероглифического письма, искусственные языки и языки программирования, причём для 44 языков предусмотрена словарная поддержка и проверка орфографии.

Однако в этом внушительном списке почему-то не оказалось места для коми языка.

В настоящее время для распознавания текстов на коми (пермяцком и зырянском) языке можно воспользоваться только опцией создания нового пользовательского языка в этой программе.

Распознавание коми (зырянских) текстов

Чтобы распознавать коми (зырянские) тексты необходимо создать новый пользовательский язык:

«Сервис → Редактор языков → Пользовательские языки → Новый».

Откроется окно Свойство языка

По умолчанию базовый язык — Русский. В имени нового языка вместо Копия (Русский) следует указать Коми (зырянский).

Abbyy2.png

Затем займемся Алфавитом языка. Кликнем на квадрате с тремя точками справа от списка букв. Откроется окно Алфавит.

Abbyy3.png

На кириллической кодовой странице выделим в таблице специфические коми символы : Ӧ — U04E6, ӧ — U04E7, І — U0406, і — U0456.

Нажав ОК, возвращаемся в Свойство языка.

Abbyy2.png

Далее выделим Пользовательский словарь и кликнем его Cвойства. В открывшемся окне Словарь для языка "Коми (зырянский)" нажимаем Импорт и загружаем предварительно скачанный [отсюда] и распакованный файл словаря поддержки коми (зырянского) языка. Загрузка словаря занимает не менее 5 минут.

Abbyy5.png

Закроем окно словаря и нажимаем ОК в свойствах языка. Теперь Коми (зырянский) язык появится в списке пользовательских языков.

Abbyy1.png

При распознании коми текста выбираем Коми (зырянский) из списка.

Распознавание коми (пермяцких) текстов

Чтобы распознавать коми (пермяцкие) тексты необходимо создать пользовательский язык:

«Сервис → Редактор языков → Пользовательские языки → Новый» — Коми (пермяцкий).

Схема создания описана в предыдущем разделе. Разница лишь в том, что в свойствах пользовательского словаря следует импортировать предварительно скачанный и распакованный файл словаря поддержки коми (пермяцкого) языка.

Ссылки