Распознавание коми текстов: различия между версиями

Версия от 12:20, 21 апреля 2014

ABBYY FineReader 11 Professional Edition распознает документы на 188 языках на основе кириллицы, латиницы, греческого и армянского алфавитов, а также языки на основе иероглифического письма, искусственные языки и языки программирования, причём для 44 языков предусмотрена словарная поддержка и проверка орфографии…

Но в этом внушительном списке почему-то не оказалось места для коми языка. Поэтому для распознавания текстов на коми (пермяцком и зырянском) языке можно воспользоваться только опцией создания нового пользовательского языка в этой программе.

Распознавание коми (зырянских) текстов

Чтобы распознавать коми (зырянские) тексты необходимо создать новый пользовательский язык:

«Сервис → Редактор языков → Пользовательские языки → Новый».

Откроется окно Свойство языка

По умолчанию базовый язык — русский. В имени нового языка вместо Копия (русский) следует указать Коми (зырянский).

Затем в Алфавит языка кликнем на квадрате с тремя точками справа от списка букв. Откроется окно Алфавит.

Выбераем из таблицы специфические коми символы : Ӧӧ (Ӧ — U04E6, ӧ — U04E7), Іі (І — U0406, і — U0456). Буквы ӧ и і следует выбрать на кириллической кодовой странице.

Нажав ОК, возвращаемся в Свойство языка.

Далее выделим Пользовательский словарь и кликнем его Cвойства. В открывшемся окне Словарь для языка "Коми (зырянский)" нажимаем Импорт и загружаем предварительно скачанный [отсюда] и распакованный файл словаря поддержки коми (зырянского) языка. Загрузка словаря занимает не менее 5 минут.

Закроем окно словаря и нажимаем ОК в свойствах языка. Теперь Коми (зырянский) язык появится в списке пользовательских языков.

При распознании коми текста выбираем Коми (зырянский) из списка.

Распознавание коми (пермяцких) текстов

Чтобы распознавать коми (пермяцкие) тексты необходимо создать пользовательский язык:

«Сервис → Редактор языков → Пользовательские языки → Новый» — Коми (пермяцкий).

Схема создания описана в предыдущем разделе. Разница лишь в том, что в свойствах пользовательского словаря следует импортировать предварительно скачанный и распакованный файл словаря поддержки коми (пермяцкого) языка.

Ссылки

@@ Строка 39: / Строка 39: @@
 ==Распознавание коми (пермяцких) текстов==
-Чтобы распознавать коми (пермяцкие) тексты необходимо создать пользовательский язык: «Сервис → Редактор языков → Пользовательские языки → Новый» — '''Коми (пермяцкий)'''. Далее в свойствах взять базовый язык — русский (это просто используются буквы русского алфавита, не путать со словарём поддержки русского языка!) и добавить необходимые символы: Ӧӧ (Ӧ — U04E6, ӧ — U04E7), Іі (І — U0406, і — U0456) и нужные вам ещё символы, если есть таковые. При добавлении коми букв особое внимание обратите на коды букв, иначе у вас будут проблемы с распознаванием.
+Чтобы распознавать коми (пермяцкие) тексты необходимо создать пользовательский язык:
-Далее в свойствах пользовательского словаря импортируйте скачанный файл словаря поддержки коми (пермяцкого) языка:
+''«Сервис → Редактор языков → Пользовательские языки → Новый» — '''Коми (пермяцкий)'''.''
- http://komikyv.ru/uploads/komi-koi-utf16.txt.zip
+Схема создания описана в предыдущем разделе. Разница лишь в том, что в свойствах пользовательского словаря следует импортировать предварительно скачанный и распакованный [http://komikyv.ru/uploads/komi-koi-utf16.txt.zip файл словаря поддержки '''коми (пермяцкого) языка'''].
 ==Ссылки==

Распознавание коми текстов: различия между версиями

Версия от 12:20, 21 апреля 2014

Распознавание коми (зырянских) текстов

Распознавание коми (пермяцких) текстов

Ссылки

Навигация

Поиск