Распознавание коми текстов: различия между версиями
Ӧньӧ Лав (обсуждение | вклад) |
Ӧньӧ Лав (обсуждение | вклад) |
||
Строка 7: | Строка 7: | ||
==Распознавание коми (зырянских) текстов== | ==Распознавание коми (зырянских) текстов== | ||
Чтобы распознавать коми (зырянские) тексты необходимо создать пользовательский язык: | Чтобы распознавать коми (зырянские) тексты необходимо создать новый пользовательский язык: | ||
''«Сервис → Редактор языков → Пользовательские языки → Новый».'' | |||
Откроется окно '''Свойство языка''' | |||
По умолчанию базовый язык — русский. В имени нового языка вместо '''Копия (русский)''' следует указать '''Коми (зырянский)'''. | |||
[[Файл:Abbyy2.png]] | [[Файл:Abbyy2.png]] | ||
Затем в '''Алфавит языка''' кликнем на квадрате с '''...''' справа от списка букв. Откроется окно '''Алфавит'''. | |||
[[Файл:Abbyy3.png]] | [[Файл:Abbyy3.png]] | ||
Выбераем специфические коми символы : '''Ӧӧ''' (Ӧ — U04E6, ӧ — U04E7), '''Іі''' (І — U0406, і — U0456). ''Буквы '''ӧ''' и '''і''' следует выбрать на кириллической кодовой странице''. | |||
http://komikyv.ru/uploads/komi-kpv-utf16.txt.zip | |||
Нажав ОК, возвращаемся в '''Свойство языка'''. | |||
[[Файл:Abbyy2.png]] | |||
Далее выделим '''Пользовательский словарь''' и кликнем его '''Cвойства'''. В открывшемся окне '''Словарь для языка "Коми (зырянский)"''' нажимаем '''Импорт''' и загружаем предварительно скачанный [[http://komikyv.ru/uploads/komi-kpv-utf16.txt.zip отсюда]] и распакованный файл словаря поддержки коми (зырянского) языка. | |||
[[Файл:Abbyy5.png]] | |||
Закроем окно словаря и нажимаем '''ОК''' в свойствах языка. Теперь '''Коми (зырянский)''' язык появится в списке пользовательских языков. | |||
[[Файл:Abbyy1.png]] | |||
При распознании коми текста выбираем '''Коми (зырянский)''' из списка. | |||
==Распознавание коми (пермяцких) текстов== | ==Распознавание коми (пермяцких) текстов== |
Версия от 12:08, 21 апреля 2014
ABBYY FineReader 11 Professional Edition распознает документы на 188 языках на основе кириллицы, латиницы, греческого и армянского алфавитов, а также языки на основе иероглифического письма, искусственные языки и языки программирования, причём для 44 языков предусмотрена словарная поддержка и проверка орфографии…
Но в этом внушительном списке почему-то не оказалось места для коми языка. Поэтому для распознавания текстов на коми (пермяцком и зырянском) языке можно воспользоваться только опцией создания нового пользовательского языка в этой программе.
Распознавание коми (зырянских) текстов
Чтобы распознавать коми (зырянские) тексты необходимо создать новый пользовательский язык:
«Сервис → Редактор языков → Пользовательские языки → Новый».
Откроется окно Свойство языка
По умолчанию базовый язык — русский. В имени нового языка вместо Копия (русский) следует указать Коми (зырянский).
Затем в Алфавит языка кликнем на квадрате с ... справа от списка букв. Откроется окно Алфавит.
Выбераем специфические коми символы : Ӧӧ (Ӧ — U04E6, ӧ — U04E7), Іі (І — U0406, і — U0456). Буквы ӧ и і следует выбрать на кириллической кодовой странице.
Нажав ОК, возвращаемся в Свойство языка.
Далее выделим Пользовательский словарь и кликнем его Cвойства. В открывшемся окне Словарь для языка "Коми (зырянский)" нажимаем Импорт и загружаем предварительно скачанный [отсюда] и распакованный файл словаря поддержки коми (зырянского) языка.
Закроем окно словаря и нажимаем ОК в свойствах языка. Теперь Коми (зырянский) язык появится в списке пользовательских языков.
При распознании коми текста выбираем Коми (зырянский) из списка.
Распознавание коми (пермяцких) текстов
Чтобы распознавать коми (пермяцкие) тексты необходимо создать пользовательский язык: «Сервис → Редактор языков → Пользовательские языки → Новый» — Коми (пермяцкий). Далее в свойствах взять базовый язык — русский (это просто используются буквы русского алфавита, не путать со словарём поддержки русского языка!) и добавить необходимые символы: Ӧӧ (Ӧ — U04E6, ӧ — U04E7), Іі (І — U0406, і — U0456) и нужные вам ещё символы, если есть таковые. При добавлении коми букв особое внимание обратите на коды букв, иначе у вас будут проблемы с распознаванием.
Далее в свойствах пользовательского словаря импортируйте скачанный файл словаря поддержки коми (пермяцкого) языка:
http://komikyv.ru/uploads/komi-koi-utf16.txt.zip