Распознавание коми текстов: различия между версиями

Материал из Wiki FU-Lab
Перейти к навигации Перейти к поиску
Строка 28: Строка 28:


==Ссылки==
==Ссылки==
* [[Коми раскладка клавиатуры]]
* [[Коми электронные словари]]
* [[Коми электронные словари]]
* [[AntConc|Корпус-менеждер AntConc]]
* [http://www.abbyy.ru/finereader-professional/recognition-languages/ ABBYY FineReader 11 Professional Edition]
* [http://www.abbyy.ru/finereader-professional/recognition-languages/ ABBYY FineReader 11 Professional Edition]


[[Category:Коми кыв]]
[[Category:Коми кыв]]

Версия от 11:31, 4 октября 2013

OCR.jpg

ABBYY FineReader 11 Professional Edition распознает документы на 188 языках на основе кириллицы, латиницы, греческого и армянского алфавитов, а также языки на основе иероглифического письма, в том числе искусственные языки и языки программирования, а для 44 языков предусмотрена словарная поддержка и проверка орфографии… почему-то не оказалось места для коми языка.

Распознавание коми (зырянских) текстов

Чтобы распознавать коми (зырянские) тексты необходимо создать пользовательский язык: «Сервис → Редактор языков → Пользовательские языки → Новый» — Коми (зырянский).

Abbyy1.png

Далее в свойствах взять базовый язык — русский (это просто используются буквы русского алфавита, не путать со словарём поддержки русского языка!) и добавить необходимые символы: Ӧӧ (Ӧ — U04E6, ӧ — U04E7), Іі (І — U0406, і — U0456) и нужные вам ещё символы, если есть таковые.

Abbyy2.png

При добавлении коми букв особое внимание обратите на коды букв, иначе у вас будут проблемы с распознаванием.

Abbyy3.png

Далее в свойствах пользовательского словаря импортируйте скачанный файл словаря поддержки коми (зырянского) языка:

http://komikyv.ru/uploads/komi-kpv-utf16.txt.zip

Распознавание коми (пермяцких) текстов

Чтобы распознавать коми (пермяцкие) тексты необходимо создать пользовательский язык: «Сервис → Редактор языков → Пользовательские языки → Новый» — Коми (пермяцкий). Далее в свойствах взять базовый язык — русский (это просто используются буквы русского алфавита, не путать со словарём поддержки русского языка!) и добавить необходимые символы: Ӧӧ (Ӧ — U04E6, ӧ — U04E7), Іі (І — U0406, і — U0456) и нужные вам ещё символы, если есть таковые. При добавлении коми букв особое внимание обратите на коды букв, иначе у вас будут проблемы с распознаванием.

Далее в свойствах пользовательского словаря импортируйте скачанный файл словаря поддержки коми (пермяцкого) языка:

http://komikyv.ru/uploads/komi-koi-utf16.txt.zip

Ссылки