Распознавание коми текстов: различия между версиями
Admin (обсуждение | вклад) |
Ӧньӧ Лав (обсуждение | вклад) Нет описания правки |
||
(не показаны 32 промежуточные версии 3 участников) | |||
Строка 1: | Строка 1: | ||
'''ABBYY FineReader | [[Файл:OCR.jpg|300px|thumb]] | ||
'''ABBYY FineReader 12 Professional Edition''' распознает документы на 190 языках на основе кириллицы, латиницы, греческого и армянского алфавитов, а также языки на основе иероглифического письма, искусственные языки и языки программирования, причём для 44 языков предусмотрена словарная поддержка и проверка орфографии. | |||
Однако в этом внушительном списке почему-то не оказалось места для '''коми языка'''. | |||
В настоящее время для распознавания текстов на коми (пермяцком и зырянском) языке можно воспользоваться только опцией создания нового пользовательского языка в этой программе. | |||
==Распознавание коми (зырянских) текстов== | |||
Чтобы распознавать коми (зырянские) тексты необходимо создать новый пользовательский язык: | |||
''«Сервис → Редактор языков → Пользовательские языки → Новый».'' | |||
Откроется окно '''Свойство языка''' | |||
По умолчанию базовый язык — Русский. В имени нового языка вместо '''Копия (Русский)''' следует указать '''Коми (зырянский)'''. | |||
[[Файл:Abbyy2.png]] | |||
Затем займемся '''Алфавитом языка'''. Кликнем на квадрате с тремя точками справа от списка букв. Откроется окно '''Алфавит'''. | |||
На кириллической кодовой странице выделим в таблице специфические коми символы : | |||
*'''Ӧ''' — 04E6 | |||
*'''ӧ''' — 04E7 | |||
*'''І''' — 0406 | |||
*'''і''' — 0456 | |||
[[Файл:Abbyy3.png]] | |||
Нажав ОК, возвращаемся в '''Свойство языка'''. | |||
[[Файл:Abbyy2.png]] | |||
Далее выделим '''Пользовательский словарь''' и кликнем его '''Cвойства'''. В открывшемся окне '''Словарь для языка "Коми (зырянский)"''' нажимаем '''Импорт''' и загружаем предварительно скачанный [[http://vidzanin.komikyv.com/programms/OCR/komi-kv-utf16.txt отсюда]] и распакованный файл словаря поддержки коми (зырянского) языка. Загрузка словаря занимает не менее 5 минут. | |||
[[Файл:Abbyy5.png]] | |||
Закроем окно словаря и нажимаем '''ОК''' в свойствах языка. Теперь '''Коми (зырянский)''' язык появится в списке пользовательских языков. | |||
[[Файл:Abbyy1.png]] | |||
При распознании коми текста выбираем '''Коми (зырянский)''' из списка. | |||
Дабы не пришлось создавать пользовательский язык каждый раз, сохраните пакет, в котором Вы создали польз. язык "Коми (зырянский)". Теперь данный язык останется в этом пакете и автоматически появится в тех, которые будут создаваться позже. | |||
==Распознавание коми (пермяцких) текстов== | ==Распознавание коми (пермяцких) текстов== | ||
Чтобы распознавать коми (пермяцкие) тексты необходимо создать пользовательский язык: «Сервис → Редактор языков → Пользовательские языки → Новый» — '''Коми (пермяцкий)'''. | Чтобы распознавать коми (пермяцкие) тексты необходимо создать пользовательский язык: | ||
''«Сервис → Редактор языков → Пользовательские языки → Новый» — '''Коми (пермяцкий)'''.'' | |||
Схема создания описана в предыдущем разделе. Разница лишь в том, что в свойствах пользовательского словаря следует импортировать предварительно скачанный и распакованный [http://komikyv.org/downloads/komi_koi_utf-16.zip файл словаря поддержки '''коми (пермяцкого) языка''']. | |||
==Ссылки== | |||
* [[Коми раскладка клавиатуры]] | |||
* [[Коми электронные словари]] | |||
* [[Проверка правописания коми языка]] | |||
* [[AntConc|Корпус-менеждер AntConc]] | |||
* [http://www.abbyy.ru/finereader-professional/recognition-languages/ ABBYY FineReader 12 Professional Edition] | |||
[[Category: | [[Category:Инструментарий (коми кыв)]] |
Текущая версия от 19:21, 2 августа 2023
ABBYY FineReader 12 Professional Edition распознает документы на 190 языках на основе кириллицы, латиницы, греческого и армянского алфавитов, а также языки на основе иероглифического письма, искусственные языки и языки программирования, причём для 44 языков предусмотрена словарная поддержка и проверка орфографии.
Однако в этом внушительном списке почему-то не оказалось места для коми языка.
В настоящее время для распознавания текстов на коми (пермяцком и зырянском) языке можно воспользоваться только опцией создания нового пользовательского языка в этой программе.
Распознавание коми (зырянских) текстов
Чтобы распознавать коми (зырянские) тексты необходимо создать новый пользовательский язык:
«Сервис → Редактор языков → Пользовательские языки → Новый».
Откроется окно Свойство языка
По умолчанию базовый язык — Русский. В имени нового языка вместо Копия (Русский) следует указать Коми (зырянский).
Затем займемся Алфавитом языка. Кликнем на квадрате с тремя точками справа от списка букв. Откроется окно Алфавит.
На кириллической кодовой странице выделим в таблице специфические коми символы :
- Ӧ — 04E6
- ӧ — 04E7
- І — 0406
- і — 0456
Нажав ОК, возвращаемся в Свойство языка.
Далее выделим Пользовательский словарь и кликнем его Cвойства. В открывшемся окне Словарь для языка "Коми (зырянский)" нажимаем Импорт и загружаем предварительно скачанный [отсюда] и распакованный файл словаря поддержки коми (зырянского) языка. Загрузка словаря занимает не менее 5 минут.
Закроем окно словаря и нажимаем ОК в свойствах языка. Теперь Коми (зырянский) язык появится в списке пользовательских языков.
При распознании коми текста выбираем Коми (зырянский) из списка.
Дабы не пришлось создавать пользовательский язык каждый раз, сохраните пакет, в котором Вы создали польз. язык "Коми (зырянский)". Теперь данный язык останется в этом пакете и автоматически появится в тех, которые будут создаваться позже.
Распознавание коми (пермяцких) текстов
Чтобы распознавать коми (пермяцкие) тексты необходимо создать пользовательский язык:
«Сервис → Редактор языков → Пользовательские языки → Новый» — Коми (пермяцкий).
Схема создания описана в предыдущем разделе. Разница лишь в том, что в свойствах пользовательского словаря следует импортировать предварительно скачанный и распакованный файл словаря поддержки коми (пермяцкого) языка.