Распознавание коми текстов: различия между версиями
Ӧньӧ Лав (обсуждение | вклад) |
Ӧньӧ Лав (обсуждение | вклад) Нет описания правки |
||
(не показано 18 промежуточных версий 2 участников) | |||
Строка 1: | Строка 1: | ||
[[Файл:OCR.jpg|300px|thumb]] | [[Файл:OCR.jpg|300px|thumb]] | ||
'''ABBYY FineReader | '''ABBYY FineReader 12 Professional Edition''' распознает документы на 190 языках на основе кириллицы, латиницы, греческого и армянского алфавитов, а также языки на основе иероглифического письма, искусственные языки и языки программирования, причём для 44 языков предусмотрена словарная поддержка и проверка орфографии. | ||
Однако в этом внушительном списке почему-то не оказалось места для '''коми языка'''. | |||
В настоящее время для распознавания текстов на коми (пермяцком и зырянском) языке можно воспользоваться только опцией создания нового пользовательского языка в этой программе. | |||
==Распознавание коми (зырянских) текстов== | ==Распознавание коми (зырянских) текстов== | ||
Чтобы распознавать коми (зырянские) тексты необходимо создать пользовательский язык: «Сервис → Редактор языков → Пользовательские языки → Новый» | Чтобы распознавать коми (зырянские) тексты необходимо создать новый пользовательский язык: | ||
''«Сервис → Редактор языков → Пользовательские языки → Новый».'' | |||
Откроется окно '''Свойство языка''' | |||
По умолчанию базовый язык — Русский. В имени нового языка вместо '''Копия (Русский)''' следует указать '''Коми (зырянский)'''. | |||
[[Файл:Abbyy2.png]] | [[Файл:Abbyy2.png]] | ||
Затем займемся '''Алфавитом языка'''. Кликнем на квадрате с тремя точками справа от списка букв. Откроется окно '''Алфавит'''. | |||
На кириллической кодовой странице выделим в таблице специфические коми символы : | |||
*'''Ӧ''' — 04E6 | |||
*'''ӧ''' — 04E7 | |||
*'''І''' — 0406 | |||
*'''і''' — 0456 | |||
[[Файл:Abbyy3.png]] | [[Файл:Abbyy3.png]] | ||
Нажав ОК, возвращаемся в '''Свойство языка'''. | |||
http://komikyv. | |||
[[Файл:Abbyy2.png]] | |||
Далее выделим '''Пользовательский словарь''' и кликнем его '''Cвойства'''. В открывшемся окне '''Словарь для языка "Коми (зырянский)"''' нажимаем '''Импорт''' и загружаем предварительно скачанный [[http://vidzanin.komikyv.com/programms/OCR/komi-kv-utf16.txt отсюда]] и распакованный файл словаря поддержки коми (зырянского) языка. Загрузка словаря занимает не менее 5 минут. | |||
[[Файл:Abbyy5.png]] | |||
Закроем окно словаря и нажимаем '''ОК''' в свойствах языка. Теперь '''Коми (зырянский)''' язык появится в списке пользовательских языков. | |||
[[Файл:Abbyy1.png]] | |||
При распознании коми текста выбираем '''Коми (зырянский)''' из списка. | |||
Дабы не пришлось создавать пользовательский язык каждый раз, сохраните пакет, в котором Вы создали польз. язык "Коми (зырянский)". Теперь данный язык останется в этом пакете и автоматически появится в тех, которые будут создаваться позже. | |||
==Распознавание коми (пермяцких) текстов== | ==Распознавание коми (пермяцких) текстов== | ||
Чтобы распознавать коми (пермяцкие) тексты необходимо создать пользовательский язык: «Сервис → Редактор языков → Пользовательские языки → Новый» — '''Коми (пермяцкий)'''. | Чтобы распознавать коми (пермяцкие) тексты необходимо создать пользовательский язык: | ||
''«Сервис → Редактор языков → Пользовательские языки → Новый» — '''Коми (пермяцкий)'''.'' | |||
Схема создания описана в предыдущем разделе. Разница лишь в том, что в свойствах пользовательского словаря следует импортировать предварительно скачанный и распакованный [http://komikyv.org/downloads/komi_koi_utf-16.zip файл словаря поддержки '''коми (пермяцкого) языка''']. | |||
==Ссылки== | ==Ссылки== | ||
Строка 34: | Строка 58: | ||
* [[Проверка правописания коми языка]] | * [[Проверка правописания коми языка]] | ||
* [[AntConc|Корпус-менеждер AntConc]] | * [[AntConc|Корпус-менеждер AntConc]] | ||
* [http://www.abbyy.ru/finereader-professional/recognition-languages/ ABBYY FineReader | * [http://www.abbyy.ru/finereader-professional/recognition-languages/ ABBYY FineReader 12 Professional Edition] | ||
[[Category:Инструментарий (коми кыв)]] | [[Category:Инструментарий (коми кыв)]] |
Текущая версия от 19:21, 2 августа 2023
ABBYY FineReader 12 Professional Edition распознает документы на 190 языках на основе кириллицы, латиницы, греческого и армянского алфавитов, а также языки на основе иероглифического письма, искусственные языки и языки программирования, причём для 44 языков предусмотрена словарная поддержка и проверка орфографии.
Однако в этом внушительном списке почему-то не оказалось места для коми языка.
В настоящее время для распознавания текстов на коми (пермяцком и зырянском) языке можно воспользоваться только опцией создания нового пользовательского языка в этой программе.
Распознавание коми (зырянских) текстов
Чтобы распознавать коми (зырянские) тексты необходимо создать новый пользовательский язык:
«Сервис → Редактор языков → Пользовательские языки → Новый».
Откроется окно Свойство языка
По умолчанию базовый язык — Русский. В имени нового языка вместо Копия (Русский) следует указать Коми (зырянский).
Затем займемся Алфавитом языка. Кликнем на квадрате с тремя точками справа от списка букв. Откроется окно Алфавит.
На кириллической кодовой странице выделим в таблице специфические коми символы :
- Ӧ — 04E6
- ӧ — 04E7
- І — 0406
- і — 0456
Нажав ОК, возвращаемся в Свойство языка.
Далее выделим Пользовательский словарь и кликнем его Cвойства. В открывшемся окне Словарь для языка "Коми (зырянский)" нажимаем Импорт и загружаем предварительно скачанный [отсюда] и распакованный файл словаря поддержки коми (зырянского) языка. Загрузка словаря занимает не менее 5 минут.
Закроем окно словаря и нажимаем ОК в свойствах языка. Теперь Коми (зырянский) язык появится в списке пользовательских языков.
При распознании коми текста выбираем Коми (зырянский) из списка.
Дабы не пришлось создавать пользовательский язык каждый раз, сохраните пакет, в котором Вы создали польз. язык "Коми (зырянский)". Теперь данный язык останется в этом пакете и автоматически появится в тех, которые будут создаваться позже.
Распознавание коми (пермяцких) текстов
Чтобы распознавать коми (пермяцкие) тексты необходимо создать пользовательский язык:
«Сервис → Редактор языков → Пользовательские языки → Новый» — Коми (пермяцкий).
Схема создания описана в предыдущем разделе. Разница лишь в том, что в свойствах пользовательского словаря следует импортировать предварительно скачанный и распакованный файл словаря поддержки коми (пермяцкого) языка.