Распознавание удмуртских текстов: различия между версиями
Ӧньӧ Лав (обсуждение | вклад) |
Ӧньӧ Лав (обсуждение | вклад) Нет описания правки |
||
Строка 5: | Строка 5: | ||
Удмуртский языка есть в списке ABBYY, но словарная поддержка для него по умолчанию не предусмотрена. В настоящее время выходом может стать добавление нового пользовательского языка на основе языка "Удмуртский". | Удмуртский языка есть в списке ABBYY, но словарная поддержка для него по умолчанию не предусмотрена. В настоящее время выходом может стать добавление нового пользовательского языка на основе языка "Удмуртский". | ||
==Добавление пользовательского языка== | ==Добавление пользовательского языка "Удмурт кыл"== | ||
Чтобы качественно распознавать удмуртские тексты необходимо создать новый пользовательский язык: | Чтобы качественно распознавать удмуртские тексты необходимо создать новый пользовательский язык: | ||
Строка 13: | Строка 13: | ||
Откроется окно '''Свойство языка''' | Откроется окно '''Свойство языка''' | ||
Выбираем базовый язык — Удмурский. В имени нового языка вместо '''Копия (Удмуртский)''' пишем, например, '''Удмурт кыл'''. | Выбираем базовый язык — Удмурский. В имени нового языка вместо '''Копия (Удмуртский)''' пишем, например, '''Удмурт кыл'''. Нажимаем ОК. | ||
[[Файл:Abbyy udm1.png]] | [[Файл:Abbyy udm1.png]] | ||
Теперь '''Удмурт кыл''' появится в списке пользовательских языков. | |||
[[Файл:Abbyy udm4.png]] | |||
==Добавление словаря поддержки== | ==Добавление словаря поддержки== | ||
Выбираем меню "Свойства". | |||
В '''Свойствах языка''' в разделе '''Словарь''' вместо '''Нет''' маркируйем '''Пользовательский словарь''' | В '''Свойствах языка''' в разделе '''Словарь''' вместо '''Нет''' маркируйем '''Пользовательский словарь''' | ||
Строка 31: | Строка 35: | ||
В открывшемся окне '''Словарь для языка "Удмурт кыл"''' нажимаем '''Импорт''' и загружаем предварительно скачанный [[http://komikyv.ru/uploads/komi-kpv-utf16.txt.zip отсюда]] и распакованный файл словаря поддержки удмуртского языка. Загрузка словаря занимает не менее 5 минут. | В открывшемся окне '''Словарь для языка "Удмурт кыл"''' нажимаем '''Импорт''' и загружаем предварительно скачанный [[http://komikyv.ru/uploads/komi-kpv-utf16.txt.zip отсюда]] и распакованный файл словаря поддержки удмуртского языка. Загрузка словаря занимает не менее 5 минут. | ||
Закроем окно словаря и нажимаем '''ОК''' в свойствах языка. Теперь | Закроем окно словаря и нажимаем '''ОК''' в свойствах языка. Теперь удмуртские тексты будут распознаваться с учетом словоформ, заложенных в словарь поддержки. | ||
==Сохранение пользовательского языка== | |||
Дабы не пришлось создавать пользовательский язык каждый раз, сохраните пакет, в котором Вы создали польз. язык "Удмурт кыл". Теперь данный язык останется в этом пакете и автоматически появится в тех, которые будут создаваться позже. | Дабы не пришлось создавать пользовательский язык каждый раз, сохраните пакет, в котором Вы создали польз. язык "Удмурт кыл". Теперь данный язык останется в этом пакете и автоматически появится в тех, которые будут создаваться позже. | ||
==Распознавание удмуртского текста== | ==Распознавание удмуртского текста== | ||
При распознании коми текста выбираем '''Удмурт кыл''' из списка пользовательских языков. | |||
Качество распознавания досаточно высокое. Пример см. на изображении: | Качество распознавания досаточно высокое. Пример см. на изображении: |
Версия от 15:42, 18 октября 2014
ABBYY FineReader 11 Professional Edition распознает документы на 188 языках на основе кириллицы, латиницы, греческого и армянского алфавитов, а также языки на основе иероглифического письма, искусственные языки и языки программирования, причём для 44 языков предусмотрена словарная поддержка и проверка орфографии.
Удмуртский языка есть в списке ABBYY, но словарная поддержка для него по умолчанию не предусмотрена. В настоящее время выходом может стать добавление нового пользовательского языка на основе языка "Удмуртский".
Добавление пользовательского языка "Удмурт кыл"
Чтобы качественно распознавать удмуртские тексты необходимо создать новый пользовательский язык:
«Сервис → Редактор языков → Пользовательские языки → Новый».
Откроется окно Свойство языка
Выбираем базовый язык — Удмурский. В имени нового языка вместо Копия (Удмуртский) пишем, например, Удмурт кыл. Нажимаем ОК.
Теперь Удмурт кыл появится в списке пользовательских языков.
Добавление словаря поддержки
Выбираем меню "Свойства".
В Свойствах языка в разделе Словарь вместо Нет маркируйем Пользовательский словарь
Кликнем его Cвойства.
В открывшемся окне Словарь для языка "Удмурт кыл" нажимаем Импорт и загружаем предварительно скачанный [отсюда] и распакованный файл словаря поддержки удмуртского языка. Загрузка словаря занимает не менее 5 минут.
Закроем окно словаря и нажимаем ОК в свойствах языка. Теперь удмуртские тексты будут распознаваться с учетом словоформ, заложенных в словарь поддержки.
Сохранение пользовательского языка
Дабы не пришлось создавать пользовательский язык каждый раз, сохраните пакет, в котором Вы создали польз. язык "Удмурт кыл". Теперь данный язык останется в этом пакете и автоматически появится в тех, которые будут создаваться позже.
Распознавание удмуртского текста
При распознании коми текста выбираем Удмурт кыл из списка пользовательских языков.
Качество распознавания досаточно высокое. Пример см. на изображении: