Распознавание удмуртских текстов: различия между версиями

Материал из Wiki FU-Lab
Перейти к навигации Перейти к поиску
Нет описания правки
Строка 5: Строка 5:
Удмуртский языка есть в списке ABBYY, но словарная поддержка для него по умолчанию не предусмотрена. В настоящее время выходом может стать добавление нового пользовательского языка на основе языка "Удмуртский".
Удмуртский языка есть в списке ABBYY, но словарная поддержка для него по умолчанию не предусмотрена. В настоящее время выходом может стать добавление нового пользовательского языка на основе языка "Удмуртский".


==Добавление пользовательского языка==
==Добавление пользовательского языка "Удмурт кыл"==


Чтобы качественно распознавать удмуртские тексты необходимо создать новый пользовательский язык:  
Чтобы качественно распознавать удмуртские тексты необходимо создать новый пользовательский язык:  
Строка 13: Строка 13:
Откроется окно '''Свойство языка'''
Откроется окно '''Свойство языка'''


Выбираем базовый язык — Удмурский. В имени нового языка вместо '''Копия (Удмуртский)''' пишем, например, '''Удмурт кыл'''.
Выбираем базовый язык — Удмурский. В имени нового языка вместо '''Копия (Удмуртский)''' пишем, например, '''Удмурт кыл'''. Нажимаем ОК.


[[Файл:Abbyy udm1.png]]
[[Файл:Abbyy udm1.png]]
 
Выбираем меню "Свойства".  
Теперь '''Удмурт кыл''' появится в списке пользовательских языков.
 
[[Файл:Abbyy udm4.png]]


==Добавление словаря поддержки==
==Добавление словаря поддержки==
Выбираем меню "Свойства".


В '''Свойствах языка''' в разделе '''Словарь''' вместо '''Нет''' маркируйем '''Пользовательский словарь'''  
В '''Свойствах языка''' в разделе '''Словарь''' вместо '''Нет''' маркируйем '''Пользовательский словарь'''  
Строка 31: Строка 35:
В открывшемся окне  '''Словарь для языка "Удмурт кыл"''' нажимаем '''Импорт''' и загружаем предварительно скачанный [[http://komikyv.ru/uploads/komi-kpv-utf16.txt.zip отсюда]] и распакованный файл словаря поддержки удмуртского языка. Загрузка словаря занимает не менее 5 минут.
В открывшемся окне  '''Словарь для языка "Удмурт кыл"''' нажимаем '''Импорт''' и загружаем предварительно скачанный [[http://komikyv.ru/uploads/komi-kpv-utf16.txt.zip отсюда]] и распакованный файл словаря поддержки удмуртского языка. Загрузка словаря занимает не менее 5 минут.


Закроем окно словаря и нажимаем '''ОК''' в свойствах языка. Теперь '''Удмурт кыл''' появится в списке пользовательских языков.
Закроем окно словаря и нажимаем '''ОК''' в свойствах языка. Теперь удмуртские тексты будут распознаваться с учетом словоформ, заложенных в словарь поддержки.


При распознании коми текста выбираем '''Удмурт кыл''' из списка.
==Сохранение пользовательского языка==


Дабы не пришлось создавать пользовательский язык каждый раз, сохраните пакет, в котором Вы создали польз. язык "Удмурт кыл". Теперь данный язык останется в этом пакете и автоматически появится в тех, которые будут создаваться позже.
Дабы не пришлось создавать пользовательский язык каждый раз, сохраните пакет, в котором Вы создали польз. язык "Удмурт кыл". Теперь данный язык останется в этом пакете и автоматически появится в тех, которые будут создаваться позже.


==Распознавание удмуртского текста==
==Распознавание удмуртского текста==
При распознании коми текста выбираем '''Удмурт кыл''' из списка пользовательских языков.


Качество распознавания досаточно высокое. Пример см. на изображении:
Качество распознавания досаточно высокое. Пример см. на изображении:

Версия от 15:42, 18 октября 2014

OCR.jpg

ABBYY FineReader 11 Professional Edition распознает документы на 188 языках на основе кириллицы, латиницы, греческого и армянского алфавитов, а также языки на основе иероглифического письма, искусственные языки и языки программирования, причём для 44 языков предусмотрена словарная поддержка и проверка орфографии.

Удмуртский языка есть в списке ABBYY, но словарная поддержка для него по умолчанию не предусмотрена. В настоящее время выходом может стать добавление нового пользовательского языка на основе языка "Удмуртский".

Добавление пользовательского языка "Удмурт кыл"

Чтобы качественно распознавать удмуртские тексты необходимо создать новый пользовательский язык:

«Сервис → Редактор языков → Пользовательские языки → Новый».

Откроется окно Свойство языка

Выбираем базовый язык — Удмурский. В имени нового языка вместо Копия (Удмуртский) пишем, например, Удмурт кыл. Нажимаем ОК.

Abbyy udm1.png

Теперь Удмурт кыл появится в списке пользовательских языков.

Abbyy udm4.png

Добавление словаря поддержки

Выбираем меню "Свойства".

В Свойствах языка в разделе Словарь вместо Нет маркируйем Пользовательский словарь

Abbyy udm2.png

Кликнем его Cвойства.

Abbyy udm3.png

В открывшемся окне Словарь для языка "Удмурт кыл" нажимаем Импорт и загружаем предварительно скачанный [отсюда] и распакованный файл словаря поддержки удмуртского языка. Загрузка словаря занимает не менее 5 минут.

Закроем окно словаря и нажимаем ОК в свойствах языка. Теперь удмуртские тексты будут распознаваться с учетом словоформ, заложенных в словарь поддержки.

Сохранение пользовательского языка

Дабы не пришлось создавать пользовательский язык каждый раз, сохраните пакет, в котором Вы создали польз. язык "Удмурт кыл". Теперь данный язык останется в этом пакете и автоматически появится в тех, которые будут создаваться позже.

Распознавание удмуртского текста

При распознании коми текста выбираем Удмурт кыл из списка пользовательских языков.

Качество распознавания досаточно высокое. Пример см. на изображении:

Abbyy udm6.png

Ссылки