Русско-коми электронный словарь: различия между версиями

Материал из Wiki FU-Lab
Перейти к навигации Перейти к поиску
Нет описания правки
Нет описания правки
Строка 1: Строка 1:
==Сканирование==
==Сканирование==
[[Файл:Rus-kom2003.jpg|thumb|250px|Л.М.Безносикова, Н.К.Забоева, Р.И.Коснырева «Русско-коми словарь»]]
[[Файл:Rus-kom2003.jpg|thumb|250px|Л.М.Безносикова, Н.К.Забоева, Р.И.Коснырева «Русско-коми словарь» (2003)]]
За основу '''Русско-коми электронного словаря''' взято издание: «Л.М.Безносикова, Н.К.Забоева, Р.И.Коснырева «Русско-коми словарь», Институт языка, литературы и истории Коми научного центра Уральского отделения Российской академии наук; под редакцией Л.М.Безносиковой. — Сыктывкар: Коми книжное издательство, 2003. — 1104 с.»
За основу '''Русско-коми электронного словаря''' взято издание: «Л.М.Безносикова, Н.К.Забоева, Р.И.Коснырева «Русско-коми словарь», Институт языка, литературы и истории Коми научного центра Уральского отделения Российской академии наук; под редакцией Л.М.Безносиковой. — Сыктывкар: Коми книжное издательство, 2003. — 1104 с.»


Строка 19: Строка 19:


==Доработка словаря==
==Доработка словаря==
[[Файл:Kom-rus2000.jpg|thumb|250px|Безносикова Л.М., Айбабина Е.А., Коснырева Р.И. Коми-роч кывчукӧр (Коми-русский словарь)]]
[[Файл:Kom-rus2000.jpg|thumb|250px|Безносикова Л.М., Айбабина Е.А., Коснырева Р.И. Коми-роч кывчукӧр (Коми-русский словарь) (2000)]]

Версия от 10:32, 23 февраля 2014

Сканирование

Л.М.Безносикова, Н.К.Забоева, Р.И.Коснырева «Русско-коми словарь» (2003)

За основу Русско-коми электронного словаря взято издание: «Л.М.Безносикова, Н.К.Забоева, Р.И.Коснырева «Русско-коми словарь», Институт языка, литературы и истории Коми научного центра Уральского отделения Российской академии наук; под редакцией Л.М.Безносиковой. — Сыктывкар: Коми книжное издательство, 2003. — 1104 с.»

В связи с отсутствием электронной версии данного издания было решено отсканировать его. Сканирование словаря осуществлено силами ЦИЯТ, и его PDF-версия (нераспознанная) предоставлена авторам, которая размещена в свободном доступе на сайте komikyv.com.

Распознавание

В июле 2013 года начата работа по распознаванию PDF-версии словаря в текст. Для этого была использована программа ABBYY FineReader 11 Professional Edition с созданным пользовательским языком и подключенным пользовательским словарём поддержки.

Вычитка и корректура

В связи с отсутствием полноценной поддержки коми языка в ABBYY FineReader распознанный текст содержал много ошибок в результате некорректного распознавания, опечатки в самом оригинале, необходимо было провести вычитку текста словаря и править ошибки. Также в Русско-коми словаре 2003 года содержались смысловые ошибки и неточный перевод иллюстративных примеров.

Вычитка и корректура текста данного словаря заняла около 3 месяцев: с июля по сентябрь 2013 года.

Перевод в DSL-формат

В качестве офлайн электронных словарей ЦИЯТ выбрал оболочку для электронных словарей с открытым исходным кодом GoldenDict, поддерживающую многие форматы словарей ABBYY Lingvo, StarDict, Babylon, Dictd. Для разметки словарных статей решили использовать формат, разработанный компанией ABBYY, DSL (Dictionary Specification Language).

Перевод словаря в DSL-формат был сделан в октябре-ноябре 2013 года. Словарь в данном формате состоит из 2-х файлов: собственно самого словаря и файла условных сокращений.

Доработка словаря

Безносикова Л.М., Айбабина Е.А., Коснырева Р.И. Коми-роч кывчукӧр (Коми-русский словарь) (2000)