Русско-марийский электронный словарь: различия между версиями

Материал из Wiki FU-Lab
Перейти к навигации Перейти к поиску
Нет описания правки
 
(не показано 19 промежуточных версий 1 участника)
Строка 2: Строка 2:


==Сканирование==
==Сканирование==
[[Файл:Muter_22.jpg|thumb|250px|Учаев 3.В., Захарова В.С. Русско-марийский словарь. (1999)]]
[[Файл:Muter_23.jpg|thumb|250px|Учаев 3.В., Захарова В.С. Русско-марийский словарь. (1999)]]
'''"Учаев 3.В., Захарова В.С. Русско-марийский словарь. Йошкар-Ола: Марийское книжное издательство, 1999. — 480 с.".'''
'''"Учаев 3.В., Захарова В.С. Русско-марийский словарь. Йошкар-Ола: Марийское книжное издательство, 1999. — 480 с.".'''


Строка 19: Строка 19:
'''безгрáмот||но''' ''нареч.'' 1. ''(неграмотно)'' моштыде; '''~о писать''' моштыде возаш; 2. ''(невежественно)'' палыде, шинчыде; '''~ость''' ''ж.'' 1. ''(неграмотность)'' лудын-возен моштыдымаш; 2. ''(невежественность)'' палыдымаш, шинчыдымаш; '''~ый''' ''прил.'' 1. ''(неграмотный)'' грамотдымо, тунемдыме. 2. ''(невежественный)'' палыдыме, шинчыдыме; 3. ''(малограмотный)'' шуко йоҥлышан.
'''безгрáмот||но''' ''нареч.'' 1. ''(неграмотно)'' моштыде; '''~о писать''' моштыде возаш; 2. ''(невежественно)'' палыде, шинчыде; '''~ость''' ''ж.'' 1. ''(неграмотность)'' лудын-возен моштыдымаш; 2. ''(невежественность)'' палыдымаш, шинчыдымаш; '''~ый''' ''прил.'' 1. ''(неграмотный)'' грамотдымо, тунемдыме. 2. ''(невежественный)'' палыдыме, шинчыдыме; 3. ''(малограмотный)'' шуко йоҥлышан.


Как видим, данная словарная статья содержит ещё 2 подстатьи: '''безграмотность''' и '''безграмотный'''. Тильды (которые нужны для  уменьшения объёма словарей в книжных вариантах) в электронной версии решено убрать с помощью [https://github.com/fu-lab/scripts скрипта на Python]; каждый перевод и иллюстративный пример - начать с новой строки; разными цветами выделить объяснения (толкования) в скобках на русском языке в строке переводов; также разными цветами отобразить иллюстративные переводы на русском и марийском языках. Ударения на названиях словарных статей ('''безгрáмотно''') на данном этапе пока решено опустить: [http://dict.komikyv.ru/index.php/term/10,228.xhtml см. на dict.komikyv.ru]
Как видим, данная словарная статья содержит ещё 2 подстатьи: '''безграмотность''' и '''безграмотный'''. Тильды (которые нужны для  уменьшения объёма словарей в книжных вариантах) в электронной версии решено убрать с помощью [https://github.com/fu-lab/scripts скрипта, написанного на Python]; каждый перевод и иллюстративный пример - начать с новой строки; разными цветами выделить объяснения (толкования) в скобках на русском языке в строке переводов; также разными цветами отобразить иллюстративные переводы на русском и марийском языках. Ударения в названиях словарных статей ('''безгрáмотно''') на данном этапе пока решено опустить: [http://dict.fu-lab.ru/index.php/term/10,220.xhtml см. на dict.fu-lab.ru]


==Изменение структуры словаря==
Наличие в словарных статьях ещё несколько подстатей, как в примере с "'''безграмотно'''", делает поиск неудобным для пользователей:


[[Файл:Rushla marla muter.png]]


[[Category:Марийский язык]]
По-этому было решено разбить подобные статьи не сколько словарных статей, например, из "'''безграмотно'''" делаем 3: "'''безграмотность'''", "'''безграмотный'''" и собственно "''''безграмотно'''".
 
А словарные статьи, подобные: "'''балка Ⅰ'''", "'''балка Ⅱ'''" - наоборот, объединяем:
 
[[Файл:Rushla marla muter 2.png]]
 
Ударения в данный момент показываем только при объединении статей типа '''вóльно''', '''вольнó'''; '''дорóгой''', '''дорогóй'''; '''му́ка''', '''мукá'''; '''пóра''', '''порá'''; '''у́же''', '''ужé''' ( хотя в дальнейшем можно и для всех словарных статей):
 
[[Файл:Rushla marla muter 3.png]]
 
 
[[Category:Марий йылме]]

Текущая версия от 21:39, 11 сентября 2017

Создание Русско-марийского электронного словаря

Сканирование

Учаев 3.В., Захарова В.С. Русско-марийский словарь. (1999)

"Учаев 3.В., Захарова В.С. Русско-марийский словарь. Йошкар-Ола: Марийское книжное издательство, 1999. — 480 с.".

Русско-марийский словарь содержит около 20000 слов. В него включена в основном вся лексика марийского литературного языка. В словарь не вошли многочисленные заимствованные из русского языка, лишь незначительно отличающиеся от исходного слова или полностью совпадающие с ним.

Словарь предназначен для учителей и учащихся школ Республики Марий Эл, а также для изучающих марийский язык.

Словарь отсканировала Митюкова Елизавета Валерьевна (E-mail: elizaveta_sem@mail.ru) - за что ей огромное спасибо!

Распознавание

Для распознавания была использована программа ABBYY FineReader с подключенным пользовательским словарём поддержки.

Структура словарных статей

На примере словарной статьи безграмотно:

безгрáмот||но нареч. 1. (неграмотно) моштыде; ~о писать моштыде возаш; 2. (невежественно) палыде, шинчыде; ~ость ж. 1. (неграмотность) лудын-возен моштыдымаш; 2. (невежественность) палыдымаш, шинчыдымаш; ~ый прил. 1. (неграмотный) грамотдымо, тунемдыме. 2. (невежественный) палыдыме, шинчыдыме; 3. (малограмотный) шуко йоҥлышан.

Как видим, данная словарная статья содержит ещё 2 подстатьи: безграмотность и безграмотный. Тильды (которые нужны для уменьшения объёма словарей в книжных вариантах) в электронной версии решено убрать с помощью скрипта, написанного на Python; каждый перевод и иллюстративный пример - начать с новой строки; разными цветами выделить объяснения (толкования) в скобках на русском языке в строке переводов; также разными цветами отобразить иллюстративные переводы на русском и марийском языках. Ударения в названиях словарных статей (безгрáмотно) на данном этапе пока решено опустить: см. на dict.fu-lab.ru

Изменение структуры словаря

Наличие в словарных статьях ещё несколько подстатей, как в примере с "безграмотно", делает поиск неудобным для пользователей:

Rushla marla muter.png

По-этому было решено разбить подобные статьи не сколько словарных статей, например, из "безграмотно" делаем 3: "безграмотность", "безграмотный" и собственно "'безграмотно".

А словарные статьи, подобные: "балка Ⅰ", "балка Ⅱ" - наоборот, объединяем:

Rushla marla muter 2.png

Ударения в данный момент показываем только при объединении статей типа вóльно, вольнó; дорóгой, дорогóй; му́ка, мукá; пóра, порá; у́же, ужé ( хотя в дальнейшем можно и для всех словарных статей):

Rushla marla muter 3.png