Русско-марийский электронный словарь: различия между версиями
Admin (обсуждение | вклад) |
Admin (обсуждение | вклад) |
||
Строка 28: | Строка 28: | ||
По-этому было решено разбить подобные статьи не сколько словарных статей, например, из "'''безграмотно'''" делаем 3: "'''безграмотность'''", "'''безграмотный'''" и собственно "''''безграмотно'''". | По-этому было решено разбить подобные статьи не сколько словарных статей, например, из "'''безграмотно'''" делаем 3: "'''безграмотность'''", "'''безграмотный'''" и собственно "''''безграмотно'''". | ||
А словарные статьи, подобные: "'''балка Ⅰ'''", "'''балка Ⅱ'''" - наоборот, | А словарные статьи, подобные: "'''балка Ⅰ'''", "'''балка Ⅱ'''" - наоборот, объединияем: | ||
[[Файл:Rushla marla muter 2.png]] | [[Файл:Rushla marla muter 2.png]] | ||
[[Category:Марий йылме]] | [[Category:Марий йылме]] |
Версия от 01:07, 8 января 2016
Создание Русско-марийского электронного словаря
Сканирование
"Учаев 3.В., Захарова В.С. Русско-марийский словарь. Йошкар-Ола: Марийское книжное издательство, 1999. — 480 с.".
Русско-марийский словарь содержит около 20000 слов. В него включена в основном вся лексика марийского литературного языка. В словарь не вошли многочисленные заимствованные из русского языка, лишь незначительно отличающиеся от исходного слова или полностью совпадающие с ним.
Словарь предназначен для учителей и учащихся школ Республики Марий Эл, а также для изучающих марийский язык.
Словарь отсканировала Митюкова Елизавета Валерьевна (E-mail: elizaveta_sem@mail.ru) - за что ей огромное спасибо!
Распознавание
Для распознавания была использована программа ABBYY FineReader с подключенным пользовательским словарём поддержки.
Структура словарных статей
На примере словарной статьи безграмотно:
безгрáмот||но нареч. 1. (неграмотно) моштыде; ~о писать моштыде возаш; 2. (невежественно) палыде, шинчыде; ~ость ж. 1. (неграмотность) лудын-возен моштыдымаш; 2. (невежественность) палыдымаш, шинчыдымаш; ~ый прил. 1. (неграмотный) грамотдымо, тунемдыме. 2. (невежественный) палыдыме, шинчыдыме; 3. (малограмотный) шуко йоҥлышан.
Как видим, данная словарная статья содержит ещё 2 подстатьи: безграмотность и безграмотный. Тильды (которые нужны для уменьшения объёма словарей в книжных вариантах) в электронной версии решено убрать с помощью скрипта, написанного на Python; каждый перевод и иллюстративный пример - начать с новой строки; разными цветами выделить объяснения (толкования) в скобках на русском языке в строке переводов; также разными цветами отобразить иллюстративные переводы на русском и марийском языках. Ударения в названиях словарных статей (безгрáмотно) на данном этапе пока решено опустить: см. на dict.komikyv.ru
Изменение структуры словаря
Наличие в словарных статьях ещё несколько подстатей, как в примере с "безграмотно", делает поиск неудобным для пользователей:
По-этому было решено разбить подобные статьи не сколько словарных статей, например, из "безграмотно" делаем 3: "безграмотность", "безграмотный" и собственно "'безграмотно".
А словарные статьи, подобные: "балка Ⅰ", "балка Ⅱ" - наоборот, объединияем: