Удмурт спеллерысь индексация: различия между версиями

Материал из Wiki FU-Lab
Перейти к навигации Перейти к поиску
 
(не показано 8 промежуточных версий этого же участника)
Строка 31: Строка 31:
  N4 склонение сущ. только во мн. ч. (можгаос)
  N4 склонение сущ. только во мн. ч. (можгаос)
  N5 склонение сущ. е, йӧ, кӧ, кы, лы, ты,
  N5 склонение сущ. е, йӧ, кӧ, кы, лы, ты,
  N7 добавочные формы для воршуд нимъёс
  N7 добавочные формы для воршуд нимъёс и слов на -пал
  N8 склонение "мыш(-к-)"
  N8 склонение "мыш(-к-)"
  N9 склонение "син(-м-)"
  N9 склонение "син(-м-)"
Строка 44: Строка 44:
  R1 русское заимствование
  R1 русское заимствование
  R2 русское заимствование (из словаря иностранных слов)
  R2 русское заимствование (из словаря иностранных слов)
  R3 производное от имени собственного
  R3 названия народов и жителей нас. пунктов
  T1 удмуртский топоним Удмуртии и худ. лит-ры
  T1 удмуртский топоним Удмуртии и худ. лит-ры
  T2 неудмуртский топоним Удмуртии
  T2 неудмуртский топоним Удмуртии
Строка 65: Строка 65:
  Z9 непоняткаос
  Z9 непоняткаос


==Изменения 2023==
==Суть изменений 2023==
*Изменены некоторые индексы (в мнемотехнических целях).
*Изменены некоторые индексы (в мнемотехнических целях).
*Добавлены индексы для стилистических помет O, R но U, не связанные со словоизменением. Могут быть полезны при добавлении или изъятии отдельных форм из стандартного спеллера.
*Добавлены индексы для стилистических помет O, R но U, не связанные со словоизменением. Могут быть полезны при добавлении или изъятии отдельных форм из стандартного спеллера.
Строка 90: Строка 90:
*Из N1 выделить в R1 оставшиеся русские заимствования.
*Из N1 выделить в R1 оставшиеся русские заимствования.
*Возможно, русские заимствования стоило бы разделить на совпадающие с русской формой и изменившиеся в соответствии с удмуртским произношением.
*Возможно, русские заимствования стоило бы разделить на совпадающие с русской формой и изменившиеся в соответствии с удмуртским произношением.
*Можно отдельно обозначить такие заимствования, которые имеют широко известные удмуртские эквиваленты.
*Возможно в J распределить по отдельным группам названия компаний, коллективов, брендов, марок, лекарств, названия кораблей и т.п.
*Возможно в J распределить по отдельным группам названия компаний, коллективов, брендов, марок, лекарств, названия кораблей и т.п.
*Отметить нестандартные варианты написания (O2 и O3).
*Отметить нестандартные варианты написания (O2 и O3).
*Отметить лексические диалектизмы и малораспространенные неологизмы (U2 и U3).
*Отметить лексические диалектизмы и малораспространенные неологизмы (U2 и U3).
*После принятия в 2024 году новых правил удмуртской орфографии согласовать с ними правила в спелл-чекере.
*Прояснить вопрос со стандартизацией удмуртских топонимов.
*После официального принятия в 2024 году новых правил удмуртской орфографии и орфографического словаря согласовать с ними правила в спелл-чекере.


==Примечания по словнику==
==Примечания по словнику==
  Добавлены слова из учебников по географии, ботанике и зоологии 1930-40 годов, лексической базы парсера Национального корпуса удмуртского языка ("Маша"), газеты "Удмурт дунне" за 1997, 1998 и 2002 гг. (из корпуса "Турку-Ижевск"), а также частично актуальная лексика из последних новостных текстов ИА "Удмуртия" и некоторых текстов газеты "Удмурт дунне", размещенных в социальной сети "ВКонтакте".
  Добавлены слова из учебников по географии, ботанике и зоологии 1930-40 годов, лексической базы парсера Национального корпуса удмуртского языка ("Маша"), газеты "Удмурт дунне" за 1997, 1998 и 2002 гг. (по корпусу "Турку-Ижевск"), а также, частично, актуальная лексика из последних новостных текстов ИА "Удмуртия" и некоторых текстов газеты "Удмурт дунне", размещенных в социальной сети "ВКонтакте".
Добавлена новая лексика из периодических изданий последних лет (фамилии, типичные топонимы, русские неологизмы).

Текущая версия от 20:58, 7 ноября 2023

Удмурт спеллере индексация

Индексация-2023

A1 прилагательные с парадигмой
А2 прилагательные без парадигмы типа огъяросси
В1 послелоги
C1 союзы
D1 наречия удмуртские
D3 наречия русские
E1 категория состояния
F1 фамилии
F2 удмуртские имена и прозвища, удмуртизированные формы имен
F3 неудмуртские имена и прозвища
F5 отчества
F6 клички животных
G1 -гес, -гем
I1 междометия 
K1 корка, куала
J1 название фирм, организаций, марок, брендов
L1 числительные
L2 числительные - склонение
L3 числительные - непонятки
L4 числительные-местоимения
L5 числительные - ог-
M1 местоимения 
M2 склонение местоимений типа: ма-и, та-осыд, со-лэн, котьма-идлэн, олома-из
N1 основное склонение
N2 склонение сущ. с ы вместо э (пельы, нылыз, киыд, мылкыды)
N3 склонение сущ. на -ие -ия (Россия, предприятие)
N4 склонение сущ. только во мн. ч. (можгаос)
N5 склонение сущ. е, йӧ, кӧ, кы, лы, ты,
N7 добавочные формы для воршуд нимъёс и слов на -пал
N8 склонение "мыш(-к-)"
N9 склонение "син(-м-)"
P1 частицы
O1 орфографический стандарт
O2 допустимый вариант написания
O3 недопустимое написание
Q1 склонение аббревиатур
Q2 инографичное
Q3 сокращения с точкой
Q4 сокращения без точки
R1 русское заимствование
R2 русское заимствование (из словаря иностранных слов)
R3 названия народов и жителей нас. пунктов
T1 удмуртский топоним Удмуртии и худ. лит-ры
T2 неудмуртский топоним Удмуртии
T3 топонимы вне Удмуртии без удмуртских эквивалентов
T4 топонимы вне Удмуртии с удмуртскими эквивалентами 
T5 удмуртские варианты топонимов вне Удмуртии
T6 первая часть составного топонима
T7 оттопонимические прилагательные на ой
U1 основная исконная лексика (не реализовано)
U2 удм. неологизм (не реализовано)
U3 диалектное слово (не реализовано)
V1 глаголы 1 спряжения
V2 глаголы 2 спряжения
V3 глаголы 1 спряжения на -йыны
W1 часть составного глагола, неизм. часть глагольных сочетаний
W2 отрицатель
W3 предикатив
Z1 звукоподражания
Z2 звукоподр. повторы
Z9 непоняткаос

Суть изменений 2023

  • Изменены некоторые индексы (в мнемотехнических целях).
  • Добавлены индексы для стилистических помет O, R но U, не связанные со словоизменением. Могут быть полезны при добавлении или изъятии отдельных форм из стандартного спеллера.
  • При прилагательных дополнительный индекс наречий убран (похоже, он функционально избыточен).
  • Минимизированы двойные перенаправления, что связано с соответствующими ограничениями в hunspell (напр. для слов с A1 в dic добавлен N1).
  • Выделены несколько групп существительных по типу склонения (N).
  • Дополнены глагольные парадигмы в 1 и 2 спряжениях.
  • Для некоторых групп числительных сделаны парадигмы.
  • Топонимы и имена поделены на несколько групп.
  • Разработано склонение для аббревиатур Q1.
  • Непонятные случаи собраны в Z9.

Возможные направления дальнейшего развития

  • Переместить все прилагательные, не имеющие парадигмы, из A1 в A2.
  • Распределить омонимичные слова по разным частям речи.
  • Выделить серийные послелоги (послеложные наречия) в отдельный индекс и сделать парадигму.
  • В наречиях разделить изменяемые и неизменяемые наречия; для изменяемых также попробовать сделать парадигму.
  • Для некоторых разрядов местоимений попробовать создать парадигмы.
  • Возможно по примеру индекса для -гес/-гем создать индекс для -эз/-зэ (в коми реализовано).
  • Подумать, нужны ли R3 и T7, если нет, то объединить с N1R1 и A1R1 (в основном).
  • В T1 решить: топоним Удмуртии или топоним удмуртского мира?
  • При пополнении Z9 смотреть, можно ли выделить закономерности и создать правило.
  • Все топонимы, похоже, могут писаться со строчной буквы, когда они являются определением (сейчас входят в А2) или обозначают жителей во мн. ч. (N4). Решить, будет ли полезнее, если все слова с индексом T дать со строчной буквы.
  • Из N1 выделить в R1 оставшиеся русские заимствования.
  • Возможно, русские заимствования стоило бы разделить на совпадающие с русской формой и изменившиеся в соответствии с удмуртским произношением.
  • Можно отдельно обозначить такие заимствования, которые имеют широко известные удмуртские эквиваленты.
  • Возможно в J распределить по отдельным группам названия компаний, коллективов, брендов, марок, лекарств, названия кораблей и т.п.
  • Отметить нестандартные варианты написания (O2 и O3).
  • Отметить лексические диалектизмы и малораспространенные неологизмы (U2 и U3).
  • Прояснить вопрос со стандартизацией удмуртских топонимов.
  • После официального принятия в 2024 году новых правил удмуртской орфографии и орфографического словаря согласовать с ними правила в спелл-чекере.

Примечания по словнику

Добавлены слова из учебников по географии, ботанике и зоологии 1930-40 годов, лексической базы парсера Национального корпуса удмуртского языка ("Маша"), газеты "Удмурт дунне" за 1997, 1998 и 2002 гг. (по корпусу "Турку-Ижевск"), а также, частично, актуальная лексика из последних новостных текстов ИА "Удмуртия" и некоторых текстов газеты "Удмурт дунне", размещенных в социальной сети "ВКонтакте".
Добавлена новая лексика из периодических изданий последних лет (фамилии, типичные топонимы, русские неологизмы).