Удмурт спеллерысь индексация: различия между версиями

Материал из Wiki FU-Lab
Перейти к навигации Перейти к поиску
Нет описания правки
Строка 9: Строка 9:
  D1 наречия удмуртские
  D1 наречия удмуртские
  D3 наречия русские
  D3 наречия русские
  E1 - категория состояния
  E1 категория состояния
  F1 фамилии
  F1 фамилии
  F2 удмуртские имена и прозвища, удмуртизированные формы имен
  F2 удмуртские имена и прозвища, удмуртизированные формы имен

Версия от 20:35, 23 октября 2023

Удмурт спеллере индексация

Индексация-2023

A1 прилагательные с парадигмой
А2 прилагательные без парадигмы типа огъяросси
В1 послелоги
C1 союзы
D1 наречия удмуртские
D3 наречия русские
E1 категория состояния
F1 фамилии
F2 удмуртские имена и прозвища, удмуртизированные формы имен
F3 неудмуртские имена и прозвища
F5 отчества
F6 клички животных
G1 -гес, -гем
I1 междометия 
K1 корка, куала
J1 название фирм, организаций, марок, брендов
L1 числительные
L2 числительные - склонение
L3 числительные - непонятки
L4 числительные-местоимения
L5 числительные - ог-
M1 местоимения 
M2 склонение местоимений типа: ма-и, та-осыд, со-лэн, котьма-идлэн, олома-из
N1 основное склонение
N2 склонение сущ. с ы вместо э (пельы, нылыз, киыд, мылкыды)
N3 склонение сущ. на -ие -ия (Россия, предприятие)
N4 склонение сущ. только во мн. ч. (можгаос)
N5 склонение сущ. е, йӧ, кӧ, кы, лы, ты,
N7 добавочные формы для воршуд нимъёс
N8 склонение "мыш(-к-)"
N9 склонение "син(-м-)"
P1 частицы
O1 орфографический стандарт
O2 допустимый вариант написания
O3 недопустимое написание
Q1 склонение аббревиатур
Q2 инографичное
Q3 сокращения с точкой
Q4 сокращения без точки
R1 русское заимствование
R2 русское заимствование (из словаря иностранных слов)
R3 производное от имени собственного
T1 удмуртский топоним Удмуртии и худ. лит-ры
T2 неудмуртский топоним Удмуртии
T3 топонимы вне Удмуртии без удмуртских эквивалентов
T4 топонимы вне Удмуртии с удмуртскими эквивалентами 
T5 удмуртские варианты топонимов вне Удмуртии
T6 первая часть составного топонима
T7 оттопонимические прилагательные на ой
U1 основная исконная лексика (не реализовано)
U2 удм. неологизм (не реализовано)
U3 диалектное слово (не реализовано)
V1 глаголы 1 спряжения
V2 глаголы 2 спряжения
V3 глаголы 1 спряжения на -йыны
W1 часть составного глагола, неизм. часть глагольных сочетаний
W2 отрицатель
W3 предикатив
Z1 звукоподражания
Z2 звукоподр. повторы
Z9 непоняткаос

Изменения 2023

  • Изменены некоторые индексы (в мнемотехнических целях).
  • Добавлены индексы для стилистических помет O, R но U, не связанные со словоизменением. Могут быть полезны при добавлении или изъятии отдельных форм из стандартного спеллера.
  • При прилагательных дополнительный индекс наречий убран (похоже, он функционально избыточен).
  • Минимизированы двойные перенаправления, что связано с соответствующими ограничениями в hunspell (Напр. для слов с A1 в dic добавлен N1).
  • Выделены несколько групп существительных по типу склонения (N).
  • Дополнены глагольные парадигмы в 1 и 2 спряжениях.
  • Для некоторых групп числительных сделаны парадигмы.
  • Топонимы и имена поделены на несколько групп.
  • Разработано склонение для аббревиатур Q1.
  • Непонятные случаи собраны в Z9.

Возможные направления дальнейшего развития

  • Переместить все прилагательные, не имеющие парадигмы, из A1 в A2.
  • Распределить омонимичные слова по разным частям речи.
  • Выделить серийные послелоги (послеложные наречия) в отдельный индекс и сделать парадигму.
  • В наречиях разделить изменяемые и неизменяемые наречия; для изменяемых также попробовать сделать парадигму.
  • Для некоторых разрядов местоимений попробовать создать парадигмы.
  • Возможно по примеру индекса для -гес/-гем создать индекс для -эз/-зэ (в коми реализовано).
  • Подумать, нужны ли R3 и T7, если нет, то объединить с N1R1 и A1R1 (в основном).
  • В T1 решить: топоним Удмуртии или топоним удмуртского мира?
  • При пополнении Z9 смотреть, можно ли выделить закономерности и создать правило.
  • Все топонимы, похоже, могут писаться со строчной буквы, когда они являются определением (сейчас входят в А2) или обозначают жителей во мн. ч. (N4). Решить, будет ли полезнее, если все слова с индексом T дать со строчной буквы.
  • Из N1 выделить в R1 оставшиеся русские заимствования.
  • Возможно, русские заимствования стоило бы разделить на совпадающие с русской формой и изменившиеся в соответствии с удмуртским произношением.
  • Возможно в J распределить по отдельным группам названия компаний, коллективов, брендов, марок, лекарств, названия кораблей и т.п.
  • Отметить нестандартные варианты написания (O2 и O3).
  • Отметить лексические диалектизмы и малоизвестные неологизмы (U2 и U3).
  • После принятия в 2024 году новых правил удмуртской орфографии согласовать с ними правила в спелл-чекере.

Примечания