Создание коми (пермяцкого) спеллера

На первом этапе были проиндексированы части речи.
Этот процесс был частично автоматизирован: глаголам и словам с типичными окончаниями индексы присваивались автоматически на формальных основаниях.
Около 15 тысяч слов пришлось индексировать в ручном режиме. Все эти слова были изначально помечены как существительные, а затем в ходе просмотра из списка были выделены лексемы, относящиеся к другим частям речи (прилагательное, числительное, наречие, местоимение, частица, союз, послелог).
В словник были механически добавлены коми имена, фамилии и топонимы из прежних списков.
Из коми-зырянского были добавлены русские нарицательные заимствования, а также общий массив имен, топонимов, названий организаций и уникальных объектов. В случаях, когда форма этих слов в зырянском варианте коми языка отличается от пермяцкой, были внесены исправления.
С учетом опыта по созданию зырянского спеллера, были выделены индексы для различных словоизменительных категорий: варианты спряжения и склонения. 
Было также решено реализовать идею с добавлением несловоизменительных индексов, обозначающих функциональный охват (общее, диалектное, книжное), орфографическую точность (стандарт, допустимый вариант, недопустимый вариант), исконность (русское слово adhoc, комизированная форма заимствования). Топонимы подразделены на несколько групп (коми топонимы, русские формы коми топонимов, некоми топонимы без коми эквивалентов, некоми топонимы с коми эквивалентами, коми варианты некоми топонимов).
Создание коми (пермяцкого) спеллера

Навигация

Поиск