Сервис сортировки списков

Материал из Wiki FU-Lab
Перейти к навигации Перейти к поиску

Сервис сортировки предназначен для сортировки списков на региональных языках Российской Федерации с кириллическим алфавитом и некоторых языках коренных малочисленных народов Севера, имеющих символы юникода.

Параметры по умолчанию

По умолчанию сортировка списка производится по алфавиту данного языка с начала слова, причем регистр слова не учитывается, абсолютные повторы удаляются.

Сортировать можно как список слов, так и список словосочетаний либо предложений.

Исходный язык выбора по умолчанию - коми, в дальнейшем - последний язык, выбиравшийся пользователем.

Порядок работы

1. Выбрать язык из числа предложенных.
2. Вставить список в поле вставки.
3. При небходимости изменить параметры и варианты сортировки.
4. Нажать кнопу "Сортировать". 

При нажатии кнопки "Сортировать" результат сортировки заменяет собой вставленный список. 
При этом предлагается два варианта дальнейших действий:
• Если вы желается вернуться к исходному виду списка, нажмите "Вернуть вставку"; список возвращается к состоянию до сортировки.
• Если вы желается скопировать упорядоченный список в буфер обмена, нажмите кнопку "Скопировать результат"; текст будет скопирован в буфер обмена, о чем будет выведено сообщение "Скопировано".

После копирования окно вставки автоматически очищается и готово к вставке нового списка.

Варианты сортировки

  • Обратная сортировка - слова сортируются в порядке от последнего к первому, напр. от Я до А, от 100 до 1, от наиболее длинного слова к наиболее короткому.
  • Сортировка с конца слова - слова сортируются по буквам с конца слова. Это полезно при поиске рифм, при поиске однотипных суффиксов и т.п.
  • Сортировка по длине слова - слова сортируются по длине, по умолчанию от самого короткого к самому длинному. Одинаковые по длине слова располагаются в алфавитном порядке.

Параметры сортировки

  • Учитывать регистр букв — сначала будут идти все слова на данную букву в верхнем регистре, затем все слова на ту же букву в нижнем регистре.
  • Привести всё в нижний регистр — все буквы в словах будут написаны строчными буквами, а возможные повторы устранены.
  • Разбить строки на слова — функция для тех, кто перед сортировкой желает создать список словоформ текста, включающего более одного слова в абзаце. При сортировке с данной опцией знаки препинания автоматически устраняются.

Технические замечания

Для получения правильного результата сортировки необходимо использовать символы кириллического сегмента юникода, например:

Ӕӕ Ӓӓ Ӑӑ Ғғ Ҕҕ Ӗӗ Җҗ Ӝӝ Ҙҙ Ӟӟ Ӥӥ
Іі Јј Ҡҡ Ққ Ӄӄ Ԓԓ Ҥҥ Ңң Ӈӈ Ӧӧ Өө Ӫӫ
Ҫҫ Ўў Ӱӱ Ӳӳ Үү Һһ Ӌӌ Ӵӵ Ӹӹ Әә ʼ ʼʼ ӏ

Для некоторых символов, графически совпадающих в кириллице и латинице, в сортировку встроена функция предварительной замены латинских букв кириллическими.
Список включенных замен:

æ > ӕ
Æ > Ӕ
ä > ӓ
Ä > Ӓ
ă > ӑ
Ă > Ӑ
Ĕ > Ӗ
ĕ > ӗ
i > і
I > І
j > ј
J > Ј
ö > ӧ
Ö > Ӧ
ɵ > ө
Ɵ > Ө
ç > ҫ
Ç > Ҫ
ÿ > ӱ
h > һ
ҷ > ӌ
Ҷ > Ӌ
ə > ә
Ə > Ә

Для некторых языков Севера (долганский, нанайский, эвенкийский, эвенский), гласные с макроном и гласные без макрона рассматриваются как одна и та же буква.

А̄ а̄
Е̄ е̄
Ё̄ ё̄
Ӣ ӣ
О̄ о̄
Ӯ, ӯ
Ы̄ ы̄
Э̄ э̄
Ю̄ ю̄
Я̄ я̄