Сервис сортировки списков

Материал из Wiki FU-Lab
Перейти к навигации Перейти к поиску

Сервис сортировки списков предназначен для онлайн сортировки списков на региональных языках Российской Федерации с кириллическим алфавитом и языках коренных малочисленных народов Севера, имеющих символы юникода.

Параметры по умолчанию

По умолчанию сортировка списка производится по алфавиту данного языка с начала слова, причем регистр слова не учитывается, абсолютные повторы удаляются.

Сортировать можно как список слов, так и список словосочетаний либо предложений.

Исходный язык выбора по умолчанию - коми, в дальнейшем - последний язык, выбиравшийся пользователем.

Порядок работы

  1. Выбрать язык из числа предложенных.
  2. Вставить список в поле вставки.
  3. При небходимости изменить параметры и варианты сортировки.
  4. Нажать кнопу "Сортировать".

При нажатии кнопки "Сортировать" результат сортировки заменяет собой вставленный список. При этом предлагается два варианта дальнейших действий:

  • Если вы желаете вернуться к исходному виду списка, нажмите кнопку "Вернуть вставку"; список возвращается к состоянию до сортировки.
  • Если вы желаете скопировать упорядоченный список в буфер обмена, нажмите кнопку "Скопировать результат"; текст будет скопирован в буфер обмена, о чем будет выведено сообщение "Скопировано".

После копирования окно вставки автоматически очистится и будет готово к вставке нового списка.

Варианты сортировки

Если вы сортируете список СЛОВ, то можете выбрать следующие варианты сортировки:

  • Обратная сортировка — слова сортируются в порядке от последнего к первому, напр. от Я до А, от 100 до 1, от наиболее длинного слова к наиболее короткому.
  • Сортировка с конца слова — слова сортируются по буквам с конца слова. Это полезно при поиске рифм, при поиске однотипных суффиксов и т.п.
  • Сортировка по длине слова — слова сортируются по длине, по умолчанию от самого короткого к самому длинному. Одинаковые по длине слова располагаются в алфавитном порядке.

Параметры сортировки

  • Учитывать регистр букв — сначала будут идти все слова на данную букву в верхнем регистре, затем все слова на ту же букву в нижнем регистре.
  • Привести всё в нижний регистр — все буквы в словах будут написаны строчными буквами, а возможные повторы устранены.
  • Разбить строки на слова — функция для тех, кто перед сортировкой желает создать список словоформ из текста, включающего более одного слова в абзаце. При сортировке с данной опцией знаки препинания автоматически устраняются.

Языки сортировки

В настоящее время сортировка доступна для следующих языков:

Аварский, Адыгейский, Алтайский (литературный), Башкирский, Бурятский, Даргинский, Ингушский, Кабардино-Черкесский, Калмыцкий, Карачаево-Балкарский, Коми, Кумыкский, Лакский, Лезгинский, Марийский, Ненецкий, Ногайский, Осетинский, Табасаранский, Татарский, Тувинский, Удмуртский, Хакасский, Чеченский, Чувашский, Чукотский, Эвенкийский, Эвенский, Якутский.

Технические замечания

Для получения правильного результата сортировки необходимо использовать символы кириллического сегмента юникода, например:
Ӕӕ Ӓӓ Ӑӑ Ғғ Ҕҕ Ӗӗ Җҗ Ӝӝ Ҙҙ Ӟӟ Ӥӥ  Іі Јј Ҡҡ Ққ Ӄӄ Ԓԓ Ҥҥ Ңң Ӈӈ Ӧӧ Өө Ӫӫ  Ҫҫ Ўў Ӱӱ Ӳӳ Үү Һһ Ӌӌ Ӵӵ Ӹӹ Әә ʼ ʼʼ ӏ

Для некоторых символов, графически совпадающих в кириллице и латинице, в автоматическую сортировку встроена функция предварительной замены латинских букв кириллическими.  Список предустановленных замен: 
æ > ӕ
Æ > Ӕ
ä > ӓ
Ä > Ӓ
ă > ӑ
Ă > Ӑ
Ĕ > Ӗ
ĕ > ӗ
i > і
I > І
j > ј
J > Ј
ö > ӧ
Ö > Ӧ
ɵ > ө
Ɵ > Ө
ç > ҫ
Ç > Ҫ
ÿ > ӱ
h > һ
ҷ > ӌ
Ҷ > Ӌ
ə > ә
Ə > Ә

Для некоторых языков коренных малочисленных народов Севера (долганский, нанайский, эвенкийский, эвенский), гласные с макроном и гласные без макрона рассматриваются как одна и та же буква.

А̄ а̄
Е̄ е̄
Ё̄ ё̄
Ӣ ӣ
О̄ о̄
Ӯ, ӯ
Ы̄ ы̄
Э̄ э̄
Ю̄ ю̄
Я̄ я̄