Конвертер с нестандартной кодировки

Материал из Wiki FU-Lab
Перейти к навигации Перейти к поиску

Введение

Существует проблема, связанная с наличием удмуртских электронных текстов, набранных в различных нестандартных кодировках (дополнительные буквы удмуртского письма — Ӝӝ, Ӟӟ, Ӥӥ, Ӧӧ, Ӵӵ — располагаются в них на месте каких-то других знаков, чаще всего — на месте знаков восточно- и южнославянской письменности). Наиболее распространённой из нестандартных кодировок является кодировка Uralic, разработанная для набора текстов на уральских (финно-угорских) языках, использующих дополнительные знаки кириллицы. Знаки удмуртского письма располагаются в ней следующим образом:

Ӝ — на месте буквы Љ;

Ӟ — на месте буквы Њ;

Ӥ — на месте буквы Ћ;

Ӧ — на месте буквы Ќ;

Ӵ — на месте буквы Џ.

Для того, чтобы с текстам, набранными в кодировке Uralic, можно было работать с использованием современного программного обеспечения (в том числе и веб-приложений), необходима конверсия в кодировку, соответствующую международному стандарту Юникод.

Межрегиональная лаборатория информационной поддержки функционирования финно-угорских языков при Коми республиканской академии государственной службы и управления предлагает разработанное и оттестированное программное обеспечение, выполняющее такую конверсию.

Конвертер для MS Windows

Данный конвертер работает с файлами форматов *.doc, *.docx, *.rtf, *.odt файлов, сохраняя форматирование. Также возможна конверсия *.txt и *.html файлов.

Программа не требует инсталяции (установки) на компьютер. Достаточно скачать файл программы (или найти его на компакт-диске, папка «КОНВЕРТЕР»)

http://komikyv.ru/downloads/Converter.exe

Важно! На компьютере должен быть установлен офисный пакет Microsoft Office.

Онлайн-конвертер с нестандартной кодировки

Онлайн-конвертер предназначен для автоматической замены нестандартных символов, обозначающих буквы коми, марийского и удмуртского языков, а также ошибочных символов латинского набора на кириллический стандарт Unicode:

http://komikyv.ru/converter/

В настоящее время сервис не поддерживает работу с файлами, осуществляя проверку правописания фрагментов текста, вставленных из буфера обмена. Сервис также не поддерживает форматирование текста.

Ссылки