Конвертер с нестандартной кодировки: различия между версиями
Denis (обсуждение | вклад) Нет описания правки |
Denis (обсуждение | вклад) |
||
Строка 22: | Строка 22: | ||
http://komikyv.ru/downloads/Converter.exe | http://komikyv.ru/downloads/Converter.exe | ||
Важно! На компьютере должен быть установлен офисный пакет Microsoft Office. | Важно! На компьютере должен быть установлен офисный пакет Microsoft Office: | ||
[[КОНВЕРТЕР1.png]] | |||
В случае успешного запуска откроется стартовое диалоговое окно программы: | |||
[[КОНВЕРТЕР2.png]] | |||
с помощью опции «Выбрать файл» открываем окно выбора файлов. Для примера рассмотрим конверсию файла, содержащего [http://udmgossovet.ru/press_-_tsentr/novosti_udm/detail.htm?itemid=424731 текст, взятый с сайта Государственного Совета Удмуртской Республики] (просмотрено 23 июня 2013 г.) и помещённый в файл в формате *.doc: | |||
[[КОНВЕРТЕР3.png]] | |||
Текст до конверсии: | |||
[[КОНВЕРТЕР4.png]] | |||
Текст после конверсии: | |||
[[КОНВЕРТЕР5.png]] | |||
Оригинальный файл сохраняется в виде копии с расширением *.old: | |||
[[КОНВЕРТЕР6.png]] | |||
==Онлайн-конвертер с нестандартной кодировки== | ==Онлайн-конвертер с нестандартной кодировки== |
Версия от 17:47, 23 июня 2013
Введение
Существует проблема, связанная с наличием удмуртских электронных текстов, набранных в различных нестандартных кодировках (дополнительные буквы удмуртского письма — Ӝӝ, Ӟӟ, Ӥӥ, Ӧӧ, Ӵӵ — располагаются в них на месте каких-то других знаков, чаще всего — на месте знаков восточно- и южнославянской письменности). Наиболее распространённой из нестандартных кодировок является кодировка Uralic, разработанная для набора текстов на уральских (финно-угорских) языках, использующих дополнительные знаки кириллицы. Знаки удмуртского письма располагаются в ней следующим образом:
Ӝ — на месте буквы Љ;
Ӟ — на месте буквы Њ;
Ӥ — на месте буквы Ћ;
Ӧ — на месте буквы Ќ;
Ӵ — на месте буквы Џ.
Для того, чтобы с текстам, набранными в кодировке Uralic, можно было работать с использованием современного программного обеспечения (в том числе и веб-приложений), необходима конверсия в кодировку, соответствующую международному стандарту Юникод.
Межрегиональная лаборатория информационной поддержки функционирования финно-угорских языков при Коми республиканской академии государственной службы и управления предлагает разработанное и оттестированное программное обеспечение, выполняющее такую конверсию.
Конвертер для MS Windows
Данный конвертер работает с файлами форматов *.doc, *.docx, *.rtf, *.odt файлов, сохраняя форматирование. Также возможна конверсия *.txt и *.html файлов.
Программа не требует инсталяции (установки) на компьютер. Достаточно скачать файл программы (или найти его на компакт-диске, папка «КОНВЕРТЕР»)
http://komikyv.ru/downloads/Converter.exe
Важно! На компьютере должен быть установлен офисный пакет Microsoft Office:
В случае успешного запуска откроется стартовое диалоговое окно программы:
с помощью опции «Выбрать файл» открываем окно выбора файлов. Для примера рассмотрим конверсию файла, содержащего текст, взятый с сайта Государственного Совета Удмуртской Республики (просмотрено 23 июня 2013 г.) и помещённый в файл в формате *.doc:
Текст до конверсии:
Текст после конверсии:
Оригинальный файл сохраняется в виде копии с расширением *.old:
Онлайн-конвертер с нестандартной кодировки
Онлайн-конвертер предназначен для автоматической замены нестандартных символов, обозначающих буквы коми, марийского и удмуртского языков, а также ошибочных символов латинского набора на кириллический стандарт Unicode:
http://komikyv.ru/converter/
В настоящее время сервис не поддерживает работу с файлами, осуществляя проверку правописания фрагментов текста, вставленных из буфера обмена. Сервис также не поддерживает форматирование текста.
В качестве примера рассмотрим конверсию текста в устаревшей кодировке, взятого с сайта Государственного Совета Удмуртской Республики (просмотрено 23 июня 2013 г.).
Текст до конверсии:
Текст после конверсии: