Конвертер с нестандартной кодировки: различия между версиями
Admin (обсуждение | вклад) (→Ссылки) |
Ӧньӧ Лав (обсуждение | вклад) |
||
(не показано 7 промежуточных версий 3 участников) | |||
Строка 2: | Строка 2: | ||
Существует проблема, связанная с наличием удмуртских электронных текстов, набранных в различных нестандартных кодировках (дополнительные буквы удмуртского письма — Ӝӝ, Ӟӟ, Ӥӥ, Ӧӧ, Ӵӵ — располагаются в них на месте каких-то других знаков, чаще всего — на месте знаков восточно- и южнославянской письменности). Наиболее распространённой из нестандартных кодировок является кодировка Uralic, разработанная для набора текстов на уральских (финно-угорских) языках, использующих дополнительные знаки кириллицы. Знаки удмуртского письма располагаются в ней следующим образом: | Существует проблема, связанная с наличием удмуртских электронных текстов, набранных в различных нестандартных кодировках (дополнительные буквы удмуртского письма — Ӝӝ, Ӟӟ, Ӥӥ, Ӧӧ, Ӵӵ — располагаются в них на месте каких-то других знаков, чаще всего — на месте знаков восточно- и южнославянской письменности). Наиболее распространённой из нестандартных кодировок является кодировка Uralic, разработанная для набора текстов на уральских (финно-угорских) языках, использующих дополнительные знаки кириллицы. Знаки удмуртского письма располагаются в ней следующим образом: | ||
Ӝ — на месте буквы Љ; | *Ӝ — на месте буквы Љ; | ||
*Ӟ — на месте буквы Њ; | |||
Ӟ — на месте буквы Њ; | *Ӥ — на месте буквы Ћ; | ||
*Ӧ — на месте буквы Ќ; | |||
Ӥ — на месте буквы Ћ; | *Ӵ — на месте буквы Џ. | ||
Ӧ — на месте буквы Ќ; | |||
Ӵ — на месте буквы Џ. | |||
Для того, чтобы с текстам, набранными в кодировке Uralic, можно было работать с использованием современного программного обеспечения (в том числе и веб-приложений), необходима конверсия в кодировку, соответствующую международному стандарту Юникод. | Для того, чтобы с текстам, набранными в кодировке Uralic, можно было работать с использованием современного программного обеспечения (в том числе и веб-приложений), необходима конверсия в кодировку, соответствующую международному стандарту Юникод. | ||
Межрегиональная лаборатория | Межрегиональная лаборатория FU-Lab предлагает разработанное и оттестированное программное обеспечение, выполняющее такую конверсию. | ||
==Конвертер для MS Windows== | ==Конвертер для MS Windows== | ||
Строка 20: | Строка 16: | ||
Программа не требует инсталяции (установки) на компьютер. Достаточно скачать файл программы (или найти его на компакт-диске, папка «КОНВЕРТЕР») | Программа не требует инсталяции (установки) на компьютер. Достаточно скачать файл программы (или найти его на компакт-диске, папка «КОНВЕРТЕР») | ||
http://komikyv. | http://vidzanin.komikyv.com/programms/Converter.exe | ||
Важно! На компьютере должен быть установлен офисный пакет Microsoft Office: | Важно! На компьютере должен быть установлен офисный пакет Microsoft Office: | ||
Строка 48: | Строка 44: | ||
==Онлайн-конвертер с нестандартной кодировки== | ==Онлайн-конвертер с нестандартной кодировки== | ||
Онлайн-конвертер предназначен для автоматической замены нестандартных символов, обозначающих буквы коми, марийского и удмуртского языков, а также ошибочных символов латинского набора на кириллический стандарт Unicode: | Онлайн-конвертер предназначен для автоматической замены нестандартных символов, обозначающих буквы коми, марийского и удмуртского языков, а также ошибочных символов латинского набора на кириллический стандарт Unicode: | ||
https://fu-lab.ru/converter | |||
В настоящее время сервис не поддерживает работу с файлами, осуществляя проверку правописания фрагментов текста, вставленных из буфера обмена. Сервис также не поддерживает форматирование текста. | В настоящее время сервис не поддерживает работу с файлами, осуществляя проверку правописания фрагментов текста, вставленных из буфера обмена. Сервис также не поддерживает форматирование текста. | ||
Строка 68: | Строка 64: | ||
* [http://wiki.komikyv.ru/index.php/%D0%A3%D0%B4%D0%BC%D1%83%D1%80%D1%82%D1%81%D0%BA%D0%BE-%D1%80%D1%83%D1%81%D1%81%D0%BA%D0%B8%D0%B9_%D1%8D%D0%BB%D0%B5%D0%BA%D1%82%D1%80%D0%BE%D0%BD%D0%BD%D1%8B%D0%B9_%D1%81%D0%BB%D0%BE%D0%B2%D0%B0%D1%80%D1%8C Удмуртско-русский электронный словарь] | * [http://wiki.komikyv.ru/index.php/%D0%A3%D0%B4%D0%BC%D1%83%D1%80%D1%82%D1%81%D0%BA%D0%BE-%D1%80%D1%83%D1%81%D1%81%D0%BA%D0%B8%D0%B9_%D1%8D%D0%BB%D0%B5%D0%BA%D1%82%D1%80%D0%BE%D0%BD%D0%BD%D1%8B%D0%B9_%D1%81%D0%BB%D0%BE%D0%B2%D0%B0%D1%80%D1%8C Удмуртско-русский электронный словарь] | ||
* [http://wiki.komikyv.ru/index.php/Tahoma Обновление шрифтов Tahoma] | * [http://wiki.komikyv.ru/index.php/Tahoma Обновление шрифтов Tahoma] | ||
*[http://komikyv.ru/pdf/udmurtskaya-pismennost-vypusk-i.pdf Удмуртская письменность. Выпуск I] | |||
[[Category: | [[Category:Инструментарий (коми кыв)]] | ||
[[Category: | [[Category:Марий йылме]] | ||
[[Category: | [[Category:Удмурт кыл]] | ||
[[Категория:Проект Ӟ]] |
Текущая версия от 11:39, 6 июня 2020
Введение
Существует проблема, связанная с наличием удмуртских электронных текстов, набранных в различных нестандартных кодировках (дополнительные буквы удмуртского письма — Ӝӝ, Ӟӟ, Ӥӥ, Ӧӧ, Ӵӵ — располагаются в них на месте каких-то других знаков, чаще всего — на месте знаков восточно- и южнославянской письменности). Наиболее распространённой из нестандартных кодировок является кодировка Uralic, разработанная для набора текстов на уральских (финно-угорских) языках, использующих дополнительные знаки кириллицы. Знаки удмуртского письма располагаются в ней следующим образом:
- Ӝ — на месте буквы Љ;
- Ӟ — на месте буквы Њ;
- Ӥ — на месте буквы Ћ;
- Ӧ — на месте буквы Ќ;
- Ӵ — на месте буквы Џ.
Для того, чтобы с текстам, набранными в кодировке Uralic, можно было работать с использованием современного программного обеспечения (в том числе и веб-приложений), необходима конверсия в кодировку, соответствующую международному стандарту Юникод.
Межрегиональная лаборатория FU-Lab предлагает разработанное и оттестированное программное обеспечение, выполняющее такую конверсию.
Конвертер для MS Windows
Данный конвертер работает с файлами форматов *.doc, *.docx, *.rtf, *.odt файлов, сохраняя форматирование. Также возможна конверсия *.txt и *.html файлов.
Программа не требует инсталяции (установки) на компьютер. Достаточно скачать файл программы (или найти его на компакт-диске, папка «КОНВЕРТЕР»)
http://vidzanin.komikyv.com/programms/Converter.exe
Важно! На компьютере должен быть установлен офисный пакет Microsoft Office:
В случае успешного запуска откроется стартовое диалоговое окно программы:
С помощью опции «Выбрать файл» открываем окно выбора файлов. Для примера рассмотрим конверсию файла, содержащего текст, взятый с сайта Государственного Совета Удмуртской Республики (просмотрено 23 июня 2013 г.) и помещённый в файл в формате *.doc:
Текст до конверсии:
Текст после конверсии:
Оригинальный файл сохраняется в виде копии с расширением *.old:
Онлайн-конвертер с нестандартной кодировки
Онлайн-конвертер предназначен для автоматической замены нестандартных символов, обозначающих буквы коми, марийского и удмуртского языков, а также ошибочных символов латинского набора на кириллический стандарт Unicode:
https://fu-lab.ru/converter
В настоящее время сервис не поддерживает работу с файлами, осуществляя проверку правописания фрагментов текста, вставленных из буфера обмена. Сервис также не поддерживает форматирование текста.
В качестве примера рассмотрим конверсию текста в устаревшей кодировке, взятого с сайта Государственного Совета Удмуртской Республики (просмотрено 23 июня 2013 г.).
Текст до конверсии:
Текст после конверсии: