Конвертер с нестандартной кодировки: различия между версиями

Материал из Wiki FU-Lab
Перейти к навигации Перейти к поиску
(Новая страница: «==Конвертер с нестандартной кодировки для ОС Windows== Данный конвертер предназначен для пол…»)
 
 
(не показана 21 промежуточная версия 3 участников)
Строка 1: Строка 1:
==Конвертер с нестандартной кодировки для ОС Windows==
==Введение==
Данный конвертер предназначен для пользователей ОС Windows. В отличие от онлайн-конвертера программа сохраняет форматирование документов *.doc, *.docx, *.rtf, *.odt файлов, также возможна конвертация *.txt и *.html файлов.
Существует проблема, связанная с наличием удмуртских электронных текстов, набранных в различных нестандартных кодировках (дополнительные буквы удмуртского письма — Ӝӝ, Ӟӟ, Ӥӥ, Ӧӧ, Ӵӵ — располагаются в них на месте каких-то других знаков, чаще всего — на месте знаков восточно- и южнославянской письменности). Наиболее распространённой из нестандартных кодировок является кодировка Uralic, разработанная для набора текстов на уральских (финно-угорских) языках, использующих дополнительные знаки кириллицы. Знаки удмуртского письма располагаются в ней следующим образом:


Программа не требует инсталяции (установки) на компьютер. Достаточно скачать и пользоваться конвертером:
*Ӝ — на месте буквы Љ;
http://komikyv.ru/downloads/Converter.exe
*Ӟ — на месте буквы Њ;
*Ӥ — на месте буквы Ћ;
*Ӧ — на месте буквы Ќ;
*Ӵ — на месте буквы Џ.


На компьютере должен быть установлен офисный пакет Microsoft Office.
Для того, чтобы с текстам, набранными в кодировке Uralic, можно было работать с использованием современного программного обеспечения (в том числе и веб-приложений), необходима конверсия в кодировку, соответствующую международному стандарту Юникод.
 
Межрегиональная лаборатория FU-Lab предлагает разработанное и оттестированное программное обеспечение, выполняющее такую конверсию.
 
==Конвертер для MS Windows==
Данный конвертер работает с файлами форматов *.doc, *.docx, *.rtf, *.odt файлов, сохраняя форматирование. Также возможна конверсия *.txt и *.html файлов.
 
Программа не требует инсталяции (установки) на компьютер. Достаточно скачать файл программы (или найти его на компакт-диске, папка «КОНВЕРТЕР»)
http://vidzanin.komikyv.com/programms/Converter.exe
 
Важно! На компьютере должен быть установлен офисный пакет Microsoft Office:
 
[[Файл:КОНВЕРТЕР1.png]]
 
В случае успешного запуска откроется стартовое диалоговое окно программы:
 
[[Файл:КОНВЕРТЕР2.png]]
 
С помощью опции «Выбрать файл» открываем окно выбора файлов. Для примера рассмотрим конверсию файла, содержащего [http://udmgossovet.ru/press_-_tsentr/novosti_udm/detail.htm?itemid=424731 текст, взятый с сайта Государственного Совета Удмуртской Республики] (просмотрено 23 июня 2013 г.) и помещённый в файл в формате *.doc:
 
[[Файл:КОНВЕРТЕР3.png]]
 
Текст до конверсии:
 
[[Файл:КОНВЕРТЕР4.png]]
 
Текст после конверсии:
 
[[Файл:КОНВЕРТЕР5.png]]
 
Оригинальный файл сохраняется в виде копии с расширением *.old:
 
[[Файл:КОНВЕРТЕР6.png]]
 
==Онлайн-конвертер с нестандартной кодировки==
Онлайн-конвертер предназначен для автоматической замены нестандартных символов, обозначающих буквы коми, марийского и удмуртского языков, а также ошибочных символов латинского набора на кириллический стандарт Unicode:
https://fu-lab.ru/converter
 
В настоящее время сервис не поддерживает работу с файлами, осуществляя проверку правописания фрагментов текста, вставленных из буфера обмена. Сервис также не поддерживает форматирование текста.
 
В качестве примера рассмотрим конверсию текста в устаревшей кодировке, взятого [http://udmgossovet.ru/press_-_tsentr/novosti_udm/detail.htm?itemid=424646 с сайта Государственного Совета Удмуртской Республики] (просмотрено 23 июня 2013 г.).
 
Текст до конверсии:
 
[[Файл:Текст с сайта госсовета до конверсии.jpg]]
 
Текст после конверсии:
 
[[Файл:Текст с сайта госсовета после конверсии.jpg]]
 
==Ссылки==
* [http://wiki.komikyv.ru/index.php/%D0%A3%D0%B4%D0%BC%D1%83%D1%80%D1%82%D1%81%D0%BA%D0%B8%D0%B9_%D1%8F%D0%B7%D1%8B%D0%BA Удмуртский язык]
* [http://wiki.komikyv.ru/index.php/%D0%A3%D0%B4%D0%BC%D1%83%D1%80%D1%82%D1%81%D0%BA%D0%B0%D1%8F_%D1%80%D0%B0%D1%81%D0%BA%D0%BB%D0%B0%D0%B4%D0%BA%D0%B0_%D0%BA%D0%BB%D0%B0%D0%B2%D0%B8%D0%B0%D1%82%D1%83%D1%80%D1%8B Удмуртская раскладка клавиатуры]
* [http://wiki.komikyv.ru/index.php/Проверка_правописания_удмуртского_языка Проверка правописания удмуртского языка]
* [http://wiki.komikyv.ru/index.php/%D0%A3%D0%B4%D0%BC%D1%83%D1%80%D1%82%D1%81%D0%BA%D0%BE-%D1%80%D1%83%D1%81%D1%81%D0%BA%D0%B8%D0%B9_%D1%8D%D0%BB%D0%B5%D0%BA%D1%82%D1%80%D0%BE%D0%BD%D0%BD%D1%8B%D0%B9_%D1%81%D0%BB%D0%BE%D0%B2%D0%B0%D1%80%D1%8C Удмуртско-русский электронный словарь]
* [http://wiki.komikyv.ru/index.php/Tahoma Обновление шрифтов Tahoma]
*[http://komikyv.ru/pdf/udmurtskaya-pismennost-vypusk-i.pdf Удмуртская письменность. Выпуск I]
 
 
[[Category:Инструментарий (коми кыв)]]
[[Category:Марий йылме]]
[[Category:Удмурт кыл]]
[[Категория:Проект Ӟ]]

Текущая версия от 11:39, 6 июня 2020

Введение

Существует проблема, связанная с наличием удмуртских электронных текстов, набранных в различных нестандартных кодировках (дополнительные буквы удмуртского письма — Ӝӝ, Ӟӟ, Ӥӥ, Ӧӧ, Ӵӵ — располагаются в них на месте каких-то других знаков, чаще всего — на месте знаков восточно- и южнославянской письменности). Наиболее распространённой из нестандартных кодировок является кодировка Uralic, разработанная для набора текстов на уральских (финно-угорских) языках, использующих дополнительные знаки кириллицы. Знаки удмуртского письма располагаются в ней следующим образом:

  • Ӝ — на месте буквы Љ;
  • Ӟ — на месте буквы Њ;
  • Ӥ — на месте буквы Ћ;
  • Ӧ — на месте буквы Ќ;
  • Ӵ — на месте буквы Џ.

Для того, чтобы с текстам, набранными в кодировке Uralic, можно было работать с использованием современного программного обеспечения (в том числе и веб-приложений), необходима конверсия в кодировку, соответствующую международному стандарту Юникод.

Межрегиональная лаборатория FU-Lab предлагает разработанное и оттестированное программное обеспечение, выполняющее такую конверсию.

Конвертер для MS Windows

Данный конвертер работает с файлами форматов *.doc, *.docx, *.rtf, *.odt файлов, сохраняя форматирование. Также возможна конверсия *.txt и *.html файлов.

Программа не требует инсталяции (установки) на компьютер. Достаточно скачать файл программы (или найти его на компакт-диске, папка «КОНВЕРТЕР»)

http://vidzanin.komikyv.com/programms/Converter.exe

Важно! На компьютере должен быть установлен офисный пакет Microsoft Office:

КОНВЕРТЕР1.png

В случае успешного запуска откроется стартовое диалоговое окно программы:

КОНВЕРТЕР2.png

С помощью опции «Выбрать файл» открываем окно выбора файлов. Для примера рассмотрим конверсию файла, содержащего текст, взятый с сайта Государственного Совета Удмуртской Республики (просмотрено 23 июня 2013 г.) и помещённый в файл в формате *.doc:

КОНВЕРТЕР3.png

Текст до конверсии:

КОНВЕРТЕР4.png

Текст после конверсии:

КОНВЕРТЕР5.png

Оригинальный файл сохраняется в виде копии с расширением *.old:

КОНВЕРТЕР6.png

Онлайн-конвертер с нестандартной кодировки

Онлайн-конвертер предназначен для автоматической замены нестандартных символов, обозначающих буквы коми, марийского и удмуртского языков, а также ошибочных символов латинского набора на кириллический стандарт Unicode:

https://fu-lab.ru/converter

В настоящее время сервис не поддерживает работу с файлами, осуществляя проверку правописания фрагментов текста, вставленных из буфера обмена. Сервис также не поддерживает форматирование текста.

В качестве примера рассмотрим конверсию текста в устаревшей кодировке, взятого с сайта Государственного Совета Удмуртской Республики (просмотрено 23 июня 2013 г.).

Текст до конверсии:

Текст с сайта госсовета до конверсии.jpg

Текст после конверсии:

Текст с сайта госсовета после конверсии.jpg

Ссылки