Тексталӧм

Материал из Wiki FU-Lab
Перейти к навигации Перейти к поиску

Распознавание - процесс перевода изображений печатного текста в текстовые данные, использующиеся для представления символов в компьютере.

Гӧгӧрвоӧдӧм

Небӧг сканералӧм бӧрын артмӧны серпас сяма файлъяс (JPG, TIFF дмд. формата торъя банъяс). Найӧс кӧ тшӧтшӧдам да быд небӧг ӧтувтам PDF формата файлӧ, артмӧ электрон небӧг. Сійӧ лоӧ медматыс копия кабала нигаыслы.

ABBYY FineReader программаын ми вермам сэсся текставны небӧгсӧ, м. ш. пӧртны серпас сяма файлысь шыпасъяса юкӧнсӧ текст форматӧ, медым сэсся тайӧ текстнас позяс быд ног уджавны MS Word-ын, LO Writer-ын да мукӧд текстӧвӧй редакторын.

Тексталан процессыс кык медшӧр юкӧна:

  1. Текстсӧ FineReader-ын лыддьӧм
  2. Текстсӧ текстӧвӧй редакторын пелькӧдӧм

Лыддьӧм

FineReader-лӧн интерфейс

Программаын миян водзын лоасны:

  • шуйга лента, кӧні петкӧдлӧма инконкаясӧн небӧгысь став лист бок,
  • вылысса менюяс
  • куим медшӧр ӧшинь:
    1. шуйгавылас - "Изображенньӧ", серпас сяма лист бок
    2. уліас - "Гырысь план", сійӧ жӧ гырсьӧдӧмӧн
    3. веськыдлаас - "Текст", кытысь и кутам лыддьыны текстсӧ.

Fr 6.png

Водзвыв лӧсьӧдӧм

Тексталӧм водзвылын менюас:

  • "Документ кывнас" (Язык документа) колӧ бӧрйыны Коми кыв = Коми (зырянский).
  • "Документ пертасӧн" (Оформление документа) бӧрйыны Сӧстӧм текст (Простой текст)

Тексталан удж

  1. Личкам "Восьтны / Открыть" да бӧръям колана pdf файл. Сутш-мӧд мысти шуйга лентаас петкӧдчасны тайӧ файлысь став лист бокыс, а "Изображенньӧ" ӧшиняс (шуйга ӧшинь) петкӧдчас медводдза лист боклӧн серпас.
  2. "Изображение" лист бокысь сьӧрсьӧн-бӧрсьӧн бӧрйыны (босьтны турунвиж блокӧ) шыпасъяса став юкӧн. Лист бок кӧ вевттьӧма текстӧн ставнас, тайӧс вӧчны оз ков. А уна кӧ посни текстӧвӧй юкӧн, бӧрйыны найӧс позьӧ и улі ӧшиняс (сэні серпасыс гырсьӧдӧма да, кивывджык лоӧ)
  3. Личкыны веськыд кнопкаӧн листбокса бӧрйытӧминӧ да менюысь чуткыны "Распознать/Текставны". Некымын здук мысти "Текст" ӧшиняс (веськыд ӧшинь) петас текст форматын сійӧ жӧ, мый вӧлі бӧрйӧма "Изображенньӧ" ӧшиняс.
  4. Сэсся колӧ сюся лыддьыны тексталӧмсӧ (Текст ӧшиньсьыс).
    • Быд пӧрйӧ, кор казялам тырмытӧмтор, колӧ личкыны татшӧминӧ. Уліас ("Гырысь план" ӧшиняс) петас серпассьыс буретш тайӧ места. Орччаӧдам да, тексталігӧн кӧ сорсьӧма вӧлі, вежам ӧшыбкасӧ некытчӧ торйӧн пасйытӧг.
    • Ӧпечаткаыс кӧ вӧлӧма небӧгас (абу сідзкӧ программалӧн сорсьӧмыс), вежам лёкинсӧ да пасъям торъя файлӧ татшӧм схема серти: мый вӧлі печатайтӧма -> мыйӧн ми вежим (Лб. №№.)
    • Орфографияса важ вариантъяс вӧрӧдны оз ков!!!
  5. Текстын кӧ эм лыдпаса сноска, колӧ тайӧ лыдпассӧ вежны кодзувпасӧн (*) да торйӧдны текстысь куш костӧн. Небӧгас кӧ вӧлі некымын * (шуам, ****), найӧс колӧ чинтыны ӧти *-ӧдз.
  6. Лист бок лыддьӧм бӧрын вуджам мӧд лист бокӧ да бара лыддям и сідз небӧг помӧдз.

Пелькӧдӧм

Кор став бансӧ FineReader-ас лыддьӧма колӧ нӧшта вӧчны сідз, медым текстыс вӧлі лючки тыдаланаӧн. Та могысь

FineReader программаын

  1. Тӧдчӧдны став лист бок FineReader-са шуйга лентаысь ( Ctrl+A)
  2. Копируйтны текст (веськыд кнопкаӧн бӧрйыны "копируйтны" либӧ Ctrl+C)

MS Word-ын

  1. Пуктыны текст MS Word-ӧ:
    • вариант 1: веськыд кнопкаса менюысь личкыны "Вставка" (бӧрйыны параметр А – Сохранить только текст)
    • вариант 2: личкыны Ctrl+V, а сэсся текст уліас "Параметры вставки" копкаысь бӧрйыны "Сохранить только текст"
  2. Вежны небыд перенос (Заменить – Больше – Специальный – Мягкий перенос) нинӧмӧн
  3. Вежны табуляция (Заменить – Больше – Специальный – Знак табуляции) пробелӧн
  4. Вежны тире пробел-тире-пробелӧн
  5. Вежны кык пробел ӧти пробелӧн
  6. Вежны абзац (Заменить – Больше – Специальный – Знак абзаца) + пробел абзацӧн
  7. Вежны пробел + абзац (Заменить – Больше – Специальный – Знак абзаца) абзацӧн
  8. Тӧдчӧдны став текст Word-ысь да копируйтны сійӧс LibreOffice Writer программаӧ

LibreOffice Writer-ын

  1. Пуктыны текст LibreOffice Writer программаӧ
  2. Личкыны кнопка "Коми"
  3. Тӧдчӧдны став текст да тшӧтшӧдны пасьтала (выровнять по ширине), вӧчны воддза стрӧкаса отступ 1,25 см (меню "Формат" - "Абзац"), абзацкостса интервалъяс 0,00, стрӧкакостса интервал одинарнӧй.
  4. Лэччыны либӧ кайны текст кузя да ӧтувтны текстсӧ журналса лист бокъяс вежсянінысь, заголовокъяс водзӧ пуктавны < >, а сноскаяссӧ катӧдны сійӧ абзац бӧрӧ, кытысь сноскаыс и вӧлі. Сноскасӧ улісянь и вылісянь торйӧдам куш костӧн. Ӧти абзацын кӧ сноскаыс некымын, кодзувпасъяс унаӧдны оз ков.
  5. Копируйтны сайтысь подув информация журналса гижӧд йылысь да пуктыны сійӧс <> пытшкӧ татшӧм схема серти: <Ӧньӧ Миш. Мыйкӧ : кывбур // Войвыв кодзув. 2035. №1. Лб. 15-16.>
  6. Документ LibreOffice Writer нимтыны ВК_2035_01 схема серти

Мукӧд юӧр