Langs: различия между версиями

Материал из Wiki FU-Lab
Перейти к навигации Перейти к поиску
Строка 85: Строка 85:
analyser-raw-gt-desc.tmp1.xfst<br/>
analyser-raw-gt-desc.tmp1.xfst<br/>
analyser-raw-gt-desc.xfst<br/>
analyser-raw-gt-desc.xfst<br/>
'''filters'''<br/>
'''filters''' - фильтры<br/>
generator-gt-desc.hfstol<br/>
generator-gt-desc.hfstol<br/>
generator-gt-desc.xfst<br/>
generator-gt-desc.xfst<br/>
Строка 92: Строка 92:
generator-raw-gt-desc.hfst<br/>
generator-raw-gt-desc.hfst<br/>
generator-raw-gt-desc.tmp1.hfst<br/>
generator-raw-gt-desc.tmp1.hfst<br/>
'''hyphenation'''<br/>
'''hyphenation''' - расстановка переносов<br/>
'''morphology'''<br/>
'''morphology''' - морфология<br/>
'''orthography'''<br/>
'''orthography''' - орфография<br/>
'''phonetics'''<br/>
'''phonetics''' - фонетика<br/>
'''phonology'''<br/>
'''phonology''' - фонология<br/>
'''syntax'''<br/>
'''syntax''' - синтаксис<br/>
'''tagsets'''<br/>
'''tagsets''' - установки тегов<br/>
'''transcriptions'''<br/>
'''transcriptions''' - транскрипции<br/>


И командой:
И командой:

Версия от 07:00, 27 сентября 2015

Перед началом работы

Работа осуществляется в терминале (не забывайте ваши основные команды: pwd -- где я? ls -- что здесь? некоторым, возможно, понадобится whoami -- а кто я вообще такой?).

Перед началом работы предполагается, что вы в свою UNIX-систему (Mac OS или Linux) установили все необходимые программы и библиотеки.

И в своей рабочей папке, например, /home/user (в дальнейшем ~/) создали папку main, выполнив следующую команду:

svn co https://victorio.uit.no/langtech/trunk main

Также, перед началом работы с любым проектом (возьмите себе за правило!) не забывайте обновлять каталог main на своём компьютере:

cd ~/main/
svn up

Начало работы

При работе с инфраструктурой центра "Гиеллатекно" в папке ~/main/langs/ вы видите папки, в основном, состоящие из 3-х трёх букв: bak, bxr, chp, chr, ... - эти трёхбуквенные обозначения: коды ISO 639-3 языков, соответственно в папке mhr - проект для марийского (лугового), kpv - коми (зырянского), rus - русского языков.

Например, в папке rus (cd ~/main/langs/rus/) изначально находятся следующие файлы и папки:
AUTHORS
INSTALL
LICENCE
Makefile.am
README
am-shared
autogen.sh
configure.ac
devtools
doc
giella-rus.pc.in
m4
misc
src
test
tools
und.timestamp

После компиляции:

./autogen.sh
./configure --with-hfst --enable-spellers
make
sudo make install

Мы видим следующие папки (выделены жирным) и файлы:
AUTHORS
INSTALL
LICENCE
Makefile
Makefile.am
Makefile.in
README
aclocal.m4
am-shared
autogen.sh
autom4te.cache
build-aux
config.log
config.status
configure
configure.ac
devtools
doc
giella-rus.pc
giella-rus.pc.in
m4
misc
src
test
tools
und.timestamp

В папке src (после компиляции) мы видим следующие папки и файлы:
FSTflavors_STRESS.txt
Makefile
Makefile.am
Makefile.in
analyser-disamb-gt-desc.hfstol
analyser-disamb-gt-desc.xfst
analyser-gt-desc.hfst
analyser-gt-desc.hfstol
analyser-gt-desc.xfst
analyser-gt-norm.hfstol
analyser-gt-norm.xfst
analyser-raw-gt-desc.hfst
analyser-raw-gt-desc.tmp1.xfst
analyser-raw-gt-desc.xfst
filters - фильтры
generator-gt-desc.hfstol
generator-gt-desc.xfst
generator-gt-norm.hfstol
generator-gt-norm.xfst
generator-raw-gt-desc.hfst
generator-raw-gt-desc.tmp1.hfst
hyphenation - расстановка переносов
morphology - морфология
orthography - орфография
phonetics - фонетика
phonology - фонология
syntax - синтаксис
tagsets - установки тегов
transcriptions - транскрипции

И командой:

lookup analyser-gt-desc.xfst

Можете, например, проверить как работает морфологический анализатор:

Hfst.png

Ссылки