HFST3: различия между версиями

Материал из Wiki FU-Lab
Перейти к навигации Перейти к поиску
Строка 104: Строка 104:
  export GTHOME=/home/user/main
  export GTHOME=/home/user/main
  export GTCORE=$GTHOME/gtcore
  export GTCORE=$GTHOME/gtcore
export GTHOME=/home/user/main
  test -r /home/user/main/gt/script/init.d/init.sh && . /home/user/main/gt/script/init.d/init.sh
  test -r /home/user/main/gt/script/init.d/init.sh && . /home/user/main/gt/script/init.d/init.sh



Версия от 09:07, 25 декабря 2012

Установка OpenFST

OpenFST — библиотека для конструирования, комбинирования и поиска взвешенных конечных преобразователей (англ. weighted finite-state transducers — FSTs).

Конечные преобразователи играют ключевую роль в распознавании и синтезе речи, машинном переводе, оптическом распознавании символов. Часто они используются для представления вероятностных моделей (например, n-грамм модели (n-gram)).

Эта библиотека была разработана в исследовательской лаборатории Google и в Courant Institute (Courant Institute of Mathematical Sciences). Она предназначено для комплексной, гибкой, эффективной работы и хорошо масштабируется для крупных проблем. Это проект с открытым исходным кодом распространяется под лицензией Apache.

Чтобы установить OpenFST, выполните следующие команды:

wget http://komikyv.ru/downloads/openfst-1.3.2.tar.gz
tar -xzvf openfst-1.3.2.tar.gz 
cd openfst-1.3.2/
./configure
make
sudo make install

Примечание: все команды (в данном случае и в дальнейшем), кроме sudo make install, выполняйте под обычным (своим) пользователем, а sudo make install - под root-ом.

Установка Foma

Скачайте и установите Foma с официального сайта проекта:

svn co http://foma.googlecode.com/svn/trunk/foma/
cd foma
make
sudo make install

Примечания: (установка нижеследующих библиотек стандартная: ./configure, make и sudo make install)

- для успешной инсталяции Foma установите flex, если он у вас не установлен;

- также понадобится bison при его отсутствии, а перед его установкой возможно и m4;

- возможно readline;

- и, наконец, termcap.

Установка SFST

Скачайте и установите SFST:

wget ftp://ftp.ims.uni-stuttgart.de/pub/corpora/SFST/SFST-1.4.6a.tar.gz
tar -xzf SFST-1.4.6a.tar.gz
cd SFST/src
make
sudo make install    # - optional when building for the HFST package
sudo make maninstall # - optional (installs man pages)
sudo make libinstall # - required for sfst support in HFST

Примечание: для успешной инсталяции SFST возможно понадобится ncurses (установка стандартная: ./configure, make и sudo make install).

Установка HFST3

Скачайте HFST3 по svn и установите его:

svn co http://svn.code.sf.net/p/hfst/code/trunk/hfst3/
cd hfst3/
./autogen.sh
./configure --with-foma --enable-proc --enable-lexc
make
sudo make install

Примечания:

- после выполнения команды ./autogen.sh у вас может появиться ошибка, если не установлен libtool, установите libtool (установка стандартная: ./configure, make и sudo make install);

- если после команды ./configure --with-foma --enable-proc --enable-lexc выдаст ошибку:

./configure: line 19950: syntax error near unexpected token `fi'
./configure: line 19950: `fi'

откройте в любом текстовом редакторе файл nfst3/configure и найдите строчку: if test "x$with_unicode_handler" != "xglib"; then, перед этой строчкой и следующей fi поставьте знак #:

# remove if not needed
# if test "x$with_unicode_handler" != "xglib"; then

# fi

далее сохраните файл nfst3/configure и запустите снова: ./configure --with-foma --enable-proc --enable-lexc.

Установка Finite State Morphology

Перейдите по ссылке: Finite State Morphology и нажмите "принять условия лицензионного соглашения". Далее нажмите "скачать", например, "Linux 32" и "бинарные файлы". Распакуйте файл bin.tar.gz и скопируйте файлы: lexc, lookup, tokenize, twolc, xfst в папку: /bin.

Установка Saxon

После компиляции командой make может выдать следующую ошибку:

...
Could not find the main class: net.sf.saxon.Transform. Program will exit.
...

Это означает, что не установлен Saxon. Перейдите по ссылке: SaxonHE9-4 и скачайте файл, например,: SaxonHE9-4-0-6J.zip. Распакуйте файлы и поместите их, например, в папку: /home/user/lib/. Файл saxon9he.jar для удобства можно переименовать в saxon9.jar.

Отредактируйте .bash_profile, например: gedit .bash_profile. Он должен быть примерно таким:

# .bash_profile
# Get the aliases and functions
if [ -f ~/.bashrc ]; then
	. ~/.bashrc
fi
# User specific environment and startup programs
PATH=$PATH:$HOME/bin
export PATH
export CLASSPATH=$CLASSPATH=/home/user/lib/saxon9.jar
export GTHOME=/home/user/main
export GTCORE=$GTHOME/gtcore
test -r /home/user/main/gt/script/init.d/init.sh && . /home/user/main/gt/script/init.d/init.sh

Далее выполните следующую команду:

. .bash_profile

Ссылки