<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="ru">
	<id>http://wiki.fu-lab.ru/api.php?action=feedcontributions&amp;feedformat=atom&amp;user=Vorgoron</id>
	<title>Wiki FU-Lab - Вклад [ru]</title>
	<link rel="self" type="application/atom+xml" href="http://wiki.fu-lab.ru/api.php?action=feedcontributions&amp;feedformat=atom&amp;user=Vorgoron"/>
	<link rel="alternate" type="text/html" href="http://wiki.fu-lab.ru/index.php/%D0%A1%D0%BB%D1%83%D0%B6%D0%B5%D0%B1%D0%BD%D0%B0%D1%8F:%D0%92%D0%BA%D0%BB%D0%B0%D0%B4/Vorgoron"/>
	<updated>2026-05-13T05:34:20Z</updated>
	<subtitle>Вклад</subtitle>
	<generator>MediaWiki 1.38.4</generator>
	<entry>
		<id>http://wiki.fu-lab.ru/index.php?title=%D0%A1%D0%BE%D0%B7%D0%B4%D0%B0%D0%BD%D0%B8%D0%B5_Hunspell-%D1%81%D0%BB%D0%BE%D0%B2%D0%B0%D1%80%D1%8F&amp;diff=252</id>
		<title>Создание Hunspell-словаря</title>
		<link rel="alternate" type="text/html" href="http://wiki.fu-lab.ru/index.php?title=%D0%A1%D0%BE%D0%B7%D0%B4%D0%B0%D0%BD%D0%B8%D0%B5_Hunspell-%D1%81%D0%BB%D0%BE%D0%B2%D0%B0%D1%80%D1%8F&amp;diff=252"/>
		<updated>2012-07-19T08:59:19Z</updated>

		<summary type="html">&lt;p&gt;Vorgoron: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;В данной инструкции будет рассмотрено создание hunspell словаря на примере удмуртского словаря hunspell.&lt;br /&gt;
Сначала необходимо установить Hunspell:&lt;br /&gt;
&lt;br /&gt;
 sudo apt-get install hunspell hunspell-tools&lt;br /&gt;
&lt;br /&gt;
===1. Создание списка слов.===&lt;br /&gt;
Для создания словаря нужно иметь большой список слов, wordlist. Список удмуртских слов получен из Удмуртско-русского словаря.&lt;br /&gt;
&lt;br /&gt;
===2. Создание словаря hunspell.===&lt;br /&gt;
&lt;br /&gt;
====2.1. Формат словаря.==== &lt;br /&gt;
Словарь hunspell состоит из двух файлов: &lt;br /&gt;
* первый файл с расширением '''.dic''' - здесь содержится список &amp;quot;корней&amp;quot; слов (стемов) со специальными метками, флагами.&lt;br /&gt;
Фрагмент файла:&lt;br /&gt;
&lt;br /&gt;
 бергатъяны/c&lt;br /&gt;
 бергатылыны/a&lt;br /&gt;
 бергатыны/a&lt;br /&gt;
 бергес&lt;br /&gt;
 бергозы/d&lt;br /&gt;
 берда&lt;br /&gt;
 кыткыны/a&lt;br /&gt;
&lt;br /&gt;
т.е. сначала идет стем, &amp;quot;корень&amp;quot; слова, далее слэш &amp;quot;/&amp;quot;, после слэша ставится флаг, обозначающий к какой группе аффиксов (второй файл) относится данное слово. После слэша может быть несколько флагов.&lt;br /&gt;
&lt;br /&gt;
* во втором файле ('''.aff''') находятся группы аффиксов, обозначенные флагами.&lt;br /&gt;
&lt;br /&gt;
Фрагмент файла:&lt;br /&gt;
&lt;br /&gt;
 SFX a Y 197 #заголовок группы, кол-во аффиксов - 197&lt;br /&gt;
 SFX a ыны он/d [^ьй]ыны&lt;br /&gt;
 ...&lt;br /&gt;
 SFX a ыны эмпотонтэм [дзлнстуеыаоэяиюӧӥё]ыны&lt;br /&gt;
 SFX a ыны эмпотостэм [дзлнстуеыаоэяиюӧӥё]ыны&lt;br /&gt;
 SFX a ыны эмъёстэ [дзлнстуеыаоэяиюӧӥё]ыны&lt;br /&gt;
 SFX a ыны ӥ [дзлнст]ыны&lt;br /&gt;
 '''SFX a ыны ӥд [дзлнст]ыны'''&lt;br /&gt;
 SFX a ыны ӥды [дзлнст]ыны&lt;br /&gt;
 SFX a ыны ӥз [дзлнст]ыны&lt;br /&gt;
 ...&lt;br /&gt;
 SFX a ыны ид [^дзлнстьй]ыны&lt;br /&gt;
&lt;br /&gt;
обозначения:&amp;lt;br/&amp;gt;&lt;br /&gt;
&lt;br /&gt;
'''SFX''' - означает, что это группа суффиксов. Для создания группы префиксов надо использовать PFX&amp;lt;br/&amp;gt;&lt;br /&gt;
'''а''' - наименование флага&amp;lt;br/&amp;gt;&lt;br /&gt;
'''ыны''' - что будет убираться с конца корня слова&amp;lt;br/&amp;gt;&lt;br /&gt;
'''ӥд''' - сам суффикс&amp;lt;br/&amp;gt;&lt;br /&gt;
'''[дзлнст]ыны''' - условие, при котором будет выбираться данный суффикс. В условиях используются регулярные выражения.&amp;lt;br/&amp;gt;&lt;br /&gt;
Остановимся поподробнее на условиях. В '''квадратных скобках''' перечисляется буквы, одна из которых обязательно должна быть на том месте, где стоят эти скобки. В данном примере условию удовлетворяют следующие слова с окончаниями: -дыны, -зыны, -лыны ... -тыны. То есть если в файле с расширением .dic есть слова помеченные флагом &amp;quot;а&amp;quot; и заканчивающиеся на -дыны, -зыны, -лыны ... -тыны, например ''бергатыны/a'', то будет образовываться новые слова с определенным суффиксом: ''бергатӥд''. Далее, если в условии после открывающей квадратной скобки добавлен символ &amp;quot;^&amp;quot;, то это означает, что те буквы, которые заключены в эти скобки, не должны находиться на данной позиции (происходит обратное, отрицание). Например, суффиксу с условием '''SFX a ыны ид [^дзлнстьй]ыны''' подходит слово &amp;quot;кытк'''ыны'''/a&amp;quot; -&amp;gt; &amp;quot;кытк'''ид'''&amp;quot;.&lt;br /&gt;
&lt;br /&gt;
Hunspell может определять одновременно в одном слове максимум два суффикса. Т.е. если определить в файле аффиксов все суффиксы по отдельности, то Hunspell не поймет этого. Например слово '''гыр-ись-ёс-мы-лы''' имеет 4 аффикса, в словаре аффиксов нельзя определить все эти аффиксы по отдельности, поэтому надо будет определить это как один длинный &amp;quot;суффикс&amp;quot;, либо как 2 &amp;quot;суффикса&amp;quot;:&amp;lt;br/&amp;gt;&lt;br /&gt;
 ...&lt;br /&gt;
 SFX a ыны ись'''/d''' [^дзлнстьй]ыны&lt;br /&gt;
 ...&lt;br /&gt;
 &lt;br /&gt;
 ...&lt;br /&gt;
 SFX d 0 ёсмылы [ьъй]&lt;br /&gt;
 ...&lt;br /&gt;
&lt;br /&gt;
Для определения второго суффикса в конец вперед идущего суффикса добавляется слэш с нужным флагом. В моём примере суффиксы группы &amp;quot;а&amp;quot; определяют глаголы первого спряжения, суффиксы группы &amp;quot;d&amp;quot; - существительные.&lt;br /&gt;
&lt;br /&gt;
Более подробную информацию о формате словаря вы можете узнать по этой ссылке: http://www.marlamuter.ru/downloads/hunspell2.pdf&lt;br /&gt;
&lt;br /&gt;
====2.2. Инструменты.====&lt;br /&gt;
&lt;br /&gt;
При создании удмуртского словаря hunspell в основном я пользовался редактором текста Notepad++. Но также пользовался некоторыми утилитами из пакета hunspell-tools, о которых я расскажу позже.&lt;br /&gt;
&lt;br /&gt;
Для каждой части речи в файле аффиксов существует своя группа. '''Глаголы''' я разделил на 3 группы: 1го спряжения (-ыны), 2го спряжения (-аны, -яны) и отдельно выделил суффиксы для глаголов оканчивающихся на -йыны. Так я сделал, что бы не загромождать группу глаголов 1го спряжения и в связи с специфичностью образования слов на -йыны. Далее после создания групп аффиксов для глаголов я в dic-файле начал обозначать глаголы соответствующими флагами в Notepad++ простой &amp;quot;заменой&amp;quot;: например, сначала заменял &amp;quot;йыны&amp;quot; на &amp;quot;йыны/b&amp;quot;, потом &amp;quot;ыны&amp;quot; на &amp;quot;ыны/а&amp;quot; и так далее. Исходной формой образования всех глагольных форм в удмуртском языке является инфинитив, имеющий форму '''-ны''', поэтому при определении глаголов не возникло проблем.&lt;br /&gt;
&lt;br /&gt;
Далее я начал писать правила образования для существительных. Существительные в удмуртском языке имеют категории числа, притяжательности, падежа и выделительно указательности. Для имен существительных я создал 2 группы аффиксов: одна для сущ., обозначающих неодушевленные предметы, другая для сущ., обозначающих одушевленные предметы. Отличие лишь в том, что в первой группе описаны правила для всех 15 падежей, а во второй только для 8ми. Из-за того, что Hunspell может выделять только максимум 2 суффикса, формы образования не разделены на группы, как было бы логичнее сделать, т.е. для категории числа сделать свою группу, для падежей свою и связать их. Для описания всех форм образования существительных потребовалось: 2 категории числа * 12(?) категорий притяжательности * 15 падежей + правила для [дзлнст], ь, й, [пфктсшхцчщ] = 564 правил, и это еще не все правила, так как я не филолог :). Но это не значит, что от одного существительного может образоваться столько форм. После описания всех правил надо было как то отметить существительные в dic-файле. Для этого в hunspell-tools существует утилита '''munch''' - эта утилита позволяет из wordlist'а с помощью файла аффиксов создать правильный dic-файл с флагами. Вот пример работы munch:&lt;br /&gt;
&lt;br /&gt;
 wordlist:    |   udm.aff:                                 |            udm.dic:&lt;br /&gt;
              |                                            |            &lt;br /&gt;
 яратод       |   SFX a Y 4                                |  munch     1&lt;br /&gt;
 яратӥсько    |   SFX a 0 0 .                              | -------&amp;gt;   яратыны/a&lt;br /&gt;
 яратэмзэ     |   SFX a ыны ӥсько [дзлнст]ыны              |&lt;br /&gt;
 яратыны      |   SFX a ыны од [^ьй]ыны                    |&lt;br /&gt;
              |   SFX a ыны эмзэ [дзлнстуеыаоэяиюӧӥё]ыны   |&lt;br /&gt;
&lt;br /&gt;
Из 4 слов из wordlist'а он оставил только одно с нужным флагом. Но есть одно ограничение в работе этой утилиты: число словоформ одного слова должно совпадать с количеством суффиксов для нужного флага. Т.е. если количество правил группы больше чем в словоформ в wordlist', то утилита не будет работать и выдаст тот же список. Но, так как munch имеет открытый код, я легко снял это ограничение. Теперь если в wordlist'е есть хотя бы 2 словоформы удовлетворяющие правилам нужного флага, то munch преобразует их в одно слово с флагом. Но пользоваться данной утилитой надо осторожно, иначе для некоторых слов могут быть выбраны неправильные флаги. Что бы это не случилось, надо использовать munch к последовательно получающемуся dic-файлу с '''разными''' aff-файлами, где лежат правила, относящиеся только одной группе/флагу. Ссылка на munch: https://dl.dropbox.com/u/24592250/munch.rar&lt;/div&gt;</summary>
		<author><name>Vorgoron</name></author>
	</entry>
	<entry>
		<id>http://wiki.fu-lab.ru/index.php?title=%D0%A1%D0%BE%D0%B7%D0%B4%D0%B0%D0%BD%D0%B8%D0%B5_Hunspell-%D1%81%D0%BB%D0%BE%D0%B2%D0%B0%D1%80%D1%8F&amp;diff=251</id>
		<title>Создание Hunspell-словаря</title>
		<link rel="alternate" type="text/html" href="http://wiki.fu-lab.ru/index.php?title=%D0%A1%D0%BE%D0%B7%D0%B4%D0%B0%D0%BD%D0%B8%D0%B5_Hunspell-%D1%81%D0%BB%D0%BE%D0%B2%D0%B0%D1%80%D1%8F&amp;diff=251"/>
		<updated>2012-07-18T11:19:59Z</updated>

		<summary type="html">&lt;p&gt;Vorgoron: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;В данной инструкции будет рассмотрено создание hunspell словаря на примере удмуртского словаря hunspell.&lt;br /&gt;
Сначала необходимо установить Hunspell:&lt;br /&gt;
&lt;br /&gt;
 sudo apt-get install hunspell hunspell-tools&lt;br /&gt;
&lt;br /&gt;
'''1. Создание списка слов.''' Для создания словаря нужно иметь большой список слов, wordlist. Список удмуртских слов получен из Удмуртско-русского словаря.&lt;br /&gt;
&lt;br /&gt;
'''2. Создание словаря hunspell.''' &lt;br /&gt;
&lt;br /&gt;
2.1. Формат словаря. Словарь hunspell состоит из двух файлов: &lt;br /&gt;
* первый файл с расширением '''.dic''' - здесь содержится список &amp;quot;корней&amp;quot; слов (стемов) со специальными метками, флагами.&lt;br /&gt;
Фрагмент файла:&lt;br /&gt;
&lt;br /&gt;
 бергатъяны/c&lt;br /&gt;
 бергатылыны/a&lt;br /&gt;
 бергатыны/a&lt;br /&gt;
 бергес&lt;br /&gt;
 бергозы/d&lt;br /&gt;
 берда&lt;br /&gt;
 кыткыны/a&lt;br /&gt;
&lt;br /&gt;
т.е. сначала идет стем, &amp;quot;корень&amp;quot; слова, далее слэш &amp;quot;/&amp;quot;, после слэша ставится флаг, обозначающий к какой группе аффиксов (второй файл) относится данное слово. После слэша может быть несколько флагов.&lt;br /&gt;
&lt;br /&gt;
* во втором файле ('''.aff''') находятся группы аффиксов, обозначенные флагами.&lt;br /&gt;
&lt;br /&gt;
Фрагмент файла:&lt;br /&gt;
&lt;br /&gt;
 SFX a Y 197 #заголовок группы, кол-во аффиксов - 197&lt;br /&gt;
 SFX a ыны он/d [^ьй]ыны&lt;br /&gt;
 ...&lt;br /&gt;
 SFX a ыны эмпотонтэм [дзлнстуеыаоэяиюӧӥё]ыны&lt;br /&gt;
 SFX a ыны эмпотостэм [дзлнстуеыаоэяиюӧӥё]ыны&lt;br /&gt;
 SFX a ыны эмъёстэ [дзлнстуеыаоэяиюӧӥё]ыны&lt;br /&gt;
 SFX a ыны ӥ [дзлнст]ыны&lt;br /&gt;
 '''SFX a ыны ӥд [дзлнст]ыны'''&lt;br /&gt;
 SFX a ыны ӥды [дзлнст]ыны&lt;br /&gt;
 SFX a ыны ӥз [дзлнст]ыны&lt;br /&gt;
 ...&lt;br /&gt;
 SFX a ыны ид [^дзлнстьй]ыны&lt;br /&gt;
&lt;br /&gt;
обозначения:&amp;lt;br/&amp;gt;&lt;br /&gt;
&lt;br /&gt;
'''SFX''' - означает, что это группа суффиксов. Для создания группы префиксов надо использовать PFX&amp;lt;br/&amp;gt;&lt;br /&gt;
'''а''' - наименование флага&amp;lt;br/&amp;gt;&lt;br /&gt;
'''ыны''' - что будет убираться с конца корня слова&amp;lt;br/&amp;gt;&lt;br /&gt;
'''ӥд''' - сам суффикс&amp;lt;br/&amp;gt;&lt;br /&gt;
'''[дзлнст]ыны''' - условие, при котором будет выбираться данный суффикс. В условиях используются регулярные выражения.&amp;lt;br/&amp;gt;&lt;br /&gt;
Остановимся поподробнее на условиях. В '''квадратных скобках''' перечисляется буквы, одна из которых обязательно должна быть на том месте, где стоят эти скобки. В данном примере условию удовлетворяют следующие слова с окончаниями: -дыны, -зыны, -лыны ... -тыны. То есть если в файле с расширением .dic есть слова помеченные флагом &amp;quot;а&amp;quot; и заканчивающиеся на -дыны, -зыны, -лыны ... -тыны, например ''бергатыны/a'', то будет образовываться новые слова с определенным суффиксом: ''бергатӥд''. Далее, если в условии после открывающей квадратной скобки добавлен символ &amp;quot;^&amp;quot;, то это означает, что те буквы, которые заключены в эти скобки, не должны находиться на данной позиции (происходит обратное, отрицание). Например, суффиксу с условием '''SFX a ыны ид [^дзлнстьй]ыны''' подходит слово &amp;quot;кытк'''ыны'''/a&amp;quot; -&amp;gt; &amp;quot;кытк'''ид'''&amp;quot;.&lt;br /&gt;
&lt;br /&gt;
Hunspell может определять одновременно в одном слове максимум два суффикса. Т.е. если определить в файле аффиксов все суффиксы по отдельности, то Hunspell не поймет этого. Например слово '''гыр-ись-ёс-мы-лы''' имеет 4 аффикса, в словаре аффиксов нельзя определить все эти аффиксы по отдельности, поэтому надо будет определить это как один длинный &amp;quot;суффикс&amp;quot;, либо как 2 &amp;quot;суффикса&amp;quot;:&amp;lt;br/&amp;gt;&lt;br /&gt;
 ...&lt;br /&gt;
 SFX a ыны ись'''/d''' [^дзлнстьй]ыны&lt;br /&gt;
 ...&lt;br /&gt;
 &lt;br /&gt;
 ...&lt;br /&gt;
 SFX d 0 ёсмылы [ьъй]&lt;br /&gt;
 ...&lt;br /&gt;
&lt;br /&gt;
Для определения второго суффикса в конец вперед идущего суффикса добавляется слэш с нужным флагом. В моём примере суффиксы группы &amp;quot;а&amp;quot; определяют глаголы первого спряжения, суффиксы группы &amp;quot;d&amp;quot; - существительные.&lt;br /&gt;
&lt;br /&gt;
Более подробную информацию о формате словаря вы можете узнать по этой ссылке: http://www.marlamuter.ru/downloads/hunspell2.pdf&lt;br /&gt;
&lt;br /&gt;
2.2. Инструменты.&lt;br /&gt;
&lt;br /&gt;
При создании удмуртского словаря hunspell в основном я пользовался редактором текста Notepad++. Но также пользовался некоторыми утилитами из пакета hunspell-tools, о которых я расскажу позже.&lt;br /&gt;
&lt;br /&gt;
Для каждой части речи в файле аффиксов существует своя группа. '''Глаголы''' я разделил на 3 группы: 1го спряжения (-ыны), 2го спряжения (-аны, -яны) и отдельно выделил суффиксы для глаголов оканчивающихся на -йыны. Так я сделал, что бы не загромождать группу глаголов 1го спряжения и в связи с специфичностью образования слов на -йыны. Далее после создания групп аффиксов для глаголов я в dic-файле начал обозначать глаголы соответствующими флагами в Notepad++ простой &amp;quot;заменой&amp;quot;: например, сначала заменял &amp;quot;йыны&amp;quot; на &amp;quot;йыны/b&amp;quot;, потом &amp;quot;ыны&amp;quot; на &amp;quot;ыны/а&amp;quot; и так далее. Исходной формой образования всех глагольных форм в удмуртском языке является инфинитив, имеющий форму '''-ны''', поэтому при определении глаголов не возникло проблем.&lt;br /&gt;
&lt;br /&gt;
Далее я начал писать правила образования для существительных. Существительные в удмуртском языке имеют категории числа, притяжательности, падежа и выделительно указательности. Для имен существительных я создал 2 группы аффиксов: одна для сущ., обозначающих неодушевленные предметы, другая для сущ., обозначающих одушевленные предметы. Отличие лишь в том, что в первой группе описаны правила для всех 15 падежей, а во второй только для 8ми. Из-за того, что Hunspell может выделять только максимум 2 суффикса, формы образования не разделены на группы, как было бы логичнее сделать, т.е. для категории числа сделать свою группу, для падежей свою и связать их. Для описания всех форм образования существительных потребовалось: 2 категории числа * 12(?) категорий притяжательности * 15 падежей + правила для [дзлнст], ь, й, [пфктсшхцчщ] = 564 правил, и это еще не все правила, так как я не филолог :). Но это не значит, что от одного существительного может образоваться столько форм. После описания всех правил надо было как то отметить существительные в dic-файле. Для этого в hunspell-tools существует утилита '''munch''' - эта утилита позволяет из wordlist'а с помощью файла аффиксов создать правильный dic-файл с флагами. Вот пример работы munch:&lt;br /&gt;
&lt;br /&gt;
 wordlist:    |   udm.aff:                                 |            udm.dic:&lt;br /&gt;
              |                                            |            &lt;br /&gt;
 яратод       |   SFX a Y 4                                |  munch     1&lt;br /&gt;
 яратӥсько    |   SFX a 0 0 .                              | -------&amp;gt;   яратыны/a&lt;br /&gt;
 яратэмзэ     |   SFX a ыны ӥсько [дзлнст]ыны              |&lt;br /&gt;
 яратыны      |   SFX a ыны од [^ьй]ыны                    |&lt;br /&gt;
              |   SFX a ыны эмзэ [дзлнстуеыаоэяиюӧӥё]ыны   |&lt;br /&gt;
&lt;br /&gt;
Из 4 слов из wordlist'а он оставил только одно с нужным флагом. Но есть одно ограничение в работе этой утилиты: число словоформ одного слова должно совпадать с количеством суффиксов для нужного флага. Т.е. если количество правил группы больше чем в словоформ в wordlist', то утилита не будет работать и выдаст тот же список. Но, так как munch имеет открытый код, я легко снял это ограничение. Теперь если в wordlist'е есть хотя бы 2 словоформы удовлетворяющие правилам нужного флага, то munch преобразует их в одно слово с флагом. Но пользоваться данной утилитой надо осторожно, иначе для некоторых слов могут быть выбраны неправильные флаги. Что бы это не случилось, надо использовать munch к последовательно получающемуся dic-файлу с '''разными''' aff-файлами, где лежат правила, относящиеся только одной группе/флагу. Ссылка на munch: https://dl.dropbox.com/u/24592250/munch.rar&lt;/div&gt;</summary>
		<author><name>Vorgoron</name></author>
	</entry>
	<entry>
		<id>http://wiki.fu-lab.ru/index.php?title=%D0%A1%D0%BE%D0%B7%D0%B4%D0%B0%D0%BD%D0%B8%D0%B5_Hunspell-%D1%81%D0%BB%D0%BE%D0%B2%D0%B0%D1%80%D1%8F&amp;diff=250</id>
		<title>Создание Hunspell-словаря</title>
		<link rel="alternate" type="text/html" href="http://wiki.fu-lab.ru/index.php?title=%D0%A1%D0%BE%D0%B7%D0%B4%D0%B0%D0%BD%D0%B8%D0%B5_Hunspell-%D1%81%D0%BB%D0%BE%D0%B2%D0%B0%D1%80%D1%8F&amp;diff=250"/>
		<updated>2012-07-18T11:17:08Z</updated>

		<summary type="html">&lt;p&gt;Vorgoron: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;В данной инструкции будет рассмотрено создание hunspell словаря на примере удмуртского словаря hunspell.&lt;br /&gt;
Сначала необходимо установить Hunspell:&lt;br /&gt;
&lt;br /&gt;
 sudo apt-get install hunspell hunspell-tools&lt;br /&gt;
&lt;br /&gt;
'''1. Создание списка слов.''' Для создания словаря нужно иметь большой список слов, wordlist. Список удмуртских слов получен из Удмуртско-русского словаря.&lt;br /&gt;
&lt;br /&gt;
'''2. Создание словаря hunspell.''' &lt;br /&gt;
&lt;br /&gt;
2.1. Формат словаря. Словарь hunspell состоит из двух файлов: &lt;br /&gt;
* первый файл с расширением '''.dic''' - здесь содержится список &amp;quot;корней&amp;quot; слов (стемов) со специальными метками, флагами.&lt;br /&gt;
Фрагмент файла:&lt;br /&gt;
&lt;br /&gt;
 бергатъяны/c&lt;br /&gt;
 бергатылыны/a&lt;br /&gt;
 бергатыны/a&lt;br /&gt;
 бергес&lt;br /&gt;
 бергозы/d&lt;br /&gt;
 берда&lt;br /&gt;
 кыткыны/a&lt;br /&gt;
&lt;br /&gt;
т.е. сначала идет стем, &amp;quot;корень&amp;quot; слова, далее слэш &amp;quot;/&amp;quot;, после слэша ставится флаг, обозначающий к какой группе аффиксов (второй файл) относится данное слово. После слэша может быть несколько флагов.&lt;br /&gt;
&lt;br /&gt;
* во втором файле ('''.aff''') находятся группы аффиксов, обозначенные флагами.&lt;br /&gt;
&lt;br /&gt;
Фрагмент файла:&lt;br /&gt;
&lt;br /&gt;
 SFX a Y 197 #заголовок группы, кол-во аффиксов - 197&lt;br /&gt;
 SFX a ыны он/d [^ьй]ыны&lt;br /&gt;
 ...&lt;br /&gt;
 SFX a ыны эмпотонтэм [дзлнстуеыаоэяиюӧӥё]ыны&lt;br /&gt;
 SFX a ыны эмпотостэм [дзлнстуеыаоэяиюӧӥё]ыны&lt;br /&gt;
 SFX a ыны эмъёстэ [дзлнстуеыаоэяиюӧӥё]ыны&lt;br /&gt;
 SFX a ыны ӥ [дзлнст]ыны&lt;br /&gt;
 '''SFX a ыны ӥд [дзлнст]ыны'''&lt;br /&gt;
 SFX a ыны ӥды [дзлнст]ыны&lt;br /&gt;
 SFX a ыны ӥз [дзлнст]ыны&lt;br /&gt;
 ...&lt;br /&gt;
 SFX a ыны ид [^дзлнстьй]ыны&lt;br /&gt;
&lt;br /&gt;
обозначения:&amp;lt;br/&amp;gt;&lt;br /&gt;
&lt;br /&gt;
'''SFX''' - означает, что это группа суффиксов. Для создания группы префиксов надо использовать PFX&amp;lt;br/&amp;gt;&lt;br /&gt;
'''а''' - наименование флага&amp;lt;br/&amp;gt;&lt;br /&gt;
'''ыны''' - что будет убираться с конца корня слова&amp;lt;br/&amp;gt;&lt;br /&gt;
'''ӥд''' - сам суффикс&amp;lt;br/&amp;gt;&lt;br /&gt;
'''[дзлнст]ыны''' - условие, при котором будет выбираться данный суффикс. В условиях используются регулярные выражения.&amp;lt;br/&amp;gt;&lt;br /&gt;
Остановимся поподробнее на условиях. В '''квадратных скобках''' перечисляется буквы, одна из которых обязательно должна быть на том месте, где стоят эти скобки. В данном примере условию удовлетворяют следующие слова с окончаниями: -дыны, -зыны, -лыны ... -тыны. То есть если в файле с расширением .dic есть слова помеченные флагом &amp;quot;а&amp;quot; и заканчивающиеся на -дыны, -зыны, -лыны ... -тыны, например ''бергатыны/a'', то будет образовываться новые слова с определенным суффиксом: ''бергатӥд''. Далее, если в условии после открывающей квадратной скобки добавлен символ &amp;quot;^&amp;quot;, то это означает, что те буквы, которые заключены в эти скобки, не должны находиться на данной позиции (происходит обратное, отрицание). Например, суффиксу с условием '''SFX a ыны ид [^дзлнстьй]ыны''' подходит слово &amp;quot;кытк'''ыны'''/a&amp;quot; -&amp;gt; &amp;quot;кытк'''ид'''&amp;quot;.&lt;br /&gt;
&lt;br /&gt;
Hunspell может определять одновременно в одном слове максимум два суффикса. Т.е. если определить в файле аффиксов все суффиксы по отдельности, то Hunspell не поймет этого. Например слово '''гыр-ись-ёс-мы-лы''' имеет 4 аффикса, в словаре аффиксов нельзя определить все эти аффиксы по отдельности, поэтому надо будет определить это как один длинный &amp;quot;суффикс&amp;quot;, либо как 2 &amp;quot;суффикса&amp;quot;:&amp;lt;br/&amp;gt;&lt;br /&gt;
 ...&lt;br /&gt;
 SFX a ыны ись'''/d''' [^дзлнстьй]ыны&lt;br /&gt;
 ...&lt;br /&gt;
 &lt;br /&gt;
 ...&lt;br /&gt;
 SFX d 0 ёсмылы [ьъй]&lt;br /&gt;
 ...&lt;br /&gt;
&lt;br /&gt;
Для определения второго суффикса в конец вперед идущего суффикса добавляется слэш с нужным флагом. В моём примере суффиксы группы &amp;quot;а&amp;quot; определяют глаголы первого спряжения, суффиксы группы &amp;quot;d&amp;quot; - существительные.&lt;br /&gt;
&lt;br /&gt;
Более подробную информацию о формате словаря вы можете узнать по этой ссылке: http://www.marlamuter.ru/downloads/hunspell2.pdf&lt;br /&gt;
&lt;br /&gt;
2.2. Инструменты.&lt;br /&gt;
&lt;br /&gt;
При создании удмуртского словаря hunspell в основном я пользовался редактором текста Notepad++. Но также пользовался некоторыми утилитами из пакета hunspell-tools, о которых я расскажу позже.&lt;br /&gt;
&lt;br /&gt;
Для каждой части речи в файле аффиксов существует своя группа. '''Глаголы''' я разделил на 3 группы: 1го спряжения (-ыны), 2го спряжения (-аны, -яны) и отдельно выделил суффиксы для глаголов оканчивающихся на -йыны. Так я сделал, что бы не загромождать группу глаголов 1го спряжения и в связи с специфичностью образования слов на -йыны. Далее после создания групп аффиксов для глаголов я в dic-файле начал обозначать глаголы соответствующими флагами в Notepad++ простой &amp;quot;заменой&amp;quot;: например, сначала заменял &amp;quot;йыны&amp;quot; на &amp;quot;йыны/b&amp;quot;, потом &amp;quot;ыны&amp;quot; на &amp;quot;ыны/а&amp;quot; и так далее. Исходной формой образования всех глагольных форм в удмуртском языке является инфинитив, имеющий форму '''-ны''', поэтому при определении глаголов не возникло проблем.&lt;br /&gt;
&lt;br /&gt;
Далее я начал писать правила образования для существительных. Существительные в удмуртском языке имеют категории числа, притяжательности, падежа и выделительно указательности. Для имен существительных я создал 2 группы аффиксов: одна для сущ., обозначающих неодушевленные предметы, другая для сущ., обозначающих одушевленные предметы. Отличие лишь в том, что в первой группе описаны правила для всех 15 падежей, а во второй только для 8ми. Из-за того, что Hunspell может выделять только максимум 2 суффикса, формы образования не разделены на группы, как было бы логичнее сделать, т.е. для категории числа сделать свою группу, для падежей свою и связать их. Для описания всех форм образования существительных потребовалось: 2 категории числа * 12(?) категорий притяжательности * 15 падежей + правила для [дзлнст], ь, й, [пфктсшхцчщ] = 564 правил, и это еще не все правила, так как я не филолог :). Но это не значит, что от одного существительного может образоваться столько форм. После описания всех правил надо было как то отметить существительные в dic-файле. Для этого в hunspell-tools существует утилита '''munch''' - эта утилита позволяет из wordlist'а с помощью файла аффиксов создать правильный dic-файл с флагами. Вот пример работы munch:&lt;br /&gt;
&lt;br /&gt;
 wordlist:    |   udm.aff:                                 |            udm.dic:&lt;br /&gt;
              |                                            |            &lt;br /&gt;
 яратод       |   SFX a Y 4                                |  munch     1&lt;br /&gt;
 яратӥсько    |   SFX a 0 0 .                              | -------&amp;gt;   яратыны/a&lt;br /&gt;
 яратэмзэ     |   SFX a ыны ӥсько [дзлнст]ыны              |&lt;br /&gt;
 яратыны      |   SFX a ыны од [^ьй]ыны                    |&lt;br /&gt;
              |   SFX a ыны эмзэ [дзлнстуеыаоэяиюӧӥё]ыны   |&lt;br /&gt;
&lt;br /&gt;
Из 4 слов из wordlist'а он оставил только одно с нужным флагом. Но есть одно ограничение в работе этой утилиты: число словоформ одного слова должно совпадать с количеством суффиксов для нужного флага. Т.е. если количество правил группы больше чем в словоформ в wordlist', то утилита не будет работать и выдаст тот же список. Но, так как munch имеет открытый код, я легко снял это ограничение. Теперь если в wordlist'е есть хотя бы 2 словоформы удовлетворяющие правилам нужного флага, то munch преобразует их в одно слово с флагом. Но пользоваться данной утилитой надо осторожно, иначе для некоторых слов могут быть выбраны неправильные флаги. Что бы это не случилось, надо использовать munch к последовательно получающемуся dic-файлу с '''разными''' aff-файлами, где лежат правила, относящиеся только для одной группы/флага. Ссылка на munch: https://dl.dropbox.com/u/24592250/munch.rar&lt;/div&gt;</summary>
		<author><name>Vorgoron</name></author>
	</entry>
	<entry>
		<id>http://wiki.fu-lab.ru/index.php?title=%D0%A1%D0%BE%D0%B7%D0%B4%D0%B0%D0%BD%D0%B8%D0%B5_Hunspell-%D1%81%D0%BB%D0%BE%D0%B2%D0%B0%D1%80%D1%8F&amp;diff=249</id>
		<title>Создание Hunspell-словаря</title>
		<link rel="alternate" type="text/html" href="http://wiki.fu-lab.ru/index.php?title=%D0%A1%D0%BE%D0%B7%D0%B4%D0%B0%D0%BD%D0%B8%D0%B5_Hunspell-%D1%81%D0%BB%D0%BE%D0%B2%D0%B0%D1%80%D1%8F&amp;diff=249"/>
		<updated>2012-07-17T19:18:00Z</updated>

		<summary type="html">&lt;p&gt;Vorgoron: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;В данной инструкции будет рассмотрено создание hunspell словаря на примере удмуртского словаря hunspell.&lt;br /&gt;
Сначала необходимо установить Hunspell:&lt;br /&gt;
&lt;br /&gt;
 sudo apt-get install hunspell hunspell-tools&lt;br /&gt;
&lt;br /&gt;
'''1. Создание списка слов.''' Для создания словаря нужно иметь большой список слов, wordlist. Список удмуртских слов получен из Удмуртско-русского словаря.&lt;br /&gt;
&lt;br /&gt;
'''2. Создание словаря hunspell.''' &lt;br /&gt;
&lt;br /&gt;
2.1. Формат словаря. Словарь hunspell состоит из двух файлов: &lt;br /&gt;
* первый файл с расширением '''.dic''' - здесь содержится список &amp;quot;корней&amp;quot; слов (стемов) со специальными метками, флагами.&lt;br /&gt;
Фрагмент файла:&lt;br /&gt;
&lt;br /&gt;
 бергатъяны/c&lt;br /&gt;
 бергатылыны/a&lt;br /&gt;
 бергатыны/a&lt;br /&gt;
 бергес&lt;br /&gt;
 бергозы/d&lt;br /&gt;
 берда&lt;br /&gt;
 кыткыны/a&lt;br /&gt;
&lt;br /&gt;
т.е. сначала идет стем, &amp;quot;корень&amp;quot; слова, далее слэш &amp;quot;/&amp;quot;, после слэша ставится флаг, обозначающий к какой группе аффиксов (второй файл) относится данное слово. После слэша может быть несколько флагов.&lt;br /&gt;
&lt;br /&gt;
* во втором файле ('''.aff''') находятся группы аффиксов, обозначенные флагами.&lt;br /&gt;
&lt;br /&gt;
Фрагмент файла:&lt;br /&gt;
&lt;br /&gt;
 SFX a Y 197 #заголовок группы, кол-во аффиксов - 197&lt;br /&gt;
 SFX a ыны он/d [^ьй]ыны&lt;br /&gt;
 ...&lt;br /&gt;
 SFX a ыны эмпотонтэм [дзлнстуеыаоэяиюӧӥё]ыны&lt;br /&gt;
 SFX a ыны эмпотостэм [дзлнстуеыаоэяиюӧӥё]ыны&lt;br /&gt;
 SFX a ыны эмъёстэ [дзлнстуеыаоэяиюӧӥё]ыны&lt;br /&gt;
 SFX a ыны ӥ [дзлнст]ыны&lt;br /&gt;
 '''SFX a ыны ӥд [дзлнст]ыны'''&lt;br /&gt;
 SFX a ыны ӥды [дзлнст]ыны&lt;br /&gt;
 SFX a ыны ӥз [дзлнст]ыны&lt;br /&gt;
 ...&lt;br /&gt;
 SFX a ыны ид [^дзлнстьй]ыны&lt;br /&gt;
&lt;br /&gt;
обозначения:&amp;lt;br/&amp;gt;&lt;br /&gt;
&lt;br /&gt;
'''SFX''' - означает, что это группа суффиксов. Для создания группы префиксов надо использовать PFX&amp;lt;br/&amp;gt;&lt;br /&gt;
'''а''' - наименование флага&amp;lt;br/&amp;gt;&lt;br /&gt;
'''ыны''' - что будет убираться с конца корня слова&amp;lt;br/&amp;gt;&lt;br /&gt;
'''ӥд''' - сам суффикс&amp;lt;br/&amp;gt;&lt;br /&gt;
'''[дзлнст]ыны''' - условие, при котором будет выбираться данный суффикс. В условиях используются регулярные выражения.&amp;lt;br/&amp;gt;&lt;br /&gt;
Остановимся поподробнее на условиях. В '''квадратных скобках''' перечисляется буквы, одна из которых обязательно должна быть на том месте, где стоят эти скобки. В данном примере условию удовлетворяют следующие слова с окончаниями: -дыны, -зыны, -лыны ... -тыны. То есть если в файле с расширением .dic есть слова помеченные флагом &amp;quot;а&amp;quot; и заканчивающиеся на -дыны, -зыны, -лыны ... -тыны, например ''бергатыны/a'', то будет образовываться новые слова с определенным суффиксом: ''бергатӥд''. Далее, если в условии после открывающей квадратной скобки добавлен символ &amp;quot;^&amp;quot;, то это означает, что те буквы, которые заключены в эти скобки, не должны находиться на данной позиции (происходит обратное, отрицание). Например, суффиксу с условием '''SFX a ыны ид [^дзлнстьй]ыны''' подходит слово &amp;quot;кытк'''ыны'''/a&amp;quot; -&amp;gt; &amp;quot;кытк'''ид'''&amp;quot;.&lt;br /&gt;
&lt;br /&gt;
Hunspell может определять одновременно в одном слове максимум два суффикса. Т.е. если определить в файле аффиксов все суффиксы по отдельности, то Hunspell не поймет этого. Например слово '''гыр-ись-ёс-мы-лы''' имеет 4 аффикса, в словаре аффиксов нельзя определить все эти аффиксы по отдельности, поэтому надо будет определить это как один длинный суффикс, либо как 2 суффикса:&amp;lt;br/&amp;gt;&lt;br /&gt;
 ...&lt;br /&gt;
 SFX a ыны ись'''/d''' [^дзлнстьй]ыны&lt;br /&gt;
 ...&lt;br /&gt;
 &lt;br /&gt;
 ...&lt;br /&gt;
 SFX d 0 ёсмылы [ьъй]&lt;br /&gt;
 ...&lt;br /&gt;
&lt;br /&gt;
Для определения второго суффикса в конец вперед идущего суффикса добавляется слэш с нужным флагом. В моём примере суффиксы группы &amp;quot;а&amp;quot; определяют глаголы первого спряжения, суффиксы группы &amp;quot;d&amp;quot; - существительные.&lt;br /&gt;
&lt;br /&gt;
Более подробную информацию о формате словаря вы можете узнать по этой ссылке: http://www.marlamuter.ru/downloads/hunspell2.pdf&lt;br /&gt;
&lt;br /&gt;
2.2. Инструменты.&lt;br /&gt;
&lt;br /&gt;
При создании удмуртского словаря hunspell в основном я пользовался редактором текста Notepad++. Но пользовался некоторыми утилитами из пакета hunspell-tools, о которых я расскажу позже.&lt;/div&gt;</summary>
		<author><name>Vorgoron</name></author>
	</entry>
	<entry>
		<id>http://wiki.fu-lab.ru/index.php?title=%D0%A1%D0%BE%D0%B7%D0%B4%D0%B0%D0%BD%D0%B8%D0%B5_Hunspell-%D1%81%D0%BB%D0%BE%D0%B2%D0%B0%D1%80%D1%8F&amp;diff=248</id>
		<title>Создание Hunspell-словаря</title>
		<link rel="alternate" type="text/html" href="http://wiki.fu-lab.ru/index.php?title=%D0%A1%D0%BE%D0%B7%D0%B4%D0%B0%D0%BD%D0%B8%D0%B5_Hunspell-%D1%81%D0%BB%D0%BE%D0%B2%D0%B0%D1%80%D1%8F&amp;diff=248"/>
		<updated>2012-07-17T17:58:48Z</updated>

		<summary type="html">&lt;p&gt;Vorgoron: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;В данной инструкции будет рассмотрено создание hunspell словаря на примере удмуртского словаря hunspell.&lt;br /&gt;
Сначала необходимо установить Hunspell:&lt;br /&gt;
&lt;br /&gt;
 sudo apt-get install hunspell hunspell-tools&lt;br /&gt;
&lt;br /&gt;
'''1. Создание списка слов.''' Для создания словаря нужно иметь большой список слов, wordlist. Список удмуртских слов получен из Удмуртско-русского словаря.&lt;br /&gt;
&lt;br /&gt;
'''2. Создание словаря hunspell.''' &lt;br /&gt;
&lt;br /&gt;
2.1. Формат словаря. Словарь hunspell состоит из двух файлов: &lt;br /&gt;
* первый файл с расширением '''.dic''' - здесь содержится список &amp;quot;корней&amp;quot; слов (стемов) со специальными метками, флагами.&lt;br /&gt;
Фрагмент файла:&lt;br /&gt;
&lt;br /&gt;
 бергатъяны/c&lt;br /&gt;
 бергатылыны/a&lt;br /&gt;
 бергатыны/a&lt;br /&gt;
 бергес&lt;br /&gt;
 бергозы/d&lt;br /&gt;
 берда&lt;br /&gt;
 кыткыны/a&lt;br /&gt;
&lt;br /&gt;
т.е. сначала идет стем, &amp;quot;корень&amp;quot; слова, далее слэш &amp;quot;/&amp;quot;, после слэша ставится флаг, обозначающий к какой группе аффиксов (второй файл) относится данное слово. После слэша может быть несколько флагов.&lt;br /&gt;
&lt;br /&gt;
* во втором файле ('''.aff''') находятся группы аффиксов, обозначенные флагами.&lt;br /&gt;
&lt;br /&gt;
Фрагмент файла:&lt;br /&gt;
&lt;br /&gt;
 SFX a Y 197 #заголовок группы, кол-во аффиксов - 197&lt;br /&gt;
 SFX a ыны он/d [^ьй]ыны&lt;br /&gt;
 ...&lt;br /&gt;
 SFX a ыны эмпотонтэм [дзлнстуеыаоэяиюӧӥё]ыны&lt;br /&gt;
 SFX a ыны эмпотостэм [дзлнстуеыаоэяиюӧӥё]ыны&lt;br /&gt;
 SFX a ыны эмъёстэ [дзлнстуеыаоэяиюӧӥё]ыны&lt;br /&gt;
 SFX a ыны ӥ [дзлнст]ыны&lt;br /&gt;
 '''SFX a ыны ӥд [дзлнст]ыны'''&lt;br /&gt;
 SFX a ыны ӥды [дзлнст]ыны&lt;br /&gt;
 SFX a ыны ӥз [дзлнст]ыны&lt;br /&gt;
 ...&lt;br /&gt;
 SFX a ыны ид [^дзлнстьй]ыны&lt;br /&gt;
&lt;br /&gt;
обозначения:&amp;lt;br/&amp;gt;&lt;br /&gt;
&lt;br /&gt;
'''SFX''' - означает, что это группа суффиксов. Для создания группы префиксов надо использовать PFX&amp;lt;br/&amp;gt;&lt;br /&gt;
'''а''' - наименование флага&amp;lt;br/&amp;gt;&lt;br /&gt;
'''ыны''' - что будет убираться с конца корня слова&amp;lt;br/&amp;gt;&lt;br /&gt;
'''ӥд''' - сам суффикс&amp;lt;br/&amp;gt;&lt;br /&gt;
'''[дзлнст]ыны''' - условие, при котором будет выбираться данный суффикс. В условиях используются регулярные выражения.&amp;lt;br/&amp;gt;&lt;br /&gt;
Остановимся поподробнее на условиях. В '''квадратных скобках''' перечисляется буквы, одна из которых обязательно должна быть на том месте, где стоят эти скобки. В данном примере условию удовлетворяют следующие слова с окончаниями: -дыны, -зыны, -лыны ... -тыны. То есть если в файле с расширением .dic есть слова помеченные флагом &amp;quot;а&amp;quot; и заканчивающиеся на -дыны, -зыны, -лыны ... -тыны, например ''бергатыны/a'', то будет образовываться новые слова с определенным суффиксом: ''бергатӥд''. Далее, если в условии после открывающей квадратной скобки добавлен символ &amp;quot;^&amp;quot;, то это означает, что те буквы, которые заключены в эти скобки, не должны находиться на данной позиции (происходит обратное, отрицание). Например, суффиксу с условием '''SFX a ыны ид [^дзлнстьй]ыны''' подходит слово &amp;quot;кытк'''ыны'''/a&amp;quot; -&amp;gt; &amp;quot;кытк'''ид'''&amp;quot;.&lt;br /&gt;
&lt;br /&gt;
Hunspell может определять одновременно в одном слове максимум два суффикса. Т.е. если определить в файле аффиксов все суффиксы по отдельности, то Hunspell не поймет этого. Например слово '''гыр-ись-ёс-мы-лы''' имеет 4 аффикса, в словаре аффиксов нельзя определить все эти аффиксы по отдельности, поэтому надо будет определить это как один длинный суффикс, либо как 2 суффикса:&amp;lt;br/&amp;gt;&lt;br /&gt;
 ...&lt;br /&gt;
 SFX a ыны ись/d [^дзлнстьй]ыны&lt;br /&gt;
 ...&lt;br /&gt;
&lt;br /&gt;
 ...&lt;br /&gt;
 SFX d 0 ёсмылы [ьъй]&lt;br /&gt;
 ...&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
Более подробную информацию о формате словаря вы можете узнать по этой ссылке: http://www.marlamuter.ru/downloads/hunspell2.pdf&lt;br /&gt;
&lt;br /&gt;
2.2. Инструменты.&lt;br /&gt;
&lt;br /&gt;
При создании удмуртского словаря hunspell в основном я пользовался редактором текста Notepad++. Но пользовался некоторыми утилитами из пакета hunspell-tools, о которых я расскажу позже.&lt;/div&gt;</summary>
		<author><name>Vorgoron</name></author>
	</entry>
	<entry>
		<id>http://wiki.fu-lab.ru/index.php?title=%D0%A1%D0%BE%D0%B7%D0%B4%D0%B0%D0%BD%D0%B8%D0%B5_Hunspell-%D1%81%D0%BB%D0%BE%D0%B2%D0%B0%D1%80%D1%8F&amp;diff=247</id>
		<title>Создание Hunspell-словаря</title>
		<link rel="alternate" type="text/html" href="http://wiki.fu-lab.ru/index.php?title=%D0%A1%D0%BE%D0%B7%D0%B4%D0%B0%D0%BD%D0%B8%D0%B5_Hunspell-%D1%81%D0%BB%D0%BE%D0%B2%D0%B0%D1%80%D1%8F&amp;diff=247"/>
		<updated>2012-07-17T10:10:05Z</updated>

		<summary type="html">&lt;p&gt;Vorgoron: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;В данной инструкции будет рассмотрено создание hunspell словаря на примере удмуртского словаря hunspell.&lt;br /&gt;
Сначала необходимо установить Hunspell:&lt;br /&gt;
&lt;br /&gt;
 sudo apt-get install hunspell hunspell-tools&lt;br /&gt;
&lt;br /&gt;
'''1. Создание списка слов.''' Для создания словаря нужно иметь большой список слов, wordlist. Список удмуртских слов получен из Удмуртско-русского словаря.&lt;br /&gt;
&lt;br /&gt;
'''2. Создание словаря hunspell.''' &lt;br /&gt;
&lt;br /&gt;
2.1. Формат словаря. Словарь hunspell состоит из двух файлов: &lt;br /&gt;
* первый файл с расширением '''.dic''' - здесь содержится список &amp;quot;корней&amp;quot; слов (стемов) со специальными метками, флагами.&lt;br /&gt;
Фрагмент файла:&lt;br /&gt;
&lt;br /&gt;
 бергатъяны/c&lt;br /&gt;
 бергатылыны/a&lt;br /&gt;
 бергатыны/a&lt;br /&gt;
 бергес&lt;br /&gt;
 бергозы/d&lt;br /&gt;
 берда&lt;br /&gt;
 кыткыны/a&lt;br /&gt;
&lt;br /&gt;
т.е. сначала идет стем, &amp;quot;корень&amp;quot; слова, далее слэш &amp;quot;/&amp;quot;, после слэша ставится флаг, обозначающий к какой группе аффиксов (второй файл) относится данное слово. После слэша может быть несколько флагов.&lt;br /&gt;
&lt;br /&gt;
* во втором файле ('''.aff''') находятся группы аффиксов, обозначенные флагами.&lt;br /&gt;
&lt;br /&gt;
Фрагмент файла:&lt;br /&gt;
&lt;br /&gt;
 SFX a Y 197 #заголовок группы, кол-во аффиксов - 197&lt;br /&gt;
 SFX a ыны он/d [^ьй]ыны&lt;br /&gt;
 ...&lt;br /&gt;
 SFX a ыны эмпотонтэм [дзлнстуеыаоэяиюӧӥё]ыны&lt;br /&gt;
 SFX a ыны эмпотостэм [дзлнстуеыаоэяиюӧӥё]ыны&lt;br /&gt;
 SFX a ыны эмъёстэ [дзлнстуеыаоэяиюӧӥё]ыны&lt;br /&gt;
 SFX a ыны ӥ [дзлнст]ыны&lt;br /&gt;
 '''SFX a ыны ӥд [дзлнст]ыны'''&lt;br /&gt;
 SFX a ыны ӥды [дзлнст]ыны&lt;br /&gt;
 SFX a ыны ӥз [дзлнст]ыны&lt;br /&gt;
 ...&lt;br /&gt;
 SFX a ыны ид [^дзлнстьй]ыны&lt;br /&gt;
&lt;br /&gt;
обозначения:&amp;lt;br/&amp;gt;&lt;br /&gt;
&lt;br /&gt;
'''SFX''' - означает, что это группа суффиксов. Для создания группы префиксов надо использовать PFX&amp;lt;br/&amp;gt;&lt;br /&gt;
'''а''' - наименование флага&amp;lt;br/&amp;gt;&lt;br /&gt;
'''ыны''' - что будет убираться с конца корня слова&amp;lt;br/&amp;gt;&lt;br /&gt;
'''ӥд''' - сам суффикс&amp;lt;br/&amp;gt;&lt;br /&gt;
'''[дзлнст]ыны''' - условие, при котором будет выбираться данный суффикс. В условиях используются регулярные выражения.&amp;lt;br/&amp;gt;&lt;br /&gt;
Остановимся поподробнее на условиях. В '''квадратных скобках''' перечисляется буквы, одна из которых обязательно должна быть на том месте, где стоят эти скобки. В данном примере условию удовлетворяют следующие слова с окончаниями: -дыны, -зыны, -лыны ... -тыны. То есть если в файле с расширением .dic есть слова помеченные флагом &amp;quot;а&amp;quot; и заканчивающиеся на -дыны, -зыны, -лыны ... -тыны, например ''бергатыны/a'', то будет образовываться новые слова с определенным суффиксом: ''бергатӥд''. Далее, если в условии после открывающей квадратной скобки добавлен символ &amp;quot;^&amp;quot;, то это означает, что те буквы, которые заключены в эти скобки, не должны находиться на данной позиции (происходит обратное, отрицание). Например, суффиксу с условием '''SFX a ыны ид [^дзлнстьй]ыны''' подходит слово &amp;quot;кытк'''ыны'''/a&amp;quot; -&amp;gt; &amp;quot;кытк'''ид'''&amp;quot;.&lt;br /&gt;
&lt;br /&gt;
Более подробную информацию о формате словаря вы можете узнать по этой ссылке: http://www.marlamuter.ru/downloads/hunspell2.pdf&lt;br /&gt;
&lt;br /&gt;
2.2. Инструменты.&lt;/div&gt;</summary>
		<author><name>Vorgoron</name></author>
	</entry>
	<entry>
		<id>http://wiki.fu-lab.ru/index.php?title=%D0%A1%D0%BE%D0%B7%D0%B4%D0%B0%D0%BD%D0%B8%D0%B5_Hunspell-%D1%81%D0%BB%D0%BE%D0%B2%D0%B0%D1%80%D1%8F&amp;diff=246</id>
		<title>Создание Hunspell-словаря</title>
		<link rel="alternate" type="text/html" href="http://wiki.fu-lab.ru/index.php?title=%D0%A1%D0%BE%D0%B7%D0%B4%D0%B0%D0%BD%D0%B8%D0%B5_Hunspell-%D1%81%D0%BB%D0%BE%D0%B2%D0%B0%D1%80%D1%8F&amp;diff=246"/>
		<updated>2012-07-17T10:09:47Z</updated>

		<summary type="html">&lt;p&gt;Vorgoron: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;В данной инструкции будет рассмотрено создание hunspell словаря на примере удмуртского словаря hunspell.&lt;br /&gt;
Сначала необходимо установить Hunspell:&lt;br /&gt;
&lt;br /&gt;
 sudo apt-get install hunspell hunspell-tools&lt;br /&gt;
&lt;br /&gt;
'''1. Создание списка слов.''' Для создания словаря нужно иметь большой список слов, wordlist. Список удмуртских слов получен из Удмуртско-русского словаря.&lt;br /&gt;
&lt;br /&gt;
'''2. Создание словаря hunspell.''' &lt;br /&gt;
2.1. Формат словаря. Словарь hunspell состоит из двух файлов: &lt;br /&gt;
* первый файл с расширением '''.dic''' - здесь содержится список &amp;quot;корней&amp;quot; слов (стемов) со специальными метками, флагами.&lt;br /&gt;
Фрагмент файла:&lt;br /&gt;
&lt;br /&gt;
 бергатъяны/c&lt;br /&gt;
 бергатылыны/a&lt;br /&gt;
 бергатыны/a&lt;br /&gt;
 бергес&lt;br /&gt;
 бергозы/d&lt;br /&gt;
 берда&lt;br /&gt;
 кыткыны/a&lt;br /&gt;
&lt;br /&gt;
т.е. сначала идет стем, &amp;quot;корень&amp;quot; слова, далее слэш &amp;quot;/&amp;quot;, после слэша ставится флаг, обозначающий к какой группе аффиксов (второй файл) относится данное слово. После слэша может быть несколько флагов.&lt;br /&gt;
&lt;br /&gt;
* во втором файле ('''.aff''') находятся группы аффиксов, обозначенные флагами.&lt;br /&gt;
&lt;br /&gt;
Фрагмент файла:&lt;br /&gt;
&lt;br /&gt;
 SFX a Y 197 #заголовок группы, кол-во аффиксов - 197&lt;br /&gt;
 SFX a ыны он/d [^ьй]ыны&lt;br /&gt;
 ...&lt;br /&gt;
 SFX a ыны эмпотонтэм [дзлнстуеыаоэяиюӧӥё]ыны&lt;br /&gt;
 SFX a ыны эмпотостэм [дзлнстуеыаоэяиюӧӥё]ыны&lt;br /&gt;
 SFX a ыны эмъёстэ [дзлнстуеыаоэяиюӧӥё]ыны&lt;br /&gt;
 SFX a ыны ӥ [дзлнст]ыны&lt;br /&gt;
 '''SFX a ыны ӥд [дзлнст]ыны'''&lt;br /&gt;
 SFX a ыны ӥды [дзлнст]ыны&lt;br /&gt;
 SFX a ыны ӥз [дзлнст]ыны&lt;br /&gt;
 ...&lt;br /&gt;
 SFX a ыны ид [^дзлнстьй]ыны&lt;br /&gt;
&lt;br /&gt;
обозначения:&amp;lt;br/&amp;gt;&lt;br /&gt;
&lt;br /&gt;
'''SFX''' - означает, что это группа суффиксов. Для создания группы префиксов надо использовать PFX&amp;lt;br/&amp;gt;&lt;br /&gt;
'''а''' - наименование флага&amp;lt;br/&amp;gt;&lt;br /&gt;
'''ыны''' - что будет убираться с конца корня слова&amp;lt;br/&amp;gt;&lt;br /&gt;
'''ӥд''' - сам суффикс&amp;lt;br/&amp;gt;&lt;br /&gt;
'''[дзлнст]ыны''' - условие, при котором будет выбираться данный суффикс. В условиях используются регулярные выражения.&amp;lt;br/&amp;gt;&lt;br /&gt;
Остановимся поподробнее на условиях. В '''квадратных скобках''' перечисляется буквы, одна из которых обязательно должна быть на том месте, где стоят эти скобки. В данном примере условию удовлетворяют следующие слова с окончаниями: -дыны, -зыны, -лыны ... -тыны. То есть если в файле с расширением .dic есть слова помеченные флагом &amp;quot;а&amp;quot; и заканчивающиеся на -дыны, -зыны, -лыны ... -тыны, например ''бергатыны/a'', то будет образовываться новые слова с определенным суффиксом: ''бергатӥд''. Далее, если в условии после открывающей квадратной скобки добавлен символ &amp;quot;^&amp;quot;, то это означает, что те буквы, которые заключены в эти скобки, не должны находиться на данной позиции (происходит обратное, отрицание). Например, суффиксу с условием '''SFX a ыны ид [^дзлнстьй]ыны''' подходит слово &amp;quot;кытк'''ыны'''/a&amp;quot; -&amp;gt; &amp;quot;кытк'''ид'''&amp;quot;.&lt;br /&gt;
&lt;br /&gt;
Более подробную информацию о формате словаря вы можете узнать по этой ссылке: http://www.marlamuter.ru/downloads/hunspell2.pdf&lt;br /&gt;
&lt;br /&gt;
2.2. Инструменты.&lt;/div&gt;</summary>
		<author><name>Vorgoron</name></author>
	</entry>
	<entry>
		<id>http://wiki.fu-lab.ru/index.php?title=%D0%A1%D0%BE%D0%B7%D0%B4%D0%B0%D0%BD%D0%B8%D0%B5_Hunspell-%D1%81%D0%BB%D0%BE%D0%B2%D0%B0%D1%80%D1%8F&amp;diff=245</id>
		<title>Создание Hunspell-словаря</title>
		<link rel="alternate" type="text/html" href="http://wiki.fu-lab.ru/index.php?title=%D0%A1%D0%BE%D0%B7%D0%B4%D0%B0%D0%BD%D0%B8%D0%B5_Hunspell-%D1%81%D0%BB%D0%BE%D0%B2%D0%B0%D1%80%D1%8F&amp;diff=245"/>
		<updated>2012-07-17T10:08:36Z</updated>

		<summary type="html">&lt;p&gt;Vorgoron: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;В данной инструкции будет рассмотрено создание hunspell словаря на примере удмуртского словаря hunspell.&lt;br /&gt;
Сначала необходимо установить Hunspell:&lt;br /&gt;
&lt;br /&gt;
 sudo apt-get install hunspell hunspell-tools&lt;br /&gt;
&lt;br /&gt;
#'''Создание списка слов.''' Для создания словаря нужно иметь большой список слов, wordlist. Список удмуртских слов получен из Удмуртско-русского словаря.&lt;br /&gt;
&lt;br /&gt;
#'''Создание словаря hunspell.''' &lt;br /&gt;
##Формат словаря. Словарь hunspell состоит из двух файлов: &lt;br /&gt;
* первый файл с расширением '''.dic''' - здесь содержится список &amp;quot;корней&amp;quot; слов (стемов) со специальными метками, флагами.&lt;br /&gt;
Фрагмент файла:&lt;br /&gt;
&lt;br /&gt;
 бергатъяны/c&lt;br /&gt;
 бергатылыны/a&lt;br /&gt;
 бергатыны/a&lt;br /&gt;
 бергес&lt;br /&gt;
 бергозы/d&lt;br /&gt;
 берда&lt;br /&gt;
 кыткыны/a&lt;br /&gt;
&lt;br /&gt;
т.е. сначала идет стем, &amp;quot;корень&amp;quot; слова, далее слэш &amp;quot;/&amp;quot;, после слэша ставится флаг, обозначающий к какой группе аффиксов (второй файл) относится данное слово. После слэша может быть несколько флагов.&lt;br /&gt;
&lt;br /&gt;
* во втором файле ('''.aff''') находятся группы аффиксов, обозначенные флагами.&lt;br /&gt;
&lt;br /&gt;
Фрагмент файла:&lt;br /&gt;
&lt;br /&gt;
 SFX a Y 197 #заголовок группы, кол-во аффиксов - 197&lt;br /&gt;
 SFX a ыны он/d [^ьй]ыны&lt;br /&gt;
 ...&lt;br /&gt;
 SFX a ыны эмпотонтэм [дзлнстуеыаоэяиюӧӥё]ыны&lt;br /&gt;
 SFX a ыны эмпотостэм [дзлнстуеыаоэяиюӧӥё]ыны&lt;br /&gt;
 SFX a ыны эмъёстэ [дзлнстуеыаоэяиюӧӥё]ыны&lt;br /&gt;
 SFX a ыны ӥ [дзлнст]ыны&lt;br /&gt;
 '''SFX a ыны ӥд [дзлнст]ыны'''&lt;br /&gt;
 SFX a ыны ӥды [дзлнст]ыны&lt;br /&gt;
 SFX a ыны ӥз [дзлнст]ыны&lt;br /&gt;
 ...&lt;br /&gt;
 SFX a ыны ид [^дзлнстьй]ыны&lt;br /&gt;
&lt;br /&gt;
обозначения:&amp;lt;br/&amp;gt;&lt;br /&gt;
&lt;br /&gt;
'''SFX''' - означает, что это группа суффиксов. Для создания группы префиксов надо использовать PFX&amp;lt;br/&amp;gt;&lt;br /&gt;
'''а''' - наименование флага&amp;lt;br/&amp;gt;&lt;br /&gt;
'''ыны''' - что будет убираться с конца корня слова&amp;lt;br/&amp;gt;&lt;br /&gt;
'''ӥд''' - сам суффикс&amp;lt;br/&amp;gt;&lt;br /&gt;
'''[дзлнст]ыны''' - условие, при котором будет выбираться данный суффикс. В условиях используются регулярные выражения.&amp;lt;br/&amp;gt;&lt;br /&gt;
Остановимся поподробнее на условиях. В '''квадратных скобках''' перечисляется буквы, одна из которых обязательно должна быть на том месте, где стоят эти скобки. В данном примере условию удовлетворяют следующие слова с окончаниями: -дыны, -зыны, -лыны ... -тыны. То есть если в файле с расширением .dic есть слова помеченные флагом &amp;quot;а&amp;quot; и заканчивающиеся на -дыны, -зыны, -лыны ... -тыны, например ''бергатыны/a'', то будет образовываться новые слова с определенным суффиксом: ''бергатӥд''. Далее, если в условии после открывающей квадратной скобки добавлен символ &amp;quot;^&amp;quot;, то это означает, что те буквы, которые заключены в эти скобки, не должны находиться на данной позиции (происходит обратное, отрицание). Например, суффиксу с условием '''SFX a ыны ид [^дзлнстьй]ыны''' подходит слово &amp;quot;кытк'''ыны'''/a&amp;quot; -&amp;gt; &amp;quot;кытк'''ид'''&amp;quot;.&lt;br /&gt;
&lt;br /&gt;
Более подробную информацию о формате словаря вы можете узнать по этой ссылке: http://www.marlamuter.ru/downloads/hunspell2.pdf&lt;br /&gt;
&lt;br /&gt;
## Инструменты.&lt;/div&gt;</summary>
		<author><name>Vorgoron</name></author>
	</entry>
	<entry>
		<id>http://wiki.fu-lab.ru/index.php?title=%D0%A1%D0%BE%D0%B7%D0%B4%D0%B0%D0%BD%D0%B8%D0%B5_Hunspell-%D1%81%D0%BB%D0%BE%D0%B2%D0%B0%D1%80%D1%8F&amp;diff=244</id>
		<title>Создание Hunspell-словаря</title>
		<link rel="alternate" type="text/html" href="http://wiki.fu-lab.ru/index.php?title=%D0%A1%D0%BE%D0%B7%D0%B4%D0%B0%D0%BD%D0%B8%D0%B5_Hunspell-%D1%81%D0%BB%D0%BE%D0%B2%D0%B0%D1%80%D1%8F&amp;diff=244"/>
		<updated>2012-07-17T10:07:21Z</updated>

		<summary type="html">&lt;p&gt;Vorgoron: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;В данной инструкции будет рассмотрено создание hunspell словаря на примере удмуртского словаря hunspell.&lt;br /&gt;
Сначала необходимо установить Hunspell:&lt;br /&gt;
&lt;br /&gt;
 sudo apt-get install hunspell hunspell-tools&lt;br /&gt;
&lt;br /&gt;
'''# Создание списка слов.''' Для создания словаря нужно иметь большой список слов, wordlist. Список удмуртских слов получен из Удмуртско-русского словаря.&lt;br /&gt;
&lt;br /&gt;
'''# Создание словаря hunspell.''' &lt;br /&gt;
##Формат словаря. Словарь hunspell состоит из двух файлов: &lt;br /&gt;
* первый файл с расширением '''.dic''' - здесь содержится список &amp;quot;корней&amp;quot; слов (стемов) со специальными метками, флагами.&lt;br /&gt;
Фрагмент файла:&lt;br /&gt;
&lt;br /&gt;
 бергатъяны/c&lt;br /&gt;
 бергатылыны/a&lt;br /&gt;
 бергатыны/a&lt;br /&gt;
 бергес&lt;br /&gt;
 бергозы/d&lt;br /&gt;
 берда&lt;br /&gt;
 кыткыны/a&lt;br /&gt;
&lt;br /&gt;
т.е. сначала идет стем, &amp;quot;корень&amp;quot; слова, далее слэш &amp;quot;/&amp;quot;, после слэша ставится флаг, обозначающий к какой группе аффиксов (второй файл) относится данное слово. После слэша может быть несколько флагов.&lt;br /&gt;
&lt;br /&gt;
* во втором файле ('''.aff''') находятся группы аффиксов, обозначенные флагами.&lt;br /&gt;
&lt;br /&gt;
Фрагмент файла:&lt;br /&gt;
&lt;br /&gt;
 SFX a Y 197 #заголовок группы, кол-во аффиксов - 197&lt;br /&gt;
 SFX a ыны он/d [^ьй]ыны&lt;br /&gt;
 ...&lt;br /&gt;
 SFX a ыны эмпотонтэм [дзлнстуеыаоэяиюӧӥё]ыны&lt;br /&gt;
 SFX a ыны эмпотостэм [дзлнстуеыаоэяиюӧӥё]ыны&lt;br /&gt;
 SFX a ыны эмъёстэ [дзлнстуеыаоэяиюӧӥё]ыны&lt;br /&gt;
 SFX a ыны ӥ [дзлнст]ыны&lt;br /&gt;
 '''SFX a ыны ӥд [дзлнст]ыны'''&lt;br /&gt;
 SFX a ыны ӥды [дзлнст]ыны&lt;br /&gt;
 SFX a ыны ӥз [дзлнст]ыны&lt;br /&gt;
 ...&lt;br /&gt;
 SFX a ыны ид [^дзлнстьй]ыны&lt;br /&gt;
&lt;br /&gt;
обозначения:&amp;lt;br/&amp;gt;&lt;br /&gt;
&lt;br /&gt;
'''SFX''' - означает, что это группа суффиксов. Для создания группы префиксов надо использовать PFX&amp;lt;br/&amp;gt;&lt;br /&gt;
'''а''' - наименование флага&amp;lt;br/&amp;gt;&lt;br /&gt;
'''ыны''' - что будет убираться с конца корня слова&amp;lt;br/&amp;gt;&lt;br /&gt;
'''ӥд''' - сам суффикс&amp;lt;br/&amp;gt;&lt;br /&gt;
'''[дзлнст]ыны''' - условие, при котором будет выбираться данный суффикс. В условиях используются регулярные выражения.&amp;lt;br/&amp;gt;&lt;br /&gt;
Остановимся поподробнее на условиях. В '''квадратных скобках''' перечисляется буквы, одна из которых обязательно должна быть на том месте, где стоят эти скобки. В данном примере условию удовлетворяют следующие слова с окончаниями: -дыны, -зыны, -лыны ... -тыны. То есть если в файле с расширением .dic есть слова помеченные флагом &amp;quot;а&amp;quot; и заканчивающиеся на -дыны, -зыны, -лыны ... -тыны, например ''бергатыны/a'', то будет образовываться новые слова с определенным суффиксом: ''бергатӥд''. Далее, если в условии после открывающей квадратной скобки добавлен символ &amp;quot;^&amp;quot;, то это означает, что те буквы, которые заключены в эти скобки, не должны находиться на данной позиции (происходит обратное, отрицание). Например, суффиксу с условием '''SFX a ыны ид [^дзлнстьй]ыны''' подходит слово &amp;quot;кытк'''ыны'''/a&amp;quot; -&amp;gt; &amp;quot;кытк'''ид'''&amp;quot;.&lt;br /&gt;
&lt;br /&gt;
Более подробную информацию о формате словаря вы можете узнать по этой ссылке: http://www.marlamuter.ru/downloads/hunspell2.pdf&lt;br /&gt;
&lt;br /&gt;
## Инструменты.&lt;/div&gt;</summary>
		<author><name>Vorgoron</name></author>
	</entry>
	<entry>
		<id>http://wiki.fu-lab.ru/index.php?title=%D0%A1%D0%BE%D0%B7%D0%B4%D0%B0%D0%BD%D0%B8%D0%B5_Hunspell-%D1%81%D0%BB%D0%BE%D0%B2%D0%B0%D1%80%D1%8F&amp;diff=241</id>
		<title>Создание Hunspell-словаря</title>
		<link rel="alternate" type="text/html" href="http://wiki.fu-lab.ru/index.php?title=%D0%A1%D0%BE%D0%B7%D0%B4%D0%B0%D0%BD%D0%B8%D0%B5_Hunspell-%D1%81%D0%BB%D0%BE%D0%B2%D0%B0%D1%80%D1%8F&amp;diff=241"/>
		<updated>2012-07-16T21:24:55Z</updated>

		<summary type="html">&lt;p&gt;Vorgoron: &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;В данной инструкции будет рассмотрено создание hunspell словаря на примере удмуртского словаря hunspell.&lt;br /&gt;
Сначала необходимо установить Hunspell:&lt;br /&gt;
&lt;br /&gt;
sudo apt-get install hunspell hunspell-tools&lt;br /&gt;
&lt;br /&gt;
'''1. Создание списка слов.''' Для создания словаря нужно иметь большой список слов, wordlist. Список удмуртских слов я получал из Удмуртско-русского словаря.&lt;br /&gt;
&lt;br /&gt;
'''2. Создание словаря hunspell.''' Словарь hunspell состоит из двух файлов: &lt;br /&gt;
* первый файл с расширением .dic - здесь содержится список &amp;quot;корней&amp;quot; слов (стемов) со специальными метками, флагами.&lt;br /&gt;
Фрагмент файла:&lt;br /&gt;
&lt;br /&gt;
бергатӥськыны/a&lt;br /&gt;
бергатъяны/c&lt;br /&gt;
бергатылыны/a&lt;br /&gt;
бергатыны/a&lt;br /&gt;
бергес&lt;br /&gt;
бергозы/d&lt;br /&gt;
берда&lt;br /&gt;
&lt;br /&gt;
т.е. сначала идет стем, &amp;quot;корень&amp;quot; слова, далее слэш &amp;quot;/&amp;quot;, после слэша ставится флаг, обозначающий к какой группе аффиксов (второй файл) относится данное слово. После слэша может быть несколько флагов.&lt;br /&gt;
&lt;br /&gt;
* во втором файле (.aff) находятся группы аффиксов, обозначенные флагами.&lt;br /&gt;
Фрагмент файла:&lt;br /&gt;
&lt;br /&gt;
SFX a Y 197 #заголовок группы, кол-во аффиксов - 197&lt;br /&gt;
SFX a ыны он/d [^ьй]ыны&lt;br /&gt;
&lt;br /&gt;
...&lt;br /&gt;
&lt;br /&gt;
SFX a ыны эмпотонтэм [дзлнстуеыаоэяиюӧӥё]ыны&lt;br /&gt;
SFX a ыны эмпотостэм [дзлнстуеыаоэяиюӧӥё]ыны&lt;br /&gt;
SFX a ыны эмъёстэ [дзлнстуеыаоэяиюӧӥё]ыны&lt;br /&gt;
SFX a ыны ӥ [дзлнст]ыны&lt;br /&gt;
''SFX a ыны ӥд [дзлнст]ыны''&lt;br /&gt;
SFX a ыны ӥды [дзлнст]ыны&lt;br /&gt;
SFX a ыны ӥз [дзлнст]ыны&lt;br /&gt;
&lt;br /&gt;
обозначения:&lt;br /&gt;
SFX - означает, что это группа суффиксов,&lt;br /&gt;
а - наименование флага&lt;br /&gt;
ыны - что будет убираться с конца стема&lt;br /&gt;
ӥд - сам суффикс&lt;br /&gt;
[дзлнст]ыны - условие, при котором будет выбираться данный суффикс. В условиях используются регулярные выражения.&lt;br /&gt;
&lt;br /&gt;
Более подробную информацию о формате словаря вы можете узнать по этой ссылке: http://www.marlamuter.ru/downloads/hunspell2.pdf&lt;/div&gt;</summary>
		<author><name>Vorgoron</name></author>
	</entry>
	<entry>
		<id>http://wiki.fu-lab.ru/index.php?title=%D0%A1%D0%BE%D0%B7%D0%B4%D0%B0%D0%BD%D0%B8%D0%B5_Hunspell-%D1%81%D0%BB%D0%BE%D0%B2%D0%B0%D1%80%D1%8F&amp;diff=240</id>
		<title>Создание Hunspell-словаря</title>
		<link rel="alternate" type="text/html" href="http://wiki.fu-lab.ru/index.php?title=%D0%A1%D0%BE%D0%B7%D0%B4%D0%B0%D0%BD%D0%B8%D0%B5_Hunspell-%D1%81%D0%BB%D0%BE%D0%B2%D0%B0%D1%80%D1%8F&amp;diff=240"/>
		<updated>2012-07-16T18:23:53Z</updated>

		<summary type="html">&lt;p&gt;Vorgoron: Новая страница: «В данной инструкции будет рассмотрено создание hunspell словаря на примере удмуртского сло…»&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;В данной инструкции будет рассмотрено создание hunspell словаря на примере удмуртского словаря hunspell.&lt;br /&gt;
Сначала необходимо установить Hunspell:&lt;br /&gt;
&lt;br /&gt;
sudo apt-get install hunspell hunspell-tools&lt;br /&gt;
&lt;br /&gt;
'''1. Создание списка слов.''' Для создания словаря нужно иметь большой список слов, wordlist. Список удмуртских слов я получал из Удмуртско-русского словаря.&lt;br /&gt;
&lt;br /&gt;
'''2. Создание словаря hunspell.''' Словарь hunspell состоит из двух файлов: &lt;br /&gt;
* первый файл с расширением .dic - здесь содержится список &amp;quot;корней&amp;quot; слов (стемов) со специальными метками, флагами.&lt;br /&gt;
Фрагмент файла:&lt;br /&gt;
&lt;br /&gt;
бергатӥськыны/a&lt;br /&gt;
бергатъяны/c&lt;br /&gt;
бергатылыны/a&lt;br /&gt;
бергатыны/a&lt;br /&gt;
бергес&lt;br /&gt;
бергозы/d&lt;br /&gt;
берда&lt;br /&gt;
&lt;br /&gt;
т.е. сначала идет стем, &amp;quot;корень&amp;quot; слова, далее слэш &amp;quot;/&amp;quot;, после слэша ставится флаг, обозначающий к какой группе аффиксов (второй файл) относится данное слово. После слэша может быть несколько флагов.&lt;br /&gt;
&lt;br /&gt;
* во втором файле (.aff) находятся группы аффиксов, обозначенные флагами.&lt;br /&gt;
Фрагмент файла:&lt;br /&gt;
&lt;br /&gt;
SFX a Y 197 #заголовок группы, кол-во аффиксов - 197&lt;br /&gt;
SFX a ыны он/d [^ьй]ыны&lt;br /&gt;
&lt;br /&gt;
...&lt;br /&gt;
&lt;br /&gt;
SFX a ыны эмпотонтэм [дзлнстуеыаоэяиюӧӥё]ыны&lt;br /&gt;
SFX a ыны эмпотостэм [дзлнстуеыаоэяиюӧӥё]ыны&lt;br /&gt;
SFX a ыны эмъёстэ [дзлнстуеыаоэяиюӧӥё]ыны&lt;br /&gt;
SFX a ыны ӥ [дзлнст]ыны&lt;br /&gt;
''SFX a ыны ӥд [дзлнст]ыны''&lt;br /&gt;
SFX a ыны ӥды [дзлнст]ыны&lt;br /&gt;
SFX a ыны ӥз [дзлнст]ыны&lt;br /&gt;
&lt;br /&gt;
обозначения:&lt;br /&gt;
SFX - означает, что это группа суффиксов,&lt;br /&gt;
а - наименование флага&lt;br /&gt;
ыны - что будет убираться с конца стема&lt;br /&gt;
ӥд - сам суффикс&lt;br /&gt;
[дзлнст]ыны - условие, при котором будет выбираться данный суффикс&lt;/div&gt;</summary>
		<author><name>Vorgoron</name></author>
	</entry>
</feed>