AntConc: различия между версиями
Ӧньӧ Лав (обсуждение | вклад) Нет описания правки |
Admin (обсуждение | вклад) (→Ссылки) |
||
(не показано 12 промежуточных версий 2 участников) | |||
Строка 1: | Строка 1: | ||
==Введение== | ==Введение== | ||
Корпус-менеджер [http://www.antlab.sci.waseda.ac.jp/antconc_index.html '''AntConc'''] разработчика [http://www.antlab.sci.waseda.ac.jp/resume.html Dr. Laurence Anthony] предназначен для обработки корпусов первого порядка. С помощью данной программы можно производить поиск и подсчет различных элементов текста, анализировать частотность и контекст употребления словоформ, словосочетаний и морфем, сравнивать употребительность словоформ в разных текстах. | Корпус-менеджер [http://www.antlab.sci.waseda.ac.jp/antconc_index.html '''AntConc'''] разработчика [http://www.antlab.sci.waseda.ac.jp/resume.html Dr. Laurence Anthony] предназначен для обработки корпусов первого порядка. С помощью данной программы можно производить поиск и подсчет различных элементов текста, анализировать частотность и контекст употребления словоформ, словосочетаний и морфем, сравнивать употребительность словоформ в разных текстах. | ||
Строка 20: | Строка 21: | ||
[[Файл:КОРПУС2.png|700px]] | [[Файл:КОРПУС2.png|700px]] | ||
Для того, что слова с дефисом воспринимались в поиске как за одно слово, поставьте галочки: | |||
[[Файл:AntConc.png|700px]] | |||
В свободном доступе также один коми текст и 10 удмуртских текстов, предназначенных для начального этапа освоения работы с программой AntConc. | В свободном доступе также один коми текст и 10 удмуртских текстов, предназначенных для начального этапа освоения работы с программой AntConc. | ||
[[Файл:ПАПКИ3.png]] | [[Файл:ПАПКИ3.png]] | ||
==Использование регулярных выражений== | |||
Пример использования регулярного выражения "'''\w+де'''": | |||
[[Файл:AntConc2.png|700px]] | |||
Пример использования регулярного выражения "'''\w+де\s'''" (все слова, которые заканчиваются на -'''де''', далее пробел): | |||
[[Файл:AntConc3.png|700px]] | |||
Пример использования регулярного выражения "'''\w+де[\s,.]'''" (все слова, которые заканчиваются на -'''де''', далее пробел, запятая или точка): | |||
[[Файл:AntConc4.png|700px]] | |||
==Видеоурок от разработчика== | |||
<youtube>https://youtu.be/9TsqFVrUYO0</youtube> | |||
==Ссылки== | ==Ссылки== | ||
Строка 29: | Строка 52: | ||
* [http://www.youtube.com/watch?v=9TsqFVrUYO0 Мастер-класс по AntConc от Лоренса Энтони] | * [http://www.youtube.com/watch?v=9TsqFVrUYO0 Мастер-класс по AntConc от Лоренса Энтони] | ||
* [[Удмуртско-русский электронный словарь]] | * [[Удмуртско-русский электронный словарь]] | ||
* [http://www.elib.grsu.by/katalog/161580-347278.pdf Станкевич,А.Ю. Поиск контекстов и оценка их типичности средствами AntConc] | |||
* [http://habrahabr.ru/post/115825/ Регулярные выражения, пособие для новичков. Часть 1] | |||
* [http://www.codenet.ru/webmast/php/regexps.php Введение в регулярные выражения. Синтаксис] | |||
[[Category:Инструментарий (коми кыв)]] | [[Category:Инструментарий (коми кыв)]] | ||
[[Category: | [[Category:Марий йылме]] | ||
[[Category: | [[Category:Удмурт кыл]] | ||
[[Категория:Проект_Ӟ]] | [[Категория:Проект_Ӟ]] |
Текущая версия от 13:04, 3 февраля 2016
Введение
Корпус-менеджер AntConc разработчика Dr. Laurence Anthony предназначен для обработки корпусов первого порядка. С помощью данной программы можно производить поиск и подсчет различных элементов текста, анализировать частотность и контекст употребления словоформ, словосочетаний и морфем, сравнивать употребительность словоформ в разных текстах.
Отсутствие морфологического анализатора частично компенсируется возможностью подключения пользовательского списка лемм. Программа может быть использована для получения привязанных к заданной предметной области словарных минимумов, списков устойчивых сочетаний (в том числе терминологических), выборок к тематическим группам слов.
Использование AntConc
Программа AntConc не требует инсталляции, достаточно загрузить программу с официального сайта в зависимости от операционной системы: Windows, Linux или Mac OS и запустить её:
Рассмотрим работу корпус-менеджера AntConc на примере опубликованных текстов произведений Ивана Белых. Для этого файл сохраним в тексте: belykh.txt.
Открывем файл belykh.txt из верхнего левого меню File / Open file(s). Название файла появится в левом окне (под фразой «Corpus Files»).
Открываем во второй сверху строке меню кнопку «Word List» (вторяя слева) и нажимаем кнопку «Start» (внизу ближе к левому краю). Программа выстроит все словоформы текста в порядке частотности. Можно сортировать и по другим критериям. Если вместо «Sort by Freq» (в самом низу) выбрать «Sort by Word», произойдёт сортировка по алфавиту, если выбрать «Sort by Word End», сортировка пойдёт по концу слов. Ели к тому же поставим галочку между фразами «Sort by» и «Invert Order», то сортировка пойдёт в обратном порядке — от редких слов к частым или от я до а.
Можно кликнуть из списка любое слово, начнётся его автоматический поиск в окне Concordance. Если открыто окно Concordance, искомое слово можно ввести в окошко, находящееся между кнопкой «Start» и фразой «Search Term» и нажать «Start». Будет происходить поиск данного слова в контекстах. Если убрать галочку над тем же окошком между словами «Search Term» и «Words», можно будет искать не только конкретную форму слова, но и похожие формы напр. пишем пукт — выйдет пукта, пуктіс, пукты и т. п..
С помощю данной программы, в частности, нами была собрана большая часть примеров для демонстранционной словарной статьи ПОН из массива комиязычных электронных текстов (более 2 млн. словоупотреблений):
Для того, что слова с дефисом воспринимались в поиске как за одно слово, поставьте галочки:
В свободном доступе также один коми текст и 10 удмуртских текстов, предназначенных для начального этапа освоения работы с программой AntConc.
Использование регулярных выражений
Пример использования регулярного выражения "\w+де":
Пример использования регулярного выражения "\w+де\s" (все слова, которые заканчиваются на -де, далее пробел):
Пример использования регулярного выражения "\w+де[\s,.]" (все слова, которые заканчиваются на -де, далее пробел, запятая или точка):
Видеоурок от разработчика