AntConc: различия между версиями
Admin (обсуждение | вклад) (Новая страница: «Корпус-менеджер '''AntConc''' разработчика [http://www.antlab.sci.waseda.ac.jp/resume.html Dr. Laurence Anthony] предназначе…») |
Admin (обсуждение | вклад) Нет описания правки |
||
Строка 1: | Строка 1: | ||
Корпус-менеджер '''AntConc''' разработчика [http://www.antlab.sci.waseda.ac.jp/resume.html Dr. Laurence Anthony] предназначен для обработки корпусов первого порядка. Отсутствие морфологического анализатора частично компенсируется возможностью подключения пользовательского списка лемм. Программа может быть использована для получения привязанных к заданной предметной области словарных минимумов, списков устойчивых сочетаний (в том числе терминологических), выборок к тематическим группам слов. Можно осуществлять поиск контекстов, оценивать их типичности. | Корпус-менеджер '''AntConc''' разработчика [http://www.antlab.sci.waseda.ac.jp/resume.html Dr. Laurence Anthony] предназначен для обработки корпусов первого порядка. Отсутствие морфологического анализатора частично компенсируется возможностью подключения пользовательского списка лемм. Программа может быть использована для получения привязанных к заданной предметной области словарных минимумов, списков устойчивых сочетаний (в том числе терминологических), выборок к тематическим группам слов. Можно осуществлять поиск контекстов, оценивать их типичности. | ||
==Использование AntConc== | |||
Программа '''AntConc''' не требует инсталляции, достаточно загрузить программу с официального сайта в зависимости от операционной системы: Windows, Linux или Mac OS и запустить её: | |||
[[http://wiki.komikyv.ru/index.php/Файл:КОРПУС1.png|600px]] | |||
Рассмотрим работу корпус-менеджера AntConc на примере опубликованных текстов произведений [http://komikyv.ru/blog/498.html Ивана Белых]. Для этого файл сохраним в тексте: [http://komikyv.ru/pdf/belykh.txt belykh.txt]. | Рассмотрим работу корпус-менеджера AntConc на примере опубликованных текстов произведений [http://komikyv.ru/blog/498.html Ивана Белых]. Для этого файл сохраним в тексте: [http://komikyv.ru/pdf/belykh.txt belykh.txt]. | ||
Строка 10: | Строка 13: | ||
Можно кликнуть из списка любое слово, начнётся его автоматический поиск в окне '''Concordance'''. Если открыто окно '''Concordance''', искомое слово можно ввести в окошко, находящееся между кнопкой «'''Start'''» и фразой «'''Search Term'''» и нажать «'''Start'''». Будет происходить поиск данного слова в контекстах. Если убрать галочку над тем же окошком между словами «'''Search Term'''» и «'''Words'''», можно будет искать не только конкретную форму слова, но и похожие формы напр. пишем '''пукт''' — выйдет '''пукта, пуктіс, пукты''' и т. п.. | Можно кликнуть из списка любое слово, начнётся его автоматический поиск в окне '''Concordance'''. Если открыто окно '''Concordance''', искомое слово можно ввести в окошко, находящееся между кнопкой «'''Start'''» и фразой «'''Search Term'''» и нажать «'''Start'''». Будет происходить поиск данного слова в контекстах. Если убрать галочку над тем же окошком между словами «'''Search Term'''» и «'''Words'''», можно будет искать не только конкретную форму слова, но и похожие формы напр. пишем '''пукт''' — выйдет '''пукта, пуктіс, пукты''' и т. п.. | ||
С помощю данной программы, в частности, нами была собрана большая часть примеров для демонстранционной словарной статьи [http://wiki.komikyv.ru/index.php/Пон ПОН] из массива комиязычных электронных текстов (более 2 млн. словоупотреблений): | |||
[[http://wiki.komikyv.ru/index.php/Файл:КОРПУС2.png|600px]] | |||
==Ссылки== | ==Ссылки== | ||
* [http://www.antlab.sci.waseda.ac.jp/antconc_index.html Официальный сайт программы] | * [http://www.antlab.sci.waseda.ac.jp/antconc_index.html Официальный сайт программы] |
Версия от 20:59, 23 июня 2013
Корпус-менеджер AntConc разработчика Dr. Laurence Anthony предназначен для обработки корпусов первого порядка. Отсутствие морфологического анализатора частично компенсируется возможностью подключения пользовательского списка лемм. Программа может быть использована для получения привязанных к заданной предметной области словарных минимумов, списков устойчивых сочетаний (в том числе терминологических), выборок к тематическим группам слов. Можно осуществлять поиск контекстов, оценивать их типичности.
Использование AntConc
Программа AntConc не требует инсталляции, достаточно загрузить программу с официального сайта в зависимости от операционной системы: Windows, Linux или Mac OS и запустить её:
[[1]]
Рассмотрим работу корпус-менеджера AntConc на примере опубликованных текстов произведений Ивана Белых. Для этого файл сохраним в тексте: belykh.txt.
Открывем файл belykh.txt из верхнего левого меню File / Open file(s). Название файла появится в левом окне (под фразой «Corpus Files»).
Открываем во второй сверху строке меню кнопку «Word List» (вторяя слева) и нажимаем кнопку «Start» (внизу ближе к левому краю). Программа выстроит все словоформы текста в порядке частотности. Можно сортировать и по другим критериям. Если вместо «Sort by Freq» (в самом низу) выбрать «Sort by Word», произойдёт сортировка по алфавиту, если выбрать «Sort by Word End», сортировка пойдёт по концу слов. Ели к тому же поставим галочку между фразами «Sort by» и «Invert Order», то сортировка пойдёт в обратном порядке — от редких слов к частым или от я до а.
Можно кликнуть из списка любое слово, начнётся его автоматический поиск в окне Concordance. Если открыто окно Concordance, искомое слово можно ввести в окошко, находящееся между кнопкой «Start» и фразой «Search Term» и нажать «Start». Будет происходить поиск данного слова в контекстах. Если убрать галочку над тем же окошком между словами «Search Term» и «Words», можно будет искать не только конкретную форму слова, но и похожие формы напр. пишем пукт — выйдет пукта, пуктіс, пукты и т. п..
С помощю данной программы, в частности, нами была собрана большая часть примеров для демонстранционной словарной статьи ПОН из массива комиязычных электронных текстов (более 2 млн. словоупотреблений):
[[2]]