Языковые корпуса: различия между версиями
Перейти к навигации
Перейти к поиску
Ӧньӧ Лав (обсуждение | вклад) Нет описания правки |
Ӧньӧ Лав (обсуждение | вклад) Нет описания правки |
||
| Строка 1: | Строка 1: | ||
*[https://www.corpus.tatar/ Письменный корпус татарского языка] 620 млн. | |||
*[http://komicorpora.ru Коми кыв корпус] 88 млн. | |||
*[https://corp.marnii.ru/ Корпус марийского языка от МарНИИ] 21 млн. | |||
*[https://ru.corpus.chv.su/ Корпус чувашского языка от Н. Плотникова] 17 млн. | |||
*[https://sakha-corpus.ysn.ru/index.php?lang=ru Национальный корпус якутского языка] 15 млн. | |||
*[http://udmcorpus.udman.ru/ Национальный корпус удмуртского языка] 8,5 млн. | |||
*[http://kalmcorpora.ru Национальный корпус калмыцкого языка] 8 млн. | |||
*[https://p.komicorpora.ru/ Корпус коми-пермяцкого языка] 7 млн. | |||
*[http://lingconlab.ru/spoken_bashkir/ Устный корпус башкирского языка] | |||
*[http://mfbl2.ru/ Машинный фонд башкирского языка] --- | |||
*[http://bashcorpus.ru/ Национальный корпус башкирского языка] --- | |||
*[https://ethnoportal.admhmao.ru/language-center/corpus Мансийский корпус на портале мансийского языка] | |||
*[https://chuvkorpus.ru/ Национальный корпус чувашского языка (ЧГИГН)] | |||
*[http://adictsakha.nsu.ru/corpora/corp Корпус якутского языка (СВФУ, НГУ)] | |||
☼ ☼ ☼ | |||
*[http://web-corpora.net/KazakhCorpus/search/?interface_language=ru Алматинский корпус казахского языка] (НИУ ВШЭ) 40 млн. | |||
*[http://web-corpora.net/TatarCorpus/search/index.php?interface_language=ru Татарский национальный корпус «Туган тел»] (НИУ ВШЭ) 26 млн. | |||
*[http://corpus.ossetic-studies.org/search/index.php?interface_language=ru Осетинский национальный корпус] (НИУ ВШЭ) 12 млн. | |||
*[https://adyghe.web-corpora.net/ Адыгейский корпус] (НИУ ВШЭ) 10 млн. | |||
*[https://udmurt.web-corpora.net/ Корпуса удмуртского языка] (Тимофей Архангельский) 9,57 млн. | |||
*[https://meadow-mari.web-corpora.net/ Корпуса лугового марийского языка] (Тимофей Архангельский) 5,53 млн. | |||
*[http://web-corpora.net/BuryatCorpus/search/?interface_language=ru Бурятский корпус] (НИУ ВШЭ) 3 млн. | |||
*[https://erzya.web-corpora.net/ Корпуса эрзянского языка] (Тимофей Архангельский) 2,3 млн. | |||
*[https://komi-zyrian.web-corpora.net/ Корпуса коми-зырянского языка] (Тимофей Архангельский) 1,76 млн. | |||
*[https://moksha.web-corpora.net/ Корпуса мокшанского языка] (Тимофей Архангельский) 1,74 млн. | |||
*[http://korpus.juls.savba.sk/QIRIM/ Къырымтатар тилининъ лингвистик корпусы] | |||
*[http://beserman.ru/corpus/search/?interface_language=ru Бесермянский корпус] 65 тыс. | |||
*[http://vepsian.krc.karelia.ru/about/ Корпус вепского языка] | |||
*[http://dictorpus.krc.karelia.ru/ru Открытый корпус карельского и вепского языков] | |||
☼ ☼ ☼ | |||
#[http://www.ruscorpora.ru/index.html Национальный корпус русского языка] | #[http://www.ruscorpora.ru/index.html Национальный корпус русского языка] | ||
#[https://corpus.byu.edu/coca/ Corpus of Contemporary American English] | #[https://corpus.byu.edu/coca/ Corpus of Contemporary American English] | ||
| Строка 35: | Строка 40: | ||
#[http://ucnk.ff.cuni.cz/ Ústav Českého národního korpusu] | #[http://ucnk.ff.cuni.cz/ Ústav Českého národního korpusu] | ||
#[http://www.eanc.net/ Eastern Armenian National Corpus] | #[http://www.eanc.net/ Eastern Armenian National Corpus] | ||
#[http://unesco.uniba.sk/ Ссылки на корпуса с сайта кафедры ЮНЕСКО в Братиславе] | |||
☼ ☼ ☼ | |||
*[http://www.corplingran.ru/ Корпусная лингвистика : Программа фундаментальных исследований Президиума РАН] --- | |||
*[http://www.ling.helsinki.fi/uhlcs/readme-all/README-uralic-lgs.html#C346 COMPUTER CORPORA OF THE URALIC LANGUAGES] | |||
Версия от 14:45, 19 мая 2025
- Письменный корпус татарского языка 620 млн.
- Коми кыв корпус 88 млн.
- Корпус марийского языка от МарНИИ 21 млн.
- Корпус чувашского языка от Н. Плотникова 17 млн.
- Национальный корпус якутского языка 15 млн.
- Национальный корпус удмуртского языка 8,5 млн.
- Национальный корпус калмыцкого языка 8 млн.
- Корпус коми-пермяцкого языка 7 млн.
- Устный корпус башкирского языка
- Машинный фонд башкирского языка ---
- Национальный корпус башкирского языка ---
- Мансийский корпус на портале мансийского языка
- Национальный корпус чувашского языка (ЧГИГН)
- Корпус якутского языка (СВФУ, НГУ)
☼ ☼ ☼
- Алматинский корпус казахского языка (НИУ ВШЭ) 40 млн.
- Татарский национальный корпус «Туган тел» (НИУ ВШЭ) 26 млн.
- Осетинский национальный корпус (НИУ ВШЭ) 12 млн.
- Адыгейский корпус (НИУ ВШЭ) 10 млн.
- Корпуса удмуртского языка (Тимофей Архангельский) 9,57 млн.
- Корпуса лугового марийского языка (Тимофей Архангельский) 5,53 млн.
- Бурятский корпус (НИУ ВШЭ) 3 млн.
- Корпуса эрзянского языка (Тимофей Архангельский) 2,3 млн.
- Корпуса коми-зырянского языка (Тимофей Архангельский) 1,76 млн.
- Корпуса мокшанского языка (Тимофей Архангельский) 1,74 млн.
- Къырымтатар тилининъ лингвистик корпусы
- Бесермянский корпус 65 тыс.
- Корпус вепского языка
- Открытый корпус карельского и вепского языков
☼ ☼ ☼
- Национальный корпус русского языка
- Corpus of Contemporary American English
- British National Corpus (BNC)
- Ústav Českého národního korpusu
- Eastern Armenian National Corpus
- Ссылки на корпуса с сайта кафедры ЮНЕСКО в Братиславе
☼ ☼ ☼