Языковые корпуса: различия между версиями

Материал из Wiki FU-Lab
Перейти к навигации Перейти к поиску
Нет описания правки
Нет описания правки
Строка 1: Строка 1:
#[https://www.corpus.tatar/ Письменный корпус татарского языка] 620 млн.
 
#[http://komicorpora.ru Коми кыв корпус] 88 млн.
*[https://www.corpus.tatar/ Письменный корпус татарского языка] 620 млн.
#[https://corp.marnii.ru/ Корпус марийского языка от МарНИИ] 21 млн.
*[http://komicorpora.ru Коми кыв корпус] 88 млн.
#[https://ru.corpus.chv.su/ Корпус чувашского языка от Н. Плотникова] 17 млн.
*[https://corp.marnii.ru/ Корпус марийского языка от МарНИИ] 21 млн.
#[https://sakha-corpus.ysn.ru/index.php?lang=ru Национальный корпус якутского языка] 15 млн.
*[https://ru.corpus.chv.su/ Корпус чувашского языка от Н. Плотникова] 17 млн.
#[http://udmcorpus.udman.ru/ Национальный корпус удмуртского языка] 8,5 млн.
*[https://sakha-corpus.ysn.ru/index.php?lang=ru Национальный корпус якутского языка] 15 млн.
#[http://kalmcorpora.ru Национальный корпус калмыцкого языка] 8 млн.
*[http://udmcorpus.udman.ru/ Национальный корпус удмуртского языка] 8,5 млн.
#[https://p.komicorpora.ru/ Корпус коми-пермяцкого языка] 7 млн.
*[http://kalmcorpora.ru Национальный корпус калмыцкого языка] 8 млн.
#[http://mfbl2.ru/ Машинный фонд башкирского языка]
*[https://p.komicorpora.ru/ Корпус коми-пермяцкого языка] 7 млн.
#[http://lingconlab.ru/spoken_bashkir/ Устный корпус башкирского языка]
*[http://lingconlab.ru/spoken_bashkir/ Устный корпус башкирского языка]
#[http://bashcorpus.ru/ Национальный корпус башкирского языка] ---
*[http://mfbl2.ru/ Машинный фонд башкирского языка] ---
#[https://ethnoportal.admhmao.ru/language-center/corpus Мансийский корпус на портале мансийского языка]  
*[http://bashcorpus.ru/ Национальный корпус башкирского языка] ---
#[https://chuvkorpus.ru/ Национальный корпус чувашского языка (ЧГИГН)]
*[https://ethnoportal.admhmao.ru/language-center/corpus Мансийский корпус на портале мансийского языка]  
#[http://web-corpora.net/KazakhCorpus/search/?interface_language=ru Алматинский корпус казахского языка] (НИУ ВШЭ) 40 млн.
*[https://chuvkorpus.ru/ Национальный корпус чувашского языка (ЧГИГН)]
#[http://web-corpora.net/TatarCorpus/search/index.php?interface_language=ru Татарский национальный корпус «Туган тел»] (НИУ ВШЭ) 26 млн.
*[http://adictsakha.nsu.ru/corpora/corp Корпус якутского языка (СВФУ, НГУ)]
#[http://corpus.ossetic-studies.org/search/index.php?interface_language=ru Осетинский национальный корпус] (НИУ ВШЭ) 12 млн.
 
#[https://adyghe.web-corpora.net/ Адыгейский корпус] (НИУ ВШЭ) 10 млн.
☼ ☼ ☼
#[https://udmurt.web-corpora.net/ Корпуса удмуртского языка] (Тимофей Архангельский) 9,57 млн.
 
#[https://meadow-mari.web-corpora.net/ Корпуса лугового марийского языка] (Тимофей Архангельский) 5,53 млн.
*[http://web-corpora.net/KazakhCorpus/search/?interface_language=ru Алматинский корпус казахского языка] (НИУ ВШЭ) 40 млн.
#[http://web-corpora.net/BuryatCorpus/search/?interface_language=ru Бурятский корпус]  (НИУ ВШЭ) 3 млн.
*[http://web-corpora.net/TatarCorpus/search/index.php?interface_language=ru Татарский национальный корпус «Туган тел»] (НИУ ВШЭ) 26 млн.
#[https://erzya.web-corpora.net/ Корпуса эрзянского языка] (Тимофей Архангельский) 2,3 млн.
*[http://corpus.ossetic-studies.org/search/index.php?interface_language=ru Осетинский национальный корпус] (НИУ ВШЭ) 12 млн.
#[https://komi-zyrian.web-corpora.net/ Корпуса коми-зырянского языка] (Тимофей Архангельский) 1,76 млн.
*[https://adyghe.web-corpora.net/ Адыгейский корпус] (НИУ ВШЭ) 10 млн.
#[https://moksha.web-corpora.net/ Корпуса мокшанского языка] (Тимофей Архангельский) 1,74 млн.
*[https://udmurt.web-corpora.net/ Корпуса удмуртского языка] (Тимофей Архангельский) 9,57 млн.
#[http://adictsakha.nsu.ru/corpora/corp Корпус якутского языка (СВФУ, НГУ)]
*[https://meadow-mari.web-corpora.net/ Корпуса лугового марийского языка] (Тимофей Архангельский) 5,53 млн.
#[http://korpus.juls.savba.sk/QIRIM/ Къырымтатар тилининъ лингвистик корпусы]
*[http://web-corpora.net/BuryatCorpus/search/?interface_language=ru Бурятский корпус]  (НИУ ВШЭ) 3 млн.
#[http://beserman.ru/ Исследования бесермянского диалекта]
*[https://erzya.web-corpora.net/ Корпуса эрзянского языка] (Тимофей Архангельский) 2,3 млн.
#[http://vepsian.krc.karelia.ru/about/ Корпус вепского языка]
*[https://komi-zyrian.web-corpora.net/ Корпуса коми-зырянского языка] (Тимофей Архангельский) 1,76 млн.
#[http://dictorpus.krc.karelia.ru/ru Открытый корпус карельского и вепского языков]
*[https://moksha.web-corpora.net/ Корпуса мокшанского языка] (Тимофей Архангельский) 1,74 млн.
#[http://www.corplingran.ru/ Корпусная лингвистика : Программа фундаментальных исследований Президиума РАН] ---
 
#[http://www.ling.helsinki.fi/uhlcs/readme-all/README-uralic-lgs.html#C346 COMPUTER CORPORA OF THE URALIC LANGUAGES]
*[http://korpus.juls.savba.sk/QIRIM/ Къырымтатар тилининъ лингвистик корпусы]
#[http://unesco.uniba.sk/ Ссылки на корпуса с сайта кафедры ЮНЕСКО в Братиславе]
*[http://beserman.ru/corpus/search/?interface_language=ru Бесермянский корпус] 65 тыс.
*[http://vepsian.krc.karelia.ru/about/ Корпус вепского языка]
*[http://dictorpus.krc.karelia.ru/ru Открытый корпус карельского и вепского языков]
 
☼ ☼ ☼
 
#[http://www.ruscorpora.ru/index.html Национальный корпус русского языка]
#[http://www.ruscorpora.ru/index.html Национальный корпус русского языка]
#[https://corpus.byu.edu/coca/ Corpus of Contemporary American English]
#[https://corpus.byu.edu/coca/ Corpus of Contemporary American English]
Строка 35: Строка 40:
#[http://ucnk.ff.cuni.cz/ Ústav Českého národního korpusu]
#[http://ucnk.ff.cuni.cz/ Ústav Českého národního korpusu]
#[http://www.eanc.net/ Eastern Armenian National Corpus]
#[http://www.eanc.net/ Eastern Armenian National Corpus]
#[http://unesco.uniba.sk/ Ссылки на корпуса с сайта кафедры ЮНЕСКО в Братиславе]
☼ ☼ ☼
*[http://www.corplingran.ru/ Корпусная лингвистика : Программа фундаментальных исследований Президиума РАН] ---
*[http://www.ling.helsinki.fi/uhlcs/readme-all/README-uralic-lgs.html#C346 COMPUTER CORPORA OF THE URALIC LANGUAGES]

Версия от 14:45, 19 мая 2025

☼ ☼ ☼

☼ ☼ ☼

  1. Национальный корпус русского языка
  2. Corpus of Contemporary American English
  3. British National Corpus (BNC)
  4. Ústav Českého národního korpusu
  5. Eastern Armenian National Corpus
  6. Ссылки на корпуса с сайта кафедры ЮНЕСКО в Братиславе

☼ ☼ ☼