Языковые корпуса: различия между версиями

Материал из Wiki FU-Lab
Перейти к навигации Перейти к поиску
Нет описания правки
Нет описания правки
Строка 1: Строка 1:
*[https://www.corpus.tatar/ Письменный корпус татарского языка] 620 млн.
#[https://www.corpus.tatar/ Письменный корпус татарского языка] 620 млн.
*[http://komicorpora.ru Коми кыв корпус] 88 млн.
#[http://komicorpora.ru Коми кыв корпус] 88 млн.
*[https://corp.marnii.ru/ Корпус марийского языка от МарНИИ] 21 млн.
#[https://corp.marnii.ru/ Корпус марийского языка от МарНИИ] 21 млн.
*[https://ru.corpus.chv.su/ Корпус чувашского языка от Н. Плотникова] 17 млн.
#[https://ru.corpus.chv.su/ Корпус чувашского языка от Н. Плотникова] 17 млн.
*[https://sakha-corpus.ysn.ru/index.php?lang=ru Национальный корпус якутского языка] 15 млн.
#[https://sakha-corpus.ysn.ru/index.php?lang=ru Национальный корпус якутского языка] 15 млн.
*[http://udmcorpus.udman.ru/ Национальный корпус удмуртского языка] 8,5 млн.
#[http://udmcorpus.udman.ru/ Национальный корпус удмуртского языка] 8,5 млн.
*[http://kalmcorpora.ru Национальный корпус калмыцкого языка] 8 млн.
#[http://kalmcorpora.ru Национальный корпус калмыцкого языка] 8 млн.
*[https://p.komicorpora.ru/ Корпус коми-пермяцкого языка] 7 млн.
#[https://p.komicorpora.ru/ Корпус коми-пермяцкого языка] 7 млн.
*[http://mfbl2.ru/ Машинный фонд башкирского языка]
#[http://mfbl2.ru/ Машинный фонд башкирского языка]
*[http://lingconlab.ru/spoken_bashkir/ Устный корпус башкирского языка]
#[http://lingconlab.ru/spoken_bashkir/ Устный корпус башкирского языка]
*[http://bashcorpus.ru/ Национальный корпус башкирского языка] ---
#[http://bashcorpus.ru/ Национальный корпус башкирского языка] ---
*[https://ethnoportal.admhmao.ru/language-center/corpus Мансийский корпус на портале мансийского языка]  
#[https://ethnoportal.admhmao.ru/language-center/corpus Мансийский корпус на портале мансийского языка]  
*[https://chuvkorpus.ru/ Национальный корпус чувашского языка (ЧГИГН)]
#[https://chuvkorpus.ru/ Национальный корпус чувашского языка (ЧГИГН)]
*[http://web-corpora.net/KazakhCorpus/search/?interface_language=ru Алматинский корпус казахского языка] (НИУ ВШЭ) 40 млн.
#[http://web-corpora.net/KazakhCorpus/search/?interface_language=ru Алматинский корпус казахского языка] (НИУ ВШЭ) 40 млн.
*[http://web-corpora.net/TatarCorpus/search/index.php?interface_language=ru Татарский национальный корпус «Туган тел»] (НИУ ВШЭ) 26 млн.
#[http://web-corpora.net/TatarCorpus/search/index.php?interface_language=ru Татарский национальный корпус «Туган тел»] (НИУ ВШЭ) 26 млн.
*[http://corpus.ossetic-studies.org/search/index.php?interface_language=ru Осетинский национальный корпус] (НИУ ВШЭ) 12 млн.
#[http://corpus.ossetic-studies.org/search/index.php?interface_language=ru Осетинский национальный корпус] (НИУ ВШЭ) 12 млн.
*[https://adyghe.web-corpora.net/ Адыгейский корпус] (НИУ ВШЭ) 10 млн.
#[https://adyghe.web-corpora.net/ Адыгейский корпус] (НИУ ВШЭ) 10 млн.
*[https://udmurt.web-corpora.net/ Корпуса удмуртского языка] (Тимофей Архангельский) 9,57 млн.
#[https://udmurt.web-corpora.net/ Корпуса удмуртского языка] (Тимофей Архангельский) 9,57 млн.
*[https://meadow-mari.web-corpora.net/ Корпуса лугового марийского языка] (Тимофей Архангельский) 5,53 млн.
#[https://meadow-mari.web-corpora.net/ Корпуса лугового марийского языка] (Тимофей Архангельский) 5,53 млн.
*[http://web-corpora.net/BuryatCorpus/search/?interface_language=ru Бурятский корпус]  (НИУ ВШЭ) 3 млн.
#[http://web-corpora.net/BuryatCorpus/search/?interface_language=ru Бурятский корпус]  (НИУ ВШЭ) 3 млн.
*[https://erzya.web-corpora.net/ Корпуса эрзянского языка] (Тимофей Архангельский) 2,3 млн.
#[https://erzya.web-corpora.net/ Корпуса эрзянского языка] (Тимофей Архангельский) 2,3 млн.
*[https://komi-zyrian.web-corpora.net/ Корпуса коми-зырянского языка] (Тимофей Архангельский) 1,76 млн.
#[https://komi-zyrian.web-corpora.net/ Корпуса коми-зырянского языка] (Тимофей Архангельский) 1,76 млн.
*[https://moksha.web-corpora.net/ Корпуса мокшанского языка] (Тимофей Архангельский) 1,74 млн.
#[https://moksha.web-corpora.net/ Корпуса мокшанского языка] (Тимофей Архангельский) 1,74 млн.
*[http://adictsakha.nsu.ru/corpora/corp Корпус якутского языка (СВФУ, НГУ)]
#[http://adictsakha.nsu.ru/corpora/corp Корпус якутского языка (СВФУ, НГУ)]
*[http://korpus.juls.savba.sk/QIRIM/ Къырымтатар тилининъ лингвистик корпусы]
#[http://korpus.juls.savba.sk/QIRIM/ Къырымтатар тилининъ лингвистик корпусы]
*[http://beserman.ru/ Исследования бесермянского диалекта]
#[http://beserman.ru/ Исследования бесермянского диалекта]
*[http://vepsian.krc.karelia.ru/about/ Корпус вепского языка]
#[http://vepsian.krc.karelia.ru/about/ Корпус вепского языка]
*[http://dictorpus.krc.karelia.ru/ru Открытый корпус карельского и вепского языков]
#[http://dictorpus.krc.karelia.ru/ru Открытый корпус карельского и вепского языков]
*[http://www.corplingran.ru/ Корпусная лингвистика : Программа фундаментальных исследований Президиума РАН] ---
#[http://www.corplingran.ru/ Корпусная лингвистика : Программа фундаментальных исследований Президиума РАН] ---
*[http://www.ling.helsinki.fi/uhlcs/readme-all/README-uralic-lgs.html#C346 COMPUTER CORPORA OF THE URALIC LANGUAGES]
#[http://www.ling.helsinki.fi/uhlcs/readme-all/README-uralic-lgs.html#C346 COMPUTER CORPORA OF THE URALIC LANGUAGES]
*[http://unesco.uniba.sk/ Ссылки на корпуса с сайта кафедры ЮНЕСКО в Братиславе]
#[http://unesco.uniba.sk/ Ссылки на корпуса с сайта кафедры ЮНЕСКО в Братиславе]
*[http://www.ruscorpora.ru/index.html Национальный корпус русского языка]
#[http://www.ruscorpora.ru/index.html Национальный корпус русского языка]
*[https://corpus.byu.edu/coca/ Corpus of Contemporary American English]
#[https://corpus.byu.edu/coca/ Corpus of Contemporary American English]
*[http://www.natcorp.ox.ac.uk/ British National Corpus (BNC)]
#[http://www.natcorp.ox.ac.uk/ British National Corpus (BNC)]
*[http://ucnk.ff.cuni.cz/ Ústav Českého národního korpusu]
#[http://ucnk.ff.cuni.cz/ Ústav Českého národního korpusu]
*[http://www.eanc.net/ Eastern Armenian National Corpus]
#[http://www.eanc.net/ Eastern Armenian National Corpus]

Версия от 14:29, 19 мая 2025

  1. Письменный корпус татарского языка 620 млн.
  2. Коми кыв корпус 88 млн.
  3. Корпус марийского языка от МарНИИ 21 млн.
  4. Корпус чувашского языка от Н. Плотникова 17 млн.
  5. Национальный корпус якутского языка 15 млн.
  6. Национальный корпус удмуртского языка 8,5 млн.
  7. Национальный корпус калмыцкого языка 8 млн.
  8. Корпус коми-пермяцкого языка 7 млн.
  9. Машинный фонд башкирского языка
  10. Устный корпус башкирского языка
  11. Национальный корпус башкирского языка ---
  12. Мансийский корпус на портале мансийского языка
  13. Национальный корпус чувашского языка (ЧГИГН)
  14. Алматинский корпус казахского языка (НИУ ВШЭ) 40 млн.
  15. Татарский национальный корпус «Туган тел» (НИУ ВШЭ) 26 млн.
  16. Осетинский национальный корпус (НИУ ВШЭ) 12 млн.
  17. Адыгейский корпус (НИУ ВШЭ) 10 млн.
  18. Корпуса удмуртского языка (Тимофей Архангельский) 9,57 млн.
  19. Корпуса лугового марийского языка (Тимофей Архангельский) 5,53 млн.
  20. Бурятский корпус (НИУ ВШЭ) 3 млн.
  21. Корпуса эрзянского языка (Тимофей Архангельский) 2,3 млн.
  22. Корпуса коми-зырянского языка (Тимофей Архангельский) 1,76 млн.
  23. Корпуса мокшанского языка (Тимофей Архангельский) 1,74 млн.
  24. Корпус якутского языка (СВФУ, НГУ)
  25. Къырымтатар тилининъ лингвистик корпусы
  26. Исследования бесермянского диалекта
  27. Корпус вепского языка
  28. Открытый корпус карельского и вепского языков
  29. Корпусная лингвистика : Программа фундаментальных исследований Президиума РАН ---
  30. COMPUTER CORPORA OF THE URALIC LANGUAGES
  31. Ссылки на корпуса с сайта кафедры ЮНЕСКО в Братиславе
  32. Национальный корпус русского языка
  33. Corpus of Contemporary American English
  34. British National Corpus (BNC)
  35. Ústav Českého národního korpusu
  36. Eastern Armenian National Corpus