Языковые корпуса
Версия от 17:18, 19 мая 2025; Ӧньӧ Лав (обсуждение | вклад)
- Письменный корпус татарского языка 537 млн.
- Коми кыв корпус 88 млн.
- Корпус марийского языка от МарНИИ 21 млн.
- Корпус чувашского языка от Н. Плотникова 17 млн.
- Национальный корпус якутского языка 15 млн.
- Национальный корпус удмуртского языка 8,5 млн.
- Национальный корпус калмыцкого языка 8 млн.
- Корпус коми-пермяцкого языка 7 млн.
- Корпус вепского языка
- Открытый корпус карельского и вепского языков 2,3 млн.
- Мансийский корпус на портале мансийского языка
- Национальный корпус чувашского языка (ЧГИГН)
- Корпус якутского языка (СВФУ, НГУ)
- Машинный фонд башкирского языка ---
- Национальный корпус башкирского языка ---
☼ ☼ ☼
- Алматинский корпус казахского языка (НИУ ВШЭ) 40 млн.
- Татарский национальный корпус «Туган тел» (НИУ ВШЭ) 26 млн.
- Осетинский национальный корпус (НИУ ВШЭ) 12 млн.
- Адыгейский корпус (НИУ ВШЭ) 10 млн.
- Корпуса удмуртского языка (Тимофей Архангельский) 9,57 млн.
- Корпуса лугового марийского языка (Тимофей Архангельский) 5,53 млн.
- Бурятский корпус (НИУ ВШЭ) 3 млн.
- Корпуса эрзянского языка (Тимофей Архангельский) 2,3 млн.
- Корпуса коми-зырянского языка (Тимофей Архангельский) 1,76 млн.
- Корпуса мокшанского языка (Тимофей Архангельский) 1,74 млн.
- Калмыцкий корпус (НИУ ВШЭ) 800 тыс.
- Бесермянский корпус 65 тыс.
- Электронный корпус хакасского языка (ИЯз РАН) 700 тыс.
- Корпус горномарийского языка (ИЯз РАН)
- Корпус ительменского языка (ИЯз РАН)
- Мультимедийный корпус кетского языка (ИЯз РАН)
- Корпус северноселькупских письменных текстов (юридические тексты) (ИЯз РАН)
- Корпус эвенкийского языка (ИЯз РАН)
☼ ☼ ☼
- Национальный корпус русского языка
- Corpus of Contemporary American English
- British National Corpus (BNC)
- Ústav Českého národního korpusu
- Eastern Armenian National Corpus
- Ссылки на корпуса с сайта кафедры ЮНЕСКО в Братиславе
- Къырымтатар тилининъ лингвистик корпусы