Языковые корпуса: различия между версиями

Материал из Wiki FU-Lab
Перейти к навигации Перейти к поиску
Нет описания правки
Нет описания правки
Строка 1: Строка 1:


*[https://www.corpus.tatar/ Письменный корпус татарского языка] 537 млн.
*[https://www.corpus.tatar/ Письменный корпус татарского языка] 537 млн.
*[http://komicorpora.ru Коми кыв корпус] 88 млн. (+ [https://molodcov.komicorpora.ru/ Коми корпус на молодцовской графике] 3 млн.)
*[https://tugantel.tatar/ Татарский национальный корпус «Туган тел»] (НИИ «Прикладная семиотика» АН РТ) 194 млн.
*[https://corp.marnii.ru/ Корпус марийского языка от МарНИИ] 21 млн.
*[http://komicorpora.ru Коми кыв корпус] (FU-Lab) 88 млн. (+ [https://molodcov.komicorpora.ru/ Коми корпус на молодцовской графике] 3 млн.)
*[https://ru.corpus.chv.su/ Корпус чувашского языка от Н. Плотникова] 17 млн.
*[https://corp.marnii.ru/ Корпус марийского языка] (МарНИИ) 21 млн.
*[https://ru.corpus.chv.su/ Корпус чувашского языка] (Н. Плотников) 17 млн.
*[https://sakha-corpus.ysn.ru/index.php?lang=ru Национальный корпус якутского языка] 15 млн.
*[https://sakha-corpus.ysn.ru/index.php?lang=ru Национальный корпус якутского языка] 15 млн.
*[http://udmcorpus.udman.ru/ Национальный корпус удмуртского языка] 8,5 млн.
*[http://udmcorpus.udman.ru/ Национальный корпус удмуртского языка] 8,5 млн.
Строка 19: Строка 20:
*[https://gtweb.uit.no/u_korp/?mode=mhr#?stats_reduce=word&cqp=%5B%5D Korp - Meadow Mari texts]  (Giellatekno) 57,38 млн. ?
*[https://gtweb.uit.no/u_korp/?mode=mhr#?stats_reduce=word&cqp=%5B%5D Korp - Meadow Mari texts]  (Giellatekno) 57,38 млн. ?
*[http://web-corpora.net/KazakhCorpus/search/?interface_language=ru Алматинский корпус казахского языка] (НИУ ВШЭ) 40 млн.
*[http://web-corpora.net/KazakhCorpus/search/?interface_language=ru Алматинский корпус казахского языка] (НИУ ВШЭ) 40 млн.
*[http://web-corpora.net/TatarCorpus/search/index.php?interface_language=ru Татарский национальный корпус «Туган тел»] (НИУ ВШЭ) 26 млн.
*[https://gtweb.uit.no/u_korp/?mode=myv#?lang=en&stats_reduce=word&cqp=%5B%5D Korp - Erzya texts] (Giellatekno) 14,05 млн.
*[https://gtweb.uit.no/u_korp/?mode=myv#?lang=en&stats_reduce=word&cqp=%5B%5D Korp - Erzya texts] (Giellatekno) 14,05 млн.
*[https://gtweb.uit.no/u_korp/?mode=mdf#?lang=en&stats_reduce=word&cqp=%5B%5D Korp - Moksha texts] (Giellatekno) 12,79 млн.
*[https://gtweb.uit.no/u_korp/?mode=mdf#?lang=en&stats_reduce=word&cqp=%5B%5D Korp - Moksha texts] (Giellatekno) 12,79 млн.

Версия от 18:45, 21 мая 2025

☼ ☼ ☼

☼ ☼ ☼

Аудиокорпуса

Проекты

Статьи