Языковые корпуса: различия между версиями

Материал из Wiki FU-Lab
Перейти к навигации Перейти к поиску
Нет описания правки
Нет описания правки
Строка 18: Строка 18:
☼ ☼ ☼
☼ ☼ ☼


*[https://gtweb.uit.no/u_korp/?mode=mhr#?stats_reduce=word&cqp=%5B%5D Korp - Meadow Mari texts]  (Giellatekno) 57,38 млн.
*[http://web-corpora.net/KazakhCorpus/search/?interface_language=ru Алматинский корпус казахского языка] (НИУ ВШЭ) 40 млн.
*[http://web-corpora.net/KazakhCorpus/search/?interface_language=ru Алматинский корпус казахского языка] (НИУ ВШЭ) 40 млн.
*[http://web-corpora.net/TatarCorpus/search/index.php?interface_language=ru Татарский национальный корпус «Туган тел»] (НИУ ВШЭ) 26 млн.
*[http://web-corpora.net/TatarCorpus/search/index.php?interface_language=ru Татарский национальный корпус «Туган тел»] (НИУ ВШЭ) 26 млн.
*[https://gtweb.uit.no/u_korp/?mode=myv#?lang=en&stats_reduce=word&cqp=%5B%5D Korp - Erzya texts] (Giellatekno) 14,05 млн.
*[https://gtweb.uit.no/u_korp/?mode=mdf#?lang=en&stats_reduce=word&cqp=%5B%5D Korp - Moksha texts] (Giellatekno) 12,79 млн.
*[http://corpus.ossetic-studies.org/search/index.php?interface_language=ru Осетинский национальный корпус] (НИУ ВШЭ) 12 млн.
*[http://corpus.ossetic-studies.org/search/index.php?interface_language=ru Осетинский национальный корпус] (НИУ ВШЭ) 12 млн.
*[https://adyghe.web-corpora.net/ Адыгейский корпус] (НИУ ВШЭ) 10 млн.
*[https://adyghe.web-corpora.net/ Адыгейский корпус] (НИУ ВШЭ) 10 млн.
*[https://udmurt.web-corpora.net/ Корпуса удмуртского языка] (Тимофей Архангельский) 9,57 млн.
*[https://udmurt.web-corpora.net/ Корпуса удмуртского языка] (Тимофей Архангельский) 9,57 млн.
*[http://lingconlab.ru/standard_dargwa/ Корпус даргинского литературного языка] 6,4 млн
*[http://lingconlab.ru/standard_dargwa/ Корпус даргинского литературного языка] 6,4 млн
*[https://gtweb.uit.no/u_korp/?mode=mrj#?lang=en&stats_reduce=word&cqp=%5B%5D Korp - Hill Mari texts] (Giellatekno) 6,25 млн.
*[https://meadow-mari.web-corpora.net/ Корпуса лугового марийского языка] (Тимофей Архангельский) 5,53 млн.
*[https://meadow-mari.web-corpora.net/ Корпуса лугового марийского языка] (Тимофей Архангельский) 5,53 млн.
*[http://web-corpora.net/BuryatCorpus/search/?interface_language=ru Бурятский корпус]  (НИУ ВШЭ) 3 млн.
*[http://web-corpora.net/BuryatCorpus/search/?interface_language=ru Бурятский корпус]  (НИУ ВШЭ) 3 млн.
Строка 29: Строка 33:
*[https://komi-zyrian.web-corpora.net/ Корпуса коми-зырянского языка] (Тимофей Архангельский) 1,76 млн.
*[https://komi-zyrian.web-corpora.net/ Корпуса коми-зырянского языка] (Тимофей Архангельский) 1,76 млн.
*[https://moksha.web-corpora.net/ Корпуса мокшанского языка] (Тимофей Архангельский) 1,74 млн.
*[https://moksha.web-corpora.net/ Корпуса мокшанского языка] (Тимофей Архангельский) 1,74 млн.
*[https://gtweb.uit.no/u_korp/#?lang=en&stats_reduce=word&cqp=%5B%5D Korp - Komi-Zyrian texts] (Giellatekno) 963 тыс.
*[http://web-corpora.net/KalmykCorpus/search/?interface_language=ru Калмыцкий корпус] (НИУ ВШЭ) 800 тыс.
*[http://web-corpora.net/KalmykCorpus/search/?interface_language=ru Калмыцкий корпус] (НИУ ВШЭ) 800 тыс.
*[https://khakas.altaica.ru/corpus/ Электронный корпус хакасского языка] (ИЯз РАН) 700 тыс.
*[https://gtweb.uit.no/u_korp/?mode=udm#?lang=en&stats_reduce=word&cqp=%5B%5D Korp - Udmurt texts] (Giellatekno) 271 тыс.
*[https://gtweb.uit.no/u_korp/?mode=koi#?lang=en&stats_reduce=word&cqp=%5B%5D Korp - Komi-Permyak texts] (Giellatekno) 241 тыс.
*[http://beserman.ru/corpus/search/?interface_language=ru Бесермянский корпус] 65 тыс.
*[http://beserman.ru/corpus/search/?interface_language=ru Бесермянский корпус] 65 тыс.
*[https://khakas.altaica.ru/corpus/ Электронный корпус хакасского языка] (ИЯз РАН) 700 тыс.
*[https://corpora.iling-ran.ru/mari Корпус горномарийского языка] (ИЯз РАН)
*[https://corpora.iling-ran.ru/mari Корпус горномарийского языка] (ИЯз РАН)
*[https://itelmen.corpora.iling-ran.ru/ Корпус ительменского языка] (ИЯз РАН)
*[https://itelmen.corpora.iling-ran.ru/ Корпус ительменского языка] (ИЯз РАН)
Строка 37: Строка 44:
*[https://corpora.iling-ran.ru/selkup Корпус северноселькупских письменных текстов (юридические тексты)] (ИЯз РАН)
*[https://corpora.iling-ran.ru/selkup Корпус северноселькупских письменных текстов (юридические тексты)] (ИЯз РАН)
*[https://corpora.iling-ran.ru/evenk Корпус эвенкийского языка] (ИЯз РАН)
*[https://corpora.iling-ran.ru/evenk Корпус эвенкийского языка] (ИЯз РАН)
*[https://gtweb.uit.no/u_korp/?mode=mhr#?stats_reduce=word&cqp=%5B%5D Korp - Meadow Mari texts]  (Giellatekno) 57,38 млн.
*[https://gtweb.uit.no/u_korp/?mode=myv#?lang=en&stats_reduce=word&cqp=%5B%5D Korp - Erzya texts] (Giellatekno) 14,05 млн.
*[https://gtweb.uit.no/u_korp/?mode=mdf#?lang=en&stats_reduce=word&cqp=%5B%5D Korp - Moksha texts] (Giellatekno) 12,79 млн.
*[https://gtweb.uit.no/u_korp/?mode=mrj#?lang=en&stats_reduce=word&cqp=%5B%5D Korp - Hill Mari texts] (Giellatekno) 6,25 млн.
*[https://gtweb.uit.no/u_korp/#?lang=en&stats_reduce=word&cqp=%5B%5D Korp - Komi-Zyrian texts] (Giellatekno) 963 тыс.
*[https://gtweb.uit.no/u_korp/?mode=udm#?lang=en&stats_reduce=word&cqp=%5B%5D Korp - Udmurt texts] (Giellatekno) 271 тыс.
*[https://gtweb.uit.no/u_korp/?mode=koi#?lang=en&stats_reduce=word&cqp=%5B%5D Korp - Komi-Permyak texts] (Giellatekno) 241 тыс.


☼ ☼ ☼
☼ ☼ ☼

Версия от 19:01, 19 мая 2025

☼ ☼ ☼

☼ ☼ ☼

Аудиокорпуса


Статьи