Оценить:
 Рейтинг: 4.6

Введение в корпусную лингвистику

Год написания книги
2014
Теги
<< 1 2 3 4
На страницу:
4 из 4
Настройки чтения
Размер шрифта
Высота строк
Поля

www.ibl.bas.bg/BGNC_bg.htm (http://www.ibl.bas.bg/BGNC_bg.htm)

Основной корпус объемом около 1 млн единиц и 14 параллельных подкорпусов объемом 4 млрд единиц. Корпус содержит частичную морфосинтаксическую разметку.

14. Корпуса древнерусского языка

1) Исторический корпус в составе Национального корпуса русского языка делится на несколько подкорпусов:

? церковнославянский: ruscorpora.ru/search-orthlib.html (http://ruscorpora.ru/search-orthlib.html) (объем – ок. 500 тыс. токенов);

? среднерусский: ruscorpora.ru/search-mid_rus.html (http://ruscorpora.ru/search-mid_rus.html) (объем – ок. 3 млн токенов);

? древнерусский: ruscorpora.ru/search-old_rus.html (http://ruscorpora.ru/search-old_rus.html) (объем – ок. 500 тыс. токенов);

? берестяные грамоты: ruscorpora.ru/search-birchbark.html (http://ruscorpora.ru/search-birchbark.html) (объем – ок. 20 тыс. токенов).

Объем корпусов стремительно увеличивается, так что к тому моменту, когда вы читаете эти строки там наверняка появились новые тексты. Поиск в историческом корпусе с некоторыми ограничениями аналогичен поиску в основном корпусе: в нем есть богатая метаразметка, леммы, морфологические признаки.


<< 1 2 3 4
На страницу:
4 из 4