- НКРЯ
-
Национа́льный ко́рпус ру́сского языка́ — общедоступный для поиска электронный онлайновый корпус русских текстов. Открыт 29 апреля 2004 в Интернете по адресу http://ruscorpora.ru/.
Содержание
Составители
Работы по созданию Корпуса были начаты в 2001 году группой лингвистов из Москвы, Петербурга, Воронежа и других городов.
В программе по созданию Национального корпуса русского языка участвуют специалисты следующих организаций:
- Институт русского языка имени В. В. Виноградова (ИРЯ РАН)
- Институт языкознания РАН (ИЯз РАН)
- Институт проблем передачи информации им. А. А. Харкевича РАН (ИППИ РАН),
- Всероссийский институт научной и технической информации РАН (ВИНИТИ РАН)
- Институт лингвистических исследований РАН (ИЛИ РАН) в Санкт-Петербурге (совместно с Санкт-Петербургским государственным университетом (СПбГУ)).
Сайт Корпуса и поиск по нему поддерживаются компанией «Яндекс», сотрудники которой принимали участие также в разработке программного обеспечения Корпуса. Доступ к ресурсам НКРЯ бесплатен.
Состав корпуса
В Корпус входят как письменные тексты (художественные, мемуары, публицистика, научная, религиозная литература, повседневная печатная продукция), так и записи устных текстов (публичной речи и частных бесед). В корпус также входят подкорпуса поэтических и диалектных текстов, а также русско-английский корпус параллельных текстов. Объём корпуса на январь 2007 года составил 140 млн словоупотреблений.
Тексты снабжены морфологической и семантической разметкой.
См. также
Литература
- Национальный корпус русского языка: 2003—2005. Сборник статей. М.: Индрик, 2005. ISBN 5-85759-358-1
Ссылки
Wikimedia Foundation. 2010.