Национальный корпус русского языка
Институт русского языка им. В. В. Виноградова РАН (ИРЯ РАН)
Краткое описание: Электронная база данных по русским текстам, позволяющая на протяжении нескольких веков проследить контексты и историю употребления того или иного слова, грамматического значения, словосочетания.
Ключевые конкурентные преимущества: отсутствие в мире размеченного (т. е. снабжённого морфологическими и семантическими характеристиками) русского корпуса такого объёма (около 150 млн слов). Ряд разделов — диалектный, поэтический подкорпуса, корпус устной речи — аналогов не имеют вообще. Доступность поиска по Корпусу в Интернете.
Научная значимость:
Национальный корпус русского языка представляет собой принципиально новый источник сведений о русском языке, являющийся необходимым компонентом представления информации о реальном функционировании и изменении языка; этот компонент сосуществует со словарём и грамматикой и дополняет их, а с другой стороны — служит практическим материалом для создания новых грамматик и словарей. Разработка корпуса — предмет специальной дисциплины — корпусной лингвистики, динамично развивающейся в мире.
Примеры практического применения в отраслях РФ: Министерство образования.
Стадия разработки: Опытная эксплуатация
Потребители продукции: преподаватели, учащиеся, учёные-лингвисты, редакторы, разработчики программного обеспечения, работающего с естественным языком