В интернете появился Национальный корпус башкирского языка

Автор | 16.04.2019


Как сообщает Башинформ, в глобальной сети запущен сайт Национального корпуса башкирского языка, являющийся результатом свободного сотрудничества специалистов по компьютерной лингвистике и языковых активистов сообщества Башкирских проектов.

Корпус появился на основе специальной компьютерной программы, способной провести морфологический анализ башкирской словоформы. Программу создал Борис Орехов, доцент факультета лингвистики Национального исследовательского университета Высшая школа экономики (г. Москва), уроженец Уфы.

В настоящее время в корпусе башкирского языка используется более 20 миллионов слов, что соответствует примерно 180 томам бумажных книг. Корпус включает произведения искусства, законы, газетные и журнальные статьи, некоторые статьи башкирского раздела Википедии.

«Мы очень надеемся, что люди и организации, заинтересованные в развитии башкирского языка, помогут нам улучшить корпус», — сказал Борис Орехов, главный разработчик национального корпуса башкирского языка, информационному агентству «Башинформ».

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *