«Яндекс»: почти 40% слов из словаря Даля полностью вышли из употребления
Новости29 ноября, 2016

«Яндекс»: почти 40% слов из словаря Даля полностью вышли из употребления

Почти полтора из четырех томов словаря Даля больше не актуальны. К такому выводу пришла компания «Яндекс» в ходе своего исследования. Аналитики компании узнали, сколько слов из словаря Даля, изданного в середине XIX века, употребляется в современных поисковых запросах.

По результатам исследования, примерно треть слов из словаря Даля регулярно используют до сих пор, чуть меньше трети — распространены крайне мало. Почти 40% слов вышли из употребления.

Исследователи компании использовали электронную републикацию словаря на основе 2-го издания. Из всех слов они выбрали те, что были записаны целиком и для которых было дано толкование. Аналитики «Яндекса» также собрали все поисковые запросы пользователей за последний год и разделили их на словоформы. Среди них часто встречались «ненастоящие» слова, например, с ошибками в написании, бессмысленные последовательности букв и слова, введенные в поиск при неверной раскладке. Чтобы «очистить» выборку, аналитики сравнили слова из запросов со словами из Национального корпуса русского языка.

Yandex

Анализ показал, что в наше время продолжают использовать 60 процентов слов из словаря Даля, то есть 2,5 тома. Половина из них — «живые»: их постоянно используют в поисковых запросах. Вторая половина — «уходящие»: они появляются в запросах очень редко, обычно люди ищут их для того, чтобы узнать значение. Остальные слова, по мнению «Яндекса», можно признать ушедшими, их почти не употребляют: пользователи в течение года ничего не искали с их помощью и даже не спрашивали, что они означают. В эту группу также попали некоторые слова, которые оказались в запросах из-за омонимии или по ошибке.

В «Яндексе» также составили тест «Угадайте значение слова», предлагающий попытаться понять значение устаревших, не используемых слов, и интерактивную карту «Региональные слова из словаря Даля», отражающие лексические единицы, характерные для разных регионов России. На карте можно посмотреть их старое значение и примеры поисковых запросов.

Читайте также
Комментарии(1)
Ну уже как то спорно. Я из Пензенской области, некоторые слова до сих пор слышу, например Мокшан, потому что это название населенного пункта. Странные какие то сведения.
Больше статей