Теперь Кью работает в режиме чтения

Мы сохранили весь контент, но добавить что-то новое уже нельзя

Какова средняя длина слова в русском языке?

НаукаЗачем я это узнал?+3
Григорий В.
  · 14,5 K
Сотрудник группы компаний ФИНАМ  · 21 апр 2016

Средняя длина слова составляет около 6 букв, но зависит от корпуса (набора) текстов. Для корпуса русской разговорной речи средняя длина слова обычно составит от 3.9 до 4.9 букв. Для корпуса русской художественной литературы - от 4.9 до 5.9. Для газетно-новостного-корпуса - от 5.9 до 6.9. И наконец, для корпуса научной и деловой литературы - от 6.9 до 7.9 букв. Если вы составите корпус так, чтобы каждый из четырёх указанных видов (функциональных стилей) входил поровну (например, по миллиону слов), то получите, что в среднем слове 6 букв (точнее, 5,9). Но можно возразить, скажем, что научная и деловая речь встречается реже, и уменьшить её долю. Например, если заявить, что такой речи у нас больше нет, и  уменьшить её долю до нуля, то средняя длина слова тоже  уменьшится до 5.5 букв.  

Можно воспользоваться скриптом "худломер", который я написал в конце 90-х, и вычислить среднюю длину слова в интересующем вас тексте, кроме того, худломер определит функциональный стиль текста (используя те цифры, что я привёл выше). См. тут:  http://anti.teneta.ru/hudlomer/

Спасибо большое! Писал курсовую, стал выбирать в ней случайные "тысячи" слов, и всякий раз число символов без... Читать дальше
Фанат науки  · 21 апр 2016
Если взять корпус слов русского языка из почти 100 тысяч слов (взято отсюда http://www.dictionnaire.narod.ru/reverse.htm), то средняя длина слова получается около 9,69 буквы. Если убрать слова с дефисами (типа "иван-да-марья"), то получим немного меньшую длину - около 9,66 буквы. Хотя, конечно, вряд ли такое знание вообще имеет смысл, так как количество слов и их длина... Читать далее