今まで誰も「なぜ自転車を発明したのか」と言っていませんでした。そして、トマトはこの自転車に飛び込みませんでした。ロシア語の単語の平均の長さは長い間計算されて5.28文字に達しました。 ここに
ソースへの
リンクがあります 。 そして、このトピックは私に次のことを書かせました。 私の以前の
投稿について話し合ったとき、
シュテッツェンと
エイリエーターのhabrayusersは、異なる著者の平均語長はプレゼンテーションスタイルによって異なることを示唆し、解剖学的な違いがあるかもしれません、私は知りません。 ところで、Googleで最も求められているものの平均長を推測してみてください。 一般的に、私はこれが本当にそうであるかどうかを確認することにしました。
以下はプログラムのソースであり、テキスト内の単語の総数と平均単語長を考慮しています。 プログラムはperlで書かれています。
use strict;
use locale;
use POSIX qw (locale_h);
setlocale(LC_CTYPE, 'ru_RU.CP1251');
setlocale(LC_ALL, 'ru_RU.CP1251');
open (TEXT, "<text.txt");
undef $/;
my $text = <TEXT>;
close(TEXT);
my @words = $text =~ m/[-]+/ig;
open(OUT, ">out.txt");
my ($count, $sum);
foreach(@words){
$count++;
$sum += length($_);
}
print OUT " : $count\n : ".($sum/$count);
close(OUT);
私が使用したほとんどすべてのテキストは
モシュコフ図書館から取られました。 それは私が得たものです。
結論は、著者ごとに平均単語長がどれだけ異なるかは自分で調整します。