タグクラウド:線形対対数

この投稿は、2つのことを書くことを奨励しました。 自動幹部とニックネームnapisalの誰か、私の投稿に積極的に反対しました ...

こんな感じでした:AutoCadabra のクラブの地図に行って、何も言われていないことに気付きました。 印象は、彼らがたった3つのクラブで書いているということでした。 クラウドを研究した後、出版物の数に対するタグ(この場合はブログ) サイズの線形依存性は完全に有益ではないという結論に達しました。 出版物が1つだけのクラブは、 15日と同じように見えます。

最初に思いついたのは、線形依存を対数依存に置き換えることでした。 結果がとても気に入ったので、 タグクラウドで同じことをすることにしました。 それから私はMmmに 投稿しました...おいしいです

そのため、タグクラウドはコンパクトな形で変更されました(クラブのクラウドよりも明白ですが、それほど大きくはありません)。

線形依存性( 最大

対数依存性(


実際、どうしてこれについてHabrに書くことにしたのですか? なぜなら、 napisalとの論争の中で、私はまさにそのような興味深い記事をGoogleで検索しているからです。 クラウドの形で、タグではなくブログではなく、第1レベルドメインの使用に関する統計が表示されるのは興味深いです。 それが私を統計と空間の対数についての深い哲学的思考に導いた:-)

記事の写真を次に示します。


ウィキペディアUPD正規分布、ガウス分布とも呼ばれ多くの知識分野、特に物理学で重要な役割を果たす確率分布です。 物理量は、膨大な数のランダムノイズの影響を受ける場合、正規分布に従います。 そのような状況が非常に一般的であることは明らかであるため、自然界のすべての分布の中で、最も頻繁に発生するのは正規分布であると言えるため、その名前の1つです。

実際、タグ(ドメイン名など)は、同じ配布法に従っています。 これと対数から...

Source: https://habr.com/ru/post/J30543/


All Articles