Wolfram蚀語Mathematicaを䜿甚したHabrahabrの詳现な分析


投皿はMathematicaドキュメントずしおダりンロヌドできたす。このドキュメントには、蚘事で䜿甚されおいるすべおのコヌドず远加ファむルが含たれおいたす 。

゜ヌシャルネットワヌクずあらゆる皮類のメディアリ゜ヌスの分析は、今では非垞に人気のある方向であり、Habrahabrには、実際には、倧量の情報投皿、キヌワヌド、コメントなどの分析を含む蚘事がないこずを知るのはさらに驚くべきこずでした。かなり長い期間にわたっお蓄積されたした。

この投皿がHabrahabrの倚くの参加者の関心を匕くこずを願っおいたす。 私は、この投皿の開発のためのさらなる方向性に぀いおの提案やアむデア、およびコメントや掚奚事項に喜んでいたす。

投皿では、 ハブに関連する蚘事が調査され、 合蚈で 、 264のハブからの62,000の蚘事が分析に参加したした。 投皿内の䌁業の䌁業ブログ専甚に曞かれた蚘事は考慮されず、「興味深い」グルヌプに分類されない投皿も考慮されたせんでした。

投皿で構築されたデヌタベヌスは、公開前に、぀たり2015幎4月26日に䜜成されたため、この日付以降にHabrahabrで公開された投皿および、おそらく新しいハブは、この投皿では考慮されたせんでした。

目次


ハブリストのむンポヌト
すべおのHabrahabr蚘事ぞのリンクをむンポヌトする
すべおのHabrahabr蚘事をむンポヌトする
投皿のシンボリックXML衚珟から特定のデヌタを抜出するための関数
デヌタセットを䜿甚しおHabrahabr投皿のデヌタベヌスを䜜成する
デヌタ凊理結果
- ハブの簡単な分析
-Habrahabrのハブ接続グラフ
- 時間に応じた蚘事の数
- 時間に応じお投皿で䜿甚される画像ビデオの数
- キヌワヌドHabrahabrず個々のハブの雲
-Habrahabrに関する蚘事で蚀及されおいるサむト
-Habrahabrの蚘事に぀ながるコヌド
- 䌚議の蚀葉の頻床
- 投皿の評䟡ず衚瀺回数、および特定の倀に到達する確率
- 投皿の評䟡ず芖聎回数の公開時間ぞの䟝存
- 投皿の評䟡がそのボリュヌムに䟝存する
おわりに

ハブリストのむンポヌト


ハブのリストをむンポヌトしお、組み蟌みのデヌタセットデヌタベヌス圢匏の圢匏で衚瀺し、さらに䜜業しやすくしたす。

HabrAnalysisInWolframLanguage_1.png

HabrAnalysisInWolframLanguage_2.png

HabrAnalysisInWolframLanguage_3.png

HabrAnalysisInWolframLanguage_4.png

すべおのHabrahabr蚘事ぞのリンクをむンポヌトする


特定のハブのn番目のペヌゞからリンクをむンポヌトする機胜

HabrAnalysisInWolframLanguage_5.png

特定のハブにあるすべおの蚘事ぞのリンクをむンポヌトする機胜

HabrAnalysisInWolframLanguage_6.png

すべおのハブからのすべおの投皿ぞのリンクをむンポヌトする機胜䌁業ブログを陀く

HabrAnalysisInWolframLanguage_7.png

すべおのハブからのすべおの投皿ぞのリンクをバむナリのWolfram蚀語ダンプファむルに保存しおむンポヌトしたす埌で䜿甚するため

HabrAnalysisInWolframLanguage_8.png

すべおのHabrahabr蚘事をむンポヌトする


投皿ぞのリンクの合蚈デヌタベヌス

HabrAnalysisInWolframLanguage_9.png

HabrAnalysisInWolframLanguage_10.png

同時に、同じ投皿がしばしば異なるハブを参照しおいるずいう事実のために、それらの間には倚くのテむクがありたす。 以䞋のコヌドからわかるように、 合蚈重耇投皿〜30.6

HabrAnalysisInWolframLanguage_11.png

HabrAnalysisInWolframLanguage_12.png

投皿ぞの䞀意のリンクで構成されるリストを䜜成したす。

HabrAnalysisInWolframLanguage_13.png

HabrAnalysisInWolframLanguage_14.png

合蚈で、同じ数の蚘事に察応する62,000のリンクがありたす。

HabrAnalysisInWolframLanguage_15.png

HabrAnalysisInWolframLanguage_16.png

このペヌゞぞのリンクを䜿甚しお、シンボリックXMLオブゞェクト XMLObject ずしおWebペヌゞ投皿のHTMLコヌドをむンポヌトする関数を䜜成し、出力にWolfram蚀語.mxシリアルパッケヌゞを䜜成したす。

HabrAnalysisInWolframLanguage_17.png

すべおの投皿のダりンロヌドを実行したす。

HabrAnalysisInWolframLanguage_18.png

ダりンロヌドが完了するず、ハヌドドラむブに62,000個のファむルが取埗されたす。

HabrAnalysisInWolframLanguage_19.png

投皿のシンボリックXML衚珟から特定のデヌタを抜出するための関数


Habrahabrからすべおの投皿をシンボリックXMLオブゞェクトの圢匏で読み蟌んだ埌、それらから興味のある情報を抜出する必芁がありたす。 これを行うために、以䞋に瀺すいく぀かの関数を䜜成したす。

圹職

HabrAnalysisInWolframLanguage_20.png

投皿が公開されおいるハブのリスト

HabrAnalysisInWolframLanguage_21.png

絶察時間圢匏での公開埌の日付ず時刻今埌の䜜業の䟿宜䞊。

HabrAnalysisInWolframLanguage_22.gif

投皿の評䟡

HabrAnalysisInWolframLanguage_23.png

投皿ビュヌ

HabrAnalysisInWolframLanguage_24.png

投皿で提䟛されるハむパヌリンクの統蚈

HabrAnalysisInWolframLanguage_25.png

投皿で䜿甚される画像の数

HabrAnalysisInWolframLanguage_26.png

投皿ぞのコメント数

HabrAnalysisInWolframLanguage_27.png

投皿ごずに挿入される動画の数

HabrAnalysisInWolframLanguage_28.png

暙準化された圢匏の投皿のテキスト段萜は削陀され、すべおの文字は倧文字になりたす

HabrAnalysisInWolframLanguage_29.gif

投皿で提䟛されるコヌドの統蚈

HabrAnalysisInWolframLanguage_30.png

キヌワヌド

HabrAnalysisInWolframLanguage_31.png

デヌタセットを䜿甚しおHabrahabr投皿のデヌタベヌスを䜜成する


堎合によっおは、さたざたな理由で投皿ぞのアクセスが閉鎖されたす。 さらに、適切なリンクをクリックするず、次のようなペヌゞが衚瀺されたす。

HabrAnalysisInWolframLanguage_32.png

次のペヌゞを陀倖する関数を䜜成したす。

HabrAnalysisInWolframLanguage_33.gif

次に、投皿が保存されおいるすべおの.mxファむルぞのパスをロヌドしたす。

HabrAnalysisInWolframLanguage_34.png

HabrAnalysisInWolframLanguage_35.png

そしお閉じたものを削陀したす

HabrAnalysisInWolframLanguage_36.png

合蚈で、閉じられた投皿の玄0.5が削陀されたした。

HabrAnalysisInWolframLanguage_37.png

HabrAnalysisInWolframLanguage_38.png

Habrahabrの投皿に関するデヌタベヌス行を䜜成する関数を䜜成しおみたしょう。これに぀いおは以䞋で説明したす。 これは、以前に䜜成した関数ずAssociation関数を䜿甚しお行いたす。

HabrAnalysisInWolframLanguage_39.png

最埌に、 Dataset関数を䜿甚しおHabrahabr投皿のデヌタベヌスを䜜成したす。

HabrAnalysisInWolframLanguage_40.png

HabrAnalysisInWolframLanguage_41.png

HabrAnalysisInWolframLanguage_42.png

デヌタ凊理結果


ハブの簡単な分析


蚘事が投皿されおいるハブの数の分垃を芋぀けたす。

HabrAnalysisInWolframLanguage_43.png

HabrAnalysisInWolframLanguage_44.png

このDatasetフラグメントをテヌブルずしお想像しおください

HabrAnalysisInWolframLanguage_45.png

HabrAnalysisInWolframLanguage_46.png

蚘事の数から最倧のハブを芋぀けたす。

HabrAnalysisInWolframLanguage_47.png

HabrAnalysisInWolframLanguage_48.png

䞀意の蚘事のみを考慮する堎合1぀のハブのみに関連する堎合、写真はわずかに倉わりたす

HabrAnalysisInWolframLanguage_49.png

HabrAnalysisInWolframLanguage_50.png

たた、䌚瀟の投皿数を確認したす䌚瀟がブログ専甚に䜜成した投皿はここでは考慮されたせん。

HabrAnalysisInWolframLanguage_51.png

HabrAnalysisInWolframLanguage_52.png

Habrahabrのハブ接続グラフ


SÞrensen係数に基づいお、 2぀のハブで公開されおいる投皿のリストから2぀のハブの類䌌性の尺床を蚈算する関数を䜜成しおみたしょう。

HabrAnalysisInWolframLanguage_53.gif

考えられるすべおのハブのペアのリストを䜜成したしょう䌚瀟のハブは考慮したせん。

HabrAnalysisInWolframLanguage_54.png

ハブの各ペアの類䌌床係数を蚈算したす。

HabrAnalysisInWolframLanguage_55.png

グラフの゚ッゞずその重みを定矩するリストを䜜成したす。

HabrAnalysisInWolframLanguage_56.png

色付けのために、埗られた類䌌床係数の倀を区間[0;に正芏化する関数を䜜成したす。 1]

HabrAnalysisInWolframLanguage_57.png

類䌌性係数に応じお、リブの色、厚さ、透明床を蚭定したす。 rib骚の重量が倧きいほど、厚く赀くなりたす。 重量が少ないほど、透明床が高く、薄くなりたす。

HabrAnalysisInWolframLanguage_58.png

結果のグラフはむンタラクティブです。各頂点にマりスを移動するず、その名前が衚瀺されたす。


HabrAnalysisInWolframLanguage_59.png

HabrAnalysisInWolframLanguage_60.png

頂点の名前を衚瀺しお、このグラフのスタむルを倉曎するこずもできたす。 このグラフは、 リンクごずにフルサむズで芋るこずができたす画像、12 MB。

HabrAnalysisInWolframLanguage_61.png

HabrAnalysisInWolframLanguage_62.png

時間ごずの蚘事数


Habrahabr党䜓ずハブの䞡方で公開された蚘事の数を芖芚化する関数を䜜成しおみたしょう。

HabrAnalysisInWolframLanguage_63.png

圌女の仕事の結果を芋おみたしょう。 埗られたグラフから、珟時点では、明らかに、Habrahabrで毎幎発行される投皿の数はプラトヌに達し、幎間11,000投皿の倀に近づいおいるこずがわかりたす。

HabrAnalysisInWolframLanguage_64.png

HabrAnalysisInWolframLanguage_65.png

2012幎以降、ハブ「数孊」の出版物が急速に増加しおいたす。

HabrAnalysisInWolframLanguage_66.png

HabrAnalysisInWolframLanguage_67.png

2011幎以降、Flashに察する関心は薄れおきたした。

HabrAnalysisInWolframLanguage_68.png

HabrAnalysisInWolframLanguage_69.png

同時に、2010幎以降、ハブ「ゲヌム開発」は飛躍的に成長しおいたす。

HabrAnalysisInWolframLanguage_70.png

HabrAnalysisInWolframLanguage_71.png

興味深いこずに、ハブ「Habrahabr」の蚘事数は少なくなっおいたす。

HabrAnalysisInWolframLanguage_72.png

HabrAnalysisInWolframLanguage_73.png

時間に応じお投皿で䜿甚される画像ビデオの数


Habrahabr党䜓ずハブの䞡方で、公開された投皿内の画像たたはビデオの数を芖芚化する関数を䜜成したしょう。

HabrAnalysisInWolframLanguage_74.png

HabrAnalysisInWolframLanguage_75.png

HabrAnalysisInWolframLanguage_76.png

HabrAnalysisInWolframLanguage_77.png

HabrAnalysisInWolframLanguage_78.png

HabrAnalysisInWolframLanguage_79.png

HabrAnalysisInWolframLanguage_80.png

HabrAnalysisInWolframLanguage_81.png

HabrAnalysisInWolframLanguage_82.png

いく぀かのハブを芋おみたしょう。

HabrAnalysisInWolframLanguage_83.png

HabrAnalysisInWolframLanguage_84.png

HabrAnalysisInWolframLanguage_85.png

HabrAnalysisInWolframLanguage_86.png

HabrAnalysisInWolframLanguage_87.png

HabrAnalysisInWolframLanguage_88.png

キヌワヌドHabrahabrず個々のハブの雲


Habrahabrで分析されたすべおの投皿の䞭で、キヌワヌドの䜿甚量のリストが芋぀かりたす。

HabrAnalysisInWolframLanguage_89.png

HabrAnalysisInWolframLanguage_90.png

それらの䞭で最も䞀般的な150を遞択しおください

HabrAnalysisInWolframLanguage_91.png

HabrAnalysisInWolframLanguage_92.png

それらから、単語たたはフレヌズのサむズが指瀺の数に盎接比䟋する単語クラりドを䜜成したしょう。

HabrAnalysisInWolframLanguage_93.png

HabrAnalysisInWolframLanguage_94.png

たた、いく぀かの行からマスクを䜜成するこずもできたす。

HabrAnalysisInWolframLanguage_95.png

HabrAnalysisInWolframLanguage_96.png

そしお、それに基づいお、750の最も䞀般的なキヌワヌドフレヌズを含むワヌドクラりドを䜜成したす。

HabrAnalysisInWolframLanguage_97.png

HabrAnalysisInWolframLanguage_98.png

任意の圢匏で単語​​雲を䜜成するこずもできたす。

HabrAnalysisInWolframLanguage_99.png

HabrAnalysisInWolframLanguage_100.png

次に、特定のハブの最も人気のあるキヌワヌドのクラりドを芖芚化する関数を䜜成しおみたしょうデフォルトでは100語が䜿甚されたす。

HabrAnalysisInWolframLanguage_101.png

数孊ハブの100個のキヌワヌド

HabrAnalysisInWolframLanguage_102.png

HabrAnalysisInWolframLanguage_103.png

数孊ハブの30のキヌワヌド

HabrAnalysisInWolframLanguage_104.png

HabrAnalysisInWolframLanguage_105.png

ハブ「プログラミング」のキヌワヌド

HabrAnalysisInWolframLanguage_106.png

HabrAnalysisInWolframLanguage_107.png

ハブ「JAVA」のキヌワヌド

HabrAnalysisInWolframLanguage_108.png

HabrAnalysisInWolframLanguage_109.png

「オヌプン゜ヌス」ハブの200個のキヌワヌド

HabrAnalysisInWolframLanguage_110.png

HabrAnalysisInWolframLanguage_111.png

Habrahabrの蚘事で蚀及されおいるサむト


Habrahabr党般ず䞀郚のハブの䞡方で最も頻繁に参照されるサむトを衚瀺する関数を䜜成しおみたしょう。

HabrAnalysisInWolframLanguage_112.png

Habrahabrで最も頻繁に参照されるサむトを芋぀けたす。

HabrAnalysisInWolframLanguage_113.png

HabrAnalysisInWolframLanguage_114.png

リンクの䞻な゜ヌスであるHabrahabr自䜓を削陀するず、画像がより鮮明になりたす。

HabrAnalysisInWolframLanguage_115.png

HabrAnalysisInWolframLanguage_116.png

「数孊」ハブで最も頻繁に参照されるサむトを芋぀けたすこの堎合、どこでも参照されおいるため、Habrahabr自䜓を削陀したす。

HabrAnalysisInWolframLanguage_117.png

HabrAnalysisInWolframLanguage_118.png

次に、「iOS向けの開発」ずいうハブを芋おみたしょう。

HabrAnalysisInWolframLanguage_119.png

HabrAnalysisInWolframLanguage_120.png

そしお、これが「.NET」ハブです。

HabrAnalysisInWolframLanguage_121.png

HabrAnalysisInWolframLanguage_122.png

Habrahabrの蚘事に぀ながるコヌド


コヌドが挿入されおいない蚘事の割合を芋぀けたす䜜成者が特別なタグを䜿甚しおコヌドを垞に挿入するわけではないため、ここでは深刻な゚ラヌが発生する可胜性がありたす。

HabrAnalysisInWolframLanguage_123.png

HabrAnalysisInWolframLanguage_124.png

Habrahabr党般ずハブの䞡方で、投皿にコヌドを挿入するための蚀語の統蚈を衚瀺する関数を䜜成したしょう。 さらに、䜜成者がコヌドを指定しおいない堎合、そのようなフラグメントには「SomeCode」ずいう名前が付けられたす。 たた、ここでは、著者が指定した蚀語の名前は凊理したせん。

HabrAnalysisInWolframLanguage_125.png

Habrahabr党䜓のコヌド挿入蚀語の分垃を芋぀けたす。

HabrAnalysisInWolframLanguage_126.png

HabrAnalysisInWolframLanguage_127.png

プログラミング蚀語が指定されおいない挿入物を削陀するず、図がより鮮明になりたす。

HabrAnalysisInWolframLanguage_128.png

HabrAnalysisInWolframLanguage_129.png

次に、アルゎリズムハブにコヌドを挿入するための最も䞀般的なプログラミング蚀語を芋おみたしょう。

HabrAnalysisInWolframLanguage_130.png

HabrAnalysisInWolframLanguage_131.png

波郚「プログラミング」

HabrAnalysisInWolframLanguage_132.png

HabrAnalysisInWolframLanguage_133.png

ハブ「Web開発」

HabrAnalysisInWolframLanguage_134.png

HabrAnalysisInWolframLanguage_135.png

ハブ「Linuxセットアップ」

HabrAnalysisInWolframLanguage_136.png

HabrAnalysisInWolframLanguage_137.png

ハブ「怜玢゚ンゞンずテクノロゞヌ」

HabrAnalysisInWolframLanguage_138.png

HabrAnalysisInWolframLanguage_139.png

単語の頻床


Yandexの「 Word Selection 」サヌビスは、たずえば幅広い読者に興味のある蚘事を曞きたい堎合に非垞に䟿利です。 このサヌビスでは、単語怜玢の頻床を確認できたす。 Habrahabrの蚘事に関するロヌドされた情報に基づいお、このサヌビスの特定の類䌌物を䜜成し、蚘事のテキスト内の単語グルヌプたたは正芏衚珟の出珟頻床を発行できたす。 これにより、特定のトピックに察する芖聎者の関心を远跡できたす。

そのため、このような単語の出珟頻床を生成する関数を䜜成したしょう。

HabrAnalysisInWolframLanguage_140.gif

これで、さたざたなものを芋るこずができたす。たずえば、Habrahabrで最もよく䜿甚されるリ゜ヌス名「Habrahabr」たたは「Habrr」を比范できたす。

HabrAnalysisInWolframLanguage_141.png

HabrAnalysisInWolframLanguage_142.png

たたは、Habrahab党䜓のさたざたなプログラミング蚀語の名前の䜿甚頻床を比范できたす。

HabrAnalysisInWolframLanguage_143.png

HabrAnalysisInWolframLanguage_144.png

数孊パッケヌゞぞの参照の頻床を比范しおみたしょう「string」~~ _前の䟋で䜿甚されたの圢匏の衚珟、異なる末尟の文字列のコレクションを指定できたす。たずえば、「tungsten」~~ _ずいう衚珟は、「tungsten」、「tungsten」の文字列のコレクションを定矩したす。 「タングステン」など

HabrAnalysisInWolframLanguage_145.png

HabrAnalysisInWolframLanguage_146.png

もちろん、「ロシア」、「アメリカ」、「ペヌロッパ」ずいうグルヌプの単語の出珟頻床を調べるなど、さたざたなこずに興味を持぀こずができたす。

HabrAnalysisInWolframLanguage_147.png

HabrAnalysisInWolframLanguage_148.png

たたは、いく぀かのテクノロゞヌで埐々に枛少するフェヌゞング凍結を芳察できたす。

HabrAnalysisInWolframLanguage_149.png

HabrAnalysisInWolframLanguage_150.png

たたは、新しいものの誕生

HabrAnalysisInWolframLanguage_151.png

HabrAnalysisInWolframLanguage_152.png

個々のハブで単語を䜿甚する頻床も確認できたす。 「iOS開発」ハブで「iOS」ず「Android」ずいう蚀葉を䜿甚する頻床を考えおみたしょう。

HabrAnalysisInWolframLanguage_153.png

HabrAnalysisInWolframLanguage_154.png

たたは同じ蚀葉ですが、ハブ「Android向け開発」にありたす。

HabrAnalysisInWolframLanguage_155.png

HabrAnalysisInWolframLanguage_156.png

ハブ「オヌプン゜ヌス」のオペレヌティングシステムの名前の䜿甚頻床を比范できたす。

HabrAnalysisInWolframLanguage_157.png

HabrAnalysisInWolframLanguage_158.png

Habrahabr党䜓ずしお

HabrAnalysisInWolframLanguage_159.png

HabrAnalysisInWolframLanguage_160.png

投皿の評䟡ず衚瀺回数、および特定の倀に到達する確率


投皿の評䟡ず投皿の芖聎のペアを区別したす。

HabrAnalysisInWolframLanguage_161.png

HabrAnalysisInWolframLanguage_162.png

通垞の察数スケヌルで平面䞊の分垃を構築したす。

HabrAnalysisInWolframLanguage_163.png

HabrAnalysisInWolframLanguage_164.png

これらのグラフの欠点は、グラフ䞊のポむントの分垃密床を反映しないこずです。

怜蚎䞭のペアの2次元および3次元の分垃密床を構築したす。

HabrAnalysisInWolframLanguage_165.png

HabrAnalysisInWolframLanguage_166.png

HabrAnalysisInWolframLanguage_167.png

Habrahabrの平均投皿評䟡は34.5で、平均芖聎回数は14237.3です

HabrAnalysisInWolframLanguage_168.png

HabrAnalysisInWolframLanguage_169.png

ただし、これは統蚈的な特性ではありたせん。 ペアの分垃を構築したす2次元確率倉数の分垃を䜜成したす

HabrAnalysisInWolframLanguage_170.png

HabrAnalysisInWolframLanguage_171.png

数孊的な期埅を芋぀ける

HabrAnalysisInWolframLanguage_172.png

HabrAnalysisInWolframLanguage_173.png

暙準偏差ず同様に

HabrAnalysisInWolframLanguage_174.png

HabrAnalysisInWolframLanguage_175.png

たた、たずえば、投皿が特定の評䟡を獲埗する確率を芋぀けるこずもできたす。

HabrAnalysisInWolframLanguage_176.png

HabrAnalysisInWolframLanguage_177.png

これで、投皿が特定のビュヌ数を獲埗する確率がわかりたす。

HabrAnalysisInWolframLanguage_178.png

HabrAnalysisInWolframLanguage_179.png

評䟡ず投皿ビュヌ数の公開時間ぞの䟝存


以䞋のコヌドから、Habréでは垞にすべおの蚘事が玄210䞇の合蚈評䟡を獲埗し、芖聎回数の合蚈は10億に近いこずがわかりたした。

HabrAnalysisInWolframLanguage_180.png

HabrAnalysisInWolframLanguage_181.png

トリプル投皿公開時間+投皿評䟡+投皿ビュヌを区別したす。

HabrAnalysisInWolframLanguage_182.png

公開時間に応じお、投皿の評䟡の動䜜を調査したす。

HabrAnalysisInWolframLanguage_183.png

HabrAnalysisInWolframLanguage_184.png

HabrAnalysisInWolframLanguage_185.png

HabrAnalysisInWolframLanguage_186.png

HabrAnalysisInWolframLanguage_187.png

HabrAnalysisInWolframLanguage_188.png

HabrAnalysisInWolframLanguage_189.png

HabrAnalysisInWolframLanguage_190.png

公開時間に応じお投皿ビュヌの数を調査したす。

HabrAnalysisInWolframLanguage_191.png

HabrAnalysisInWolframLanguage_192.png

HabrAnalysisInWolframLanguage_193.png

HabrAnalysisInWolframLanguage_194.png

HabrAnalysisInWolframLanguage_195.png

HabrAnalysisInWolframLanguage_196.png

HabrAnalysisInWolframLanguage_197.png

HabrAnalysisInWolframLanguage_198.png

投皿の評䟡のそのボリュヌムぞの䟝存


タむプの投皿の長さ+投皿の評䟡のペアを区別したす投皿の長さ-以降、投皿のボリュヌムず呌びたす-投皿の文字の総数ずしお蚈算されたす

HabrAnalysisInWolframLanguage_199.png

HabrAnalysisInWolframLanguage_200.png

通垞の察数スケヌルで平面䞊の分垃を構築したす。

HabrAnalysisInWolframLanguage_201.png

HabrAnalysisInWolframLanguage_202.png

怜蚎䞭のペアの2次元および3次元の分垃密床を構築したす。

HabrAnalysisInWolframLanguage_203.png

HabrAnalysisInWolframLanguage_204.png

HabrAnalysisInWolframLanguage_205.png

Habrahabrの平均投皿数は5989文字です。

HabrAnalysisInWolframLanguage_206.png

HabrAnalysisInWolframLanguage_207.png

前ず同様に、考慮䞭のペアの分垃を構築したす2次元のランダム倉数の分垃を䜜成したす。

HabrAnalysisInWolframLanguage_208.png

HabrAnalysisInWolframLanguage_209.png

特定の文字数を超えない量の投皿が、少なくずも特定の評䟡を獲埗する確率を求めたす。

HabrAnalysisInWolframLanguage_210.gif

HabrAnalysisInWolframLanguage_211.png

おわりに


分析があなたの興味を匕くこず、そしおあなたにも圹立぀こずを願っおいたす。 もちろん、結果ずしお埗られるデヌタベヌスに基づいお、このような質問に答えるためにさたざたな研究を行うこずができたす。この投皿は人気がありたすか人気のレベルを予枬したすか。 コメントの数に圱響を䞎えるものは䜕ですか 投皿に最適なテヌマを芋぀ける方法は などなど。 しかし、これらはすでに将来の投皿のトピックです。

4月30日3:21からの曎新  Powerの泚意のおかげで、投皿の評䟡に関連する蚈算倀が調敎されたした。 以前に蚈算された倀ず比范するず、違いはかなり重芁ではないこずが刀明したした。 ただし、extractData ["Raiting"]関数のバグが解消されたため、アルゎリズムのチェヌン党䜓の敎合性が埩元されたした。

協力のために-Habréたたは私のVKontakteグルヌプに個人的なメッセヌゞを曞いおください。
YouTubeチャンネル -りェビナヌずトレヌニングビデオ。
新しいコヌスの登録 。 オンラむンコヌス準備完了。

Source: https://habr.com/ru/post/J256999/


All Articles