habrablogsでhabrastatisticsを収集するためのHabrautility

新年-在庫を取る時間。 また、ハブでブログを作成している場合、または他の誰かのブログで統計を確認したい場合は、私のオープンソースユーティリティが役立つかもしれません。



どのような統計が生成されますか?


すべての記事に関する基本情報を含むCSVファイル:



(スクリーンショットの拡大版はクリックで入手できます)

ビュー/コメント/プラス/ブックマークの数を担当するブログ作成者の情報を含むCSVファイル。



同様の情報を含むが、ハブごとにグループ化されたCSVファイル。



同様の情報を含むが、タグでグループ化されたCSVファイル。 タグをダウンロードするには、記事のリストだけでなく各記事も個別に読み込む必要があります。そのため、必要ない場合は、 -skipTagsフラグでデータのダウンロードプロセス高速化できます。



まあ、そしてボーナスとして-同じ情報を持つJSONファイル。



入手先


ソースはGitHubにあり、ユーティリティはJava 10で書かれており、 JARはすでにコンパイルされています。使用手順と例はリリースセクションの同じ場所にあります。

仕組みと使用方法


Habrahabr APIは神話*であるため、ユーティリティはjsoupを介してHTMLを単純かつ陰気に解析します。 個人ブログと企業ブログの両方に対してユーティリティを設定できます-それはすべて同じです。

企業ブログの場合https://habr.com/company/JetBrains/ように、プログラムにブログ自体へのリンクを提供しhttps://habr.com/company/JetBrains/

個人のブログの場合は、たとえばhttps://habr.com/users/milfgard/posts/ような投稿のあるページを指定する必要がありhttps://habr.com/users/milfgard/posts/

より詳細なヘルプがアプリケーションに組み込まれ、さらにリポジトリにreadmeファイルがあります。

*たぶんそうではないが、そのような情報を見つけることができなかった

バグを見つけた/別の機能が欲しい


それは質問ではありません-バグや要望をGithubの問題 、提案、改善に残してください-プルリクエストの形で。 さて、またはコメントでここに!

Source: https://habr.com/ru/post/J434226/


All Articles