
今日は、人気のあるエンティティのダイナミクスに関するデータを視覚化したダッシュボードを表示し、Habrのユーザー向けに別のインスタンスを設定し、独自のインジケーターを監視する機会を与えて、規則性を追加します。
ここで何が起こっているかの詳細
私たちはインターネットを研究しています。特に、1日のうちに登録された世界のすべてのドメインをバイパスして情報を処理する機会があります。 この製品は非常に複雑であり、一般に、オープンデータの調査を普及させるために、Alexaによると、世界の上位100万サイトを毎日スキャンし、300人以上の常連でコンテンツを計算し、ダッシュボードにインジケーターを表示するインスタンスを立ち上げました。
関心を理解するために、以前に
記事が公開されましたが、その調査結果は喜ばずにはいられませんでした。

率直に黄色の見出しにもかかわらず、この記事はかなり良い評価を受けましたが、主なものは次のとおりです。
- 191(52%)-研究を実施したいという明確な主張
- 123(34%)-ギャングに記録しました
- 53(14%)-OK
CA-ハブの314ユーザー、無人で放置することはできず、このディスコのダッシュボードを見に行きました。
独自の指標を測定するために、それらを比較するものがありました-数か月間、ダイナミクスの既存のエンティティに関するパブリックドメインデータを投稿しました。
- 毎日、モスクワ時間19:00に、上位1,000,000のサイトのリストをバイパスします(1時間あたり)
- 成功した各Webサーバーレスポンスは、凡例に表示されているエンティティと自分で追加したエンティティに基づいて、これらすべてのレギュラーによって解析されます
ダッシュボードでの作業中のすべてのインジケーターと設定は、URLでスローされます。
レギュラーシーズンを追加するには?
フォームに記入します
データソース -ヘッダー/ html /テキスト(Webサーバーの応答ヘッダー/ htmlコード/ドキュメントから選択したテキスト)
正規表現の種類 -
正規表現の種類 :言及/ホスト(
正規表現文書にあるものの数/見つかったかどうか)
JAVA正規表現 -
通常テストは
ここで便利
です次の反復後、
ダッシュボードにすべての適切な正規者が表示されます。