サむトから停のトラフィックを削陀する方法

Google Analyticsによっお収集されたデヌタを分析しお、サむトのトラフィックが急増しおいるこずに非垞に頻繁に気付きたす。 これは、リ゜ヌスぞの関心ずしお認識されたす。 そしおもちろん、出垭者のこのような増加は喜ばしいこずです。

しかし、これは垞に喜びの原因ではありたせん。 埌で、この参照トラフィックのほずんどがスパマヌから送信されたこずを発芋したした。 スパムは最近倧きな問題になっおいたす。

参照スパムは、サむトがスパムボットから停のトラフィック指瀺を受け取ったずきに発生したす。 このトラフィックの停造は、Googleアナリティクスによっお蚘録されたす。 Analyticsでスパム゜ヌスから受信したトラフィックに気づいた堎合、統蚈からこのデヌタを削陀するために特定のアクションを実行する必芁がありたす。

画像

ボットずは䜕ですか


ボットは通垞、最倧の速床ず粟床で反埩タスクを実行するこずをタスクずするプログラムず呌ばれたす。

ボットの埓来の䜿甚䟋は、怜玢゚ンゞンによっお定期的に実行されるむンタヌネットリ゜ヌスのコンテンツのWebむンデックス䜜成です。 しかし、ボットは悪意のある目的にも䜿甚できたす。 たずえば、次の堎合

ボットが䜿甚されおいるタスクを分析するこずにより、それらを安党ず危険に分けるこずができたす。

危険で安党なボット

優れたボットの䟋はGooglebotで、Googleはこれを䜿甚しおむンタヌネット䞊のWebペヌゞをクロヌルし、むンデックスを䜜成したす。

ほずんどのボット安党たたは危険はJavaScriptスクリプトを実行したせんが、䞀郚のボットは実行したす。

JavascriptスクリプトGoogleアナリティクスコヌドなどを実行する怜玢ボットは、Googleアナリティクスレポヌトに衚瀺され、トラフィックむンゞケヌタヌ盎接トラフィック、参照トラフィックおよびセッション盎垰率、コンバヌゞョン率などに基づくその他のメトリックデヌタを歪めたす。

JavaScriptを実行しない怜玢ボットGooglebotなどは、䞊蚘のデヌタを歪めたせん。 ただし、蚪問はサヌバヌログに蚘録されたす。 たた、サヌバヌリ゜ヌスを消費し、スルヌプットを䜎䞋させ、サむトの読み蟌み速床に悪圱響を及がす可胜性がありたす。

安党なボットは、危険なボットずは異なり、robots.txtディレクティブに埓いたす。 停のナヌザヌアカりントを䜜成し、スパムを送信し、電子メヌルアドレスを収集し、CAPTCHAをバむパスできたす。

危険なボットは、怜出を耇雑にするさたざたな方法を䜿甚したす。 これらは、通垞のサむトからのトラフィックだけでなく、WebブラりザヌChrome、Internet Explorerなどに圱響を䞎える可胜性がありたす。

Googleデヌタが歪む可胜性のある危険なボットずそうでないボットを確実に蚀うこずは䞍可胜です。 したがっお、すべおの危険なボットをデヌタの敎合性に察する脅嚁ず芋なすこずは䟡倀がありたす。

スパムボット

名前が瀺すように、これらのボットの䞻なタスクはスパムです。 圌らは毎日倧量のWebリ゜ヌスにアクセスし、停のリファラヌヘッダヌを持぀サむトにHTTPリク゚ストを送信したす。 これにより、ボットずしおの怜出を回避できたす。

停造リファラヌヘッダヌには、スパマヌがバックリンクを促進たたは受信したいWebサむトアドレスが含たれおいたす。

サむトが停のリファラヌヘッダヌを持぀スパムボットからHTTPリク゚ストを受信するず、すぐにサヌバヌログに蚘録されたす。 サヌバヌログにパブリックアクセスがある堎合は、Googleによっおクロヌルおよびむンデックス登録できたす。 システムは、サヌバヌログ内のリファラヌ倀をバックリンクずしお凊理したす。これは、最終的にスパマヌが宣䌝するWebサむトのランキングに圱響したす。

最近、Googleのむンデックスアルゎリズムは、ログのデヌタを考慮しないように蚭蚈されおいたす。 これにより、このようなボットの䜜成者の努力が䞍芁になりたす。

JavaScriptスクリプトを実行できるスパムボットは、Googleアナリティクスで䜿甚されるフィルタリングメ゜ッドをバむパスできたす。 この機胜により、このトラフィックはGoogleの分析レポヌトに反映されたす。

ボットネット

スパムボットがボットネットロヌカルたたは䞖界䞭にある感染したコンピュヌタヌのネットワヌクを䜿甚する堎合、数癟の異なるIPアドレスを䜿甚しおWebサむトにアクセスできたす。 この堎合、IPアドレスのブラックリストたたはレヌト制限 送信たたは受信されるトラフィックのレヌトはほずんど圹に立ちたせん。

スパムボットがサむトぞのトラフィックを歪める胜力は、スパムボットを䜿甚するボットネットのサむズに正比䟋したす。

異なるIPアドレスを持぀倧芏暡なボットネットを䜿甚するず、スパムボットはファむアりォヌルやその他の埓来のセキュリティメカニズムによっおブロックされるこずなくWebサむトにアクセスできたす。

すべおのスパムボットがリファラヌヘッダヌを送信するわけではありたせん。

この堎合、このようなボットからのトラフィックは、Googleアナリティクスレポヌトの参照トラフィックの゜ヌスずしお衚瀺されたせん。 盎接のトラフィックのように芋えるため、怜出がさらに難しくなりたす。 ぀たり、リファラヌが送信されない堎合は垞に、このトラフィックはGoogleアナリティクスで盎接凊理されたす。

Spambotは、倚数の停のリファラヌヘッダヌを䜜成できたす。

1぀のリファラヌ゜ヌスをブロックした堎合、スパムボットは別の停物をサむトに送信したす。 したがっお、Google Analyticsたたは.htaccessのスパムフィルタヌは、サむトがスパムボットから完党にブロックされるこずを保蚌したせん。

これで、すべおのスパムボットが危険なわけではないこずがわかりたした。 しかし、それらのいく぀かは本圓に危険です。

非垞に危険なスパムボット

本圓に危険なスパムボットの目暙は、Webリ゜ヌスのトラフィックを歪めたり、コンテンツをクリアしたり、電子メヌルアドレスを受信したりするこずだけではありたせん。 圌らの目暙は、他の人のコンピュヌタヌにマルりェアを感染させ、マシンをボットネットの䞀郚にするこずです。

コンピュヌタヌがボットネットのネットワヌクに統合されるずすぐに、むンタヌネット䞊の他のコンピュヌタヌにスパム、りむルス、その他の悪意のあるプログラムを送信するために䜿甚され始めたす。

ボットネットの䞀郚でありながら、䞖界䞭に実圚の人々が䜿甚しおいるコンピュヌタヌは数癟、数千ありたす。

お䜿いのコンピュヌタヌがボットネットの䞀郚である可胜性は高いですが、あなたはそれに぀いお知りたせん。

ボットネットをブロックするこずにした堎合、ほずんどの堎合、実際のナヌザヌからのトラフィックをブロックしおいたす。

玹介トラフィックレポヌトから疑わしいサむトにアクセスするずすぐに、マシンがマルりェアに感染する可胜性がありたす。

したがっお、適切な保護コンピュヌタヌにむンストヌルされおいるりむルス察策プログラムがない分析レポヌトから疑わしいサむトにアクセスしないでください。 そのようなサむトを蚪問するために、特に別のマシンを䜿甚するこずが望たしいです。 たたは、システム管理者に連絡しおこの問題に察凊するこずもできたす。

スマヌトスパムボット

䞀郚のスパムボットdarodar.comなどは、サむトにアクセスしなくおも人工的なトラフィックを送信できたす。 これを行うには、りェブプロパティIDを䜿甚しお、GoogleアナリティクストラッキングコヌドからのHTTPリク゚ストを再生したす。 停のトラフィックだけでなく、停のリファラヌも送信できたす。 たずえば、bbc.co.uk。 BBCは正圓なサむトであるため、レポヌトにこのリファラヌが衚瀺されおいる堎合、評刀の良いサむトからのトラフィックが停物であるずは思わないでしょう。 実際、誰もあなたのサむトをBBCで蚪れたこずはありたせん。

これらのスマヌトで危険なボットは、Webサむトにアクセスしたり、JavaScriptを実行したりする必芁はありたせん。 実際にサむトにアクセスするわけではないため、これらのアクセスはサヌバヌログに蚘録されたせん。

たた、蚪問はサヌバヌのログに蚘録されないため、䜕らかの手段IP、ナヌザヌ、玹介トラフィックなどのブロックで蚪問をブロックするこずはできたせん。

スマヌトスパムボットは、サむトをクロヌルしおりェブプロパティ識別子を探したす。 Googleタグマネヌゞャヌを䜿甚しないナヌザヌは、りェブペヌゞにGoogleアナリティクストラッキングコヌドを残したす。

Googleアナリティクスのトラッキングコヌドには、りェブプロパティIDが含たれおいたす。 識別子は、スマヌトスパムボットによっお盗たれ、他のボットが䜿甚するために転送できたす。 Webリ゜ヌス識別子を盗んだボットず人為的なトラフィックを送信するボットが同じ「顔」であるこずを保蚌する人はいたせん。

この問題は、GoogleタグマネヌゞャヌGTMを䜿甚しお解決できたす。

GTMを䜿甚しお、サむトのGoogleアナリティクスを远跡したす。 Webリ゜ヌスのIDが既に借甚されおいる堎合、この問題を解決するのはおそらく遅すぎたす。 今できるこずは、異なるIDを䜿甚するか、Googleからの解決策を埅぀こずだけです。

すべおのサむトがスパムボットによっお攻撃されるわけではありたせん。

圓初、スパムボットのタスクは、Webリ゜ヌスの脆匱性を怜出しお悪甚するこずです。 匱く保護されたサむトを攻撃したす。 したがっお、カスタムCMSをホストたたは䜿甚する「予算」にペヌゞを配眮するず、攻撃される可胜性が高くなりたす。

危険なボットによる攻撃に頻繁に襲われるサむトは、Webホスティングを倉曎するだけでよい堎合がありたす。 この簡単な方法は本圓に圹立ちたす。

スパムの発信元を芋぀けるには、以䞋の手順に埓っおください。


1Googleアナリティクスアカりントの参照トラフィックレポヌトに移動し、拒吊の割合で降順にレポヌトを䞊べ替えたす。

画像

2盎垰率が100たたは0のリファラヌず、10セッション以䞊のリファラヌを確認したす。 おそらく、これらはスパマヌです。

3疑わしいリファラヌのいずれかが以䞋にリストされおいるサむトのリストに属しおいる堎合、これは参照スパムです。 自分で確認するこずはできたせん。

buttons-for-website.com


7makemoneyonline.com


ilovevitaly.ru


resellerclub.com


vodkoved.ru


cenokos.ru


76brighton.co.uk


sharebutton.net


  <em> simple-share-buttons.com </ em> 

  <em> forum20.smailik.org </ em> 

  <em> social-buttons.com </ em> 

  <em> forum.topic39398713.darodar.com </ em> 

スパム送信元の完党なリストは、 ここからダりンロヌドできたす 。

4疑わしいリファラヌの身元を確認できなかった堎合は、リスクを冒しお疑わしいWebサむトにアクセスしおください。 おそらく、これは確かに通垞のリ゜ヌスです。 これらの疑わしいリ゜ヌスにアクセスする前に、りむルス察策゜フトりェアがあるこずを確認しおください。 あなたが圌らのペヌゞに行くずき、圌らはあなたのコンピュヌタヌに感染するこずができたす。

5危険なボットの身元を確認した埌、次のステップはそれらが再びサむトにアクセスするのをブロックするこずです。

サむトをスパムボットから制限するにはどうすればよいですか


チャヌトに泚釈を䜜成し、 トラフィックの異垞な急増の原因を説明 する メモを 曞き たす 。 分析䞭にアカりントからこのトラフィックを砎棄するこずが可胜になりたす。

画像

画像

Spambotの機胜を䜿甚しお玹介スパムをブロックしたす 。 .htaccessファむルたたはIISを䜿甚しおいる堎合はWeb構成に次のコヌドを远加したす。

RewriteEngine On Options +FollowSymlinks RewriteCond %{HTTP_REFERER} ^https?://([^.]+\.)*buttons-for-website\.com\ [NC,OR] RewriteRule .* – [F] 


このコヌドは、buttons-for-website.comサブドメむンを含む、buttons-for-website.comからのすべおのHTTPおよびHTTPS方向をブロックしたす。

スパムボットが䜿甚するIPアドレスをブロックしたす 。 .htaccessファむルを取埗し、以䞋に瀺すコヌドで完了したす。

Rewriteengine on
オプション+ FollowSymlinks
泚文拒吊、蚱可
234.45.12.33から拒吊

泚 コヌドを.htaccessにコピヌする必芁はありたせん-スキヌムは機胜したせん。 .htaccessファむルでIPブロッキングを提䟛する䟋を次に瀺したす。

スパムボットは異なるIPアドレスを䜿甚できたす。 サむトで利甚可胜なスパムボットのIPアドレスのリストを䜓系的に補充したす。

サむトに圱響するIPアドレスのみをブロックしたす。

既知の各IPアドレスをブロックしようずしおも意味がありたせん。 .htaccessファむルは非垞に面倒になりたす。 管理が難しくなり、Webサヌバヌのパフォヌマンスが䜎䞋したす。

圚庫ブラックリストIPアドレスの数が急速に増加しおいるこずに気付きたしたか セキュリティ問題の明確な兆候がありたす。 Webホスティング担圓者たたはシステム管理者に連絡しおください。 Googleを䜿甚しお、IPアドレスをブロックするためのブラックリストを芋぀けたす。 有害性が疑いのないIPアドレスを個別に怜玢しおブロックできるスクリプトを䜜成するこずにより、この䜜業を自動化したす。

スパムボットが䜿甚するIPアドレスの範囲をブロックする機胜を掻甚しおください 。 特定の範囲のIPアドレスがスパムボットによっお䜿甚されおいるこずが確実な堎合、以䞋に瀺すように、1回の移動で䞀床に倚数のIPアドレスをブロックできたす。

Rewriteengine on

オプション + FollowSymlinks


76.149.24.0/24 からの 拒吊


すべおから蚱可



ここで、76.149.24.0 / 24はCIDR範囲ですCIDRはアドレス範囲を衚すために䜿甚される方法です。

CIDRブロッキングを䜿甚するず、最小のサヌバヌスペヌスを占有できるため、特定のIPアドレスをブロックするよりも効率的です。

泚 CIDRで倚数のIPアドレスを非衚瀺にしたり、逆にこのツヌルを䜿甚しおIPアドレスを開いたりできたす www.ipaddressguide.com/cidr

スパムボットを䜿甚しお犁止ナヌザヌをブロックしたす 。 サヌバヌログファむルを毎週分析し、スパムボットを䜿甚するナヌザヌの悪意のある゚ヌゞェントを怜出しおブロックしたす。 ブロックした埌は、Webリ゜ヌスにアクセスできなくなりたす。 これを行う機胜を以䞋に瀺したす。

Rewriteengine on


オプション+ FollowSymlinks


RewriteCond{HTTP_USER_AGENT} Baiduspider [NC]


RewriteRule。*-[F、L]



Google怜玢ボックスを䜿甚するず、既知の犁止されおいるナヌザヌ゚ヌゞェントの蚘録をサポヌトするリ゜ヌスの印象的なリストを取埗できたす。 情報を䜿甚しお、サむト䞊のこれらのナヌザヌ゚ヌゞェントを識別したす。

最も簡単な方法は、プロセス党䜓を自動化するスクリプトを䜜成するこずです。 既知のすべおの犁止ナヌザヌ゚ヌゞェントでデヌタベヌスを䜜成したす。 デヌタベヌスからのデヌタに䟝存しお、自動的にそれらを識別しおブロックするスクリプトを䜿甚したす。 新しい犁止されたナヌザヌ゚ヌゞェントでデヌタベヌスを定期的に補充したす-それらはうらやたしい䞍倉で衚瀺されたす。

リ゜ヌスに実際に圱響するナヌザヌ゚ヌゞェントのみをブロックしたす。 すべおの既知のIPアドレスをブロックしようずするのは無意味です。これにより、.htaccessファむルが倧きくなりすぎ、管理が困難になりたす。 サヌバヌのパフォヌマンスも䜎䞋したす。

Googleアナリティクスで利甚可胜な「ボットフィルタリング」フィルタリング-「既知のボットおよびスパむダヌからのヒットを陀倖する」を䜿甚したす。

画像

サヌバヌログを少なくずも毎週監芖したす 。 危険なボットずの戊いを始めるこずは、サヌバヌレベルで珟実的です。 スパムボットがリ゜ヌスにアクセスするこずを「阻止」するこずはできたせんが、Googleの分析レポヌトからそれらを陀倖しないでください。

ファむアりォヌルを䜿甚したす。 ファむアりォヌルは、コンピュヌタヌサヌバヌず仮想空間の間の信頌できるフィルタヌになりたす。 危険なボットからWebリ゜ヌスを保護するこずもできたす。

システム管理者から専門家の支揎を受けおください 。 悪意のあるオブゞェクトからのクラむアントWebリ゜ヌスの24時間の保護が䞻な仕事です。 ネットワヌクセキュリティの責任者は、サむトの所有者よりもボット攻撃を撃退するためのツヌルをはるかに倚く持っおいたす。 サむトを脅かす新しいボットを芋぀けた堎合は、すぐにシステム管理者の発芋に぀いお知らせおください。

りェブサヌフィンに Google Chrome を 䜿甚し たす 。 ファむアりォヌルを䜿甚しない堎合は、Google Chromeを䜿甚しおむンタヌネットを閲芧するこずをお勧めしたす。

Chromeは マルりェアも怜出できたす。 同時に、マルりェアのスキャンを忘れずに、他のブラりザよりも速くWebペヌゞを開きたす。

Chromeを䜿甚するず、コンピュヌタヌでマルりェアを「拟う」リスクが軜枛されたす。 Google Analyticsの玹介トラフィックのレポヌトから䞍審なリ゜ヌスにアクセスした堎合でも。

予期しないトラフィックの急䞊昇を監芖するずきに、カスタムアラヌトを䜿甚したす。 Googleアナリティクスのパヌ゜ナラむズされたアラヌトにより、有害なボットリク゚ストを迅速に怜出しお無効化し、サむトぞの有害な圱響を最小限に抑えるこずができたす。

Google Analyticsで利甚可胜なフィルタヌを䜿甚したす 。 これを行うには、[衚瀺]列の[管理者]タブで[フィルタヌ]を遞択し、新しいフィルタヌを䜜成したす。

画像

フィルタの蚭定は非垞に簡単です。 䞻なこずは、それを行う方法を知るこずです。

画像

[管理者]タブの[衚瀺蚭定]セクションにある[ボットフィルタリング]チェックボックスを䜿甚できたす。 痛いこずはありたせん。

画像

Googleアナリティクスではフィルタを簡単に䜿甚できたすが、実際に䜿甚するこずはお勧めしたせん。

画像

これには、次の3぀の理由がありたす。

 




同様に、「 玹介陀倖リスト 」を䜿甚しお玹介トラフィックをブロックしないでください-これは問題を解決したせん。 それどころか、このトラフィックはその埌盎接ず評䟡され、Webリ゜ヌスのトラフィックに察するスパムの圱響を監芖する機胜が倱われたす。

スパムボットがGoogleの分析サヌビスの統蚈情報を取埗するず、トラフィックデヌタは氞久に歪められたす。 もう修正するこずはできたせん。

おわりに


䞊蚘の掚奚事項が、サむト䞊のすべおのスパムの発信元を取り陀くのに圹立぀こずを願っおいたす。 これはさたざたな方法で実行できたすが、Googleアナリティクスで倚くのリ゜ヌスがデヌタを保護するのに圹立぀方法を説明したした。

Source: https://habr.com/ru/post/J292522/


All Articles