シカゴで行われた前回の検索エンジン戦略会議で、重複したコンテンツに関する多くの質問がありました。 このようなコンテンツの操作には多くの微妙な点とボトルネック(私たちのミス)があることを認識しているため、いくつかの点を明確にしたいと思います。
Googleが元のコンテンツを重視するのはなぜですか?通常、ユーザーはリクエストに応じてさまざまなサイト(または記事)を選択したいと考えています。 リクエストを入力して、鎌の最初のページの異なるサイトに10個の同一の記事が表示された場合、失望はどうなるでしょうか。 そして、ウェブマスターは、example.com / contentredir?value = shorty-george = enのようなページがexample.com/en/shorty-george.htmよりも高い可能性があるという事実について、まだ私たちをscりました。
重複したコンテンツに対してGoogleは何をしますか?サイトのインデックス作成とランク付けのプロセスでは、元の情報を持つページを選択しようとします。 これらのフィルターは、サイトの記事に「通常」と「印刷用」の2つのオプションがあり、そのうちの1つがrobots.txtまたはnoindexによってブロックされていない場合、記事の1つのバージョンのみがインデックスに保存されます。 まれに、検索結果を操作する目的でサイトに重複したコンテンツがあることがわかった場合、鎌からそのようなサイトを除外できます。 ただし、コンテンツから重複したコンテンツを持つサイトを削除するのではなく、フィルタリングを処理することをお勧めします。 したがって、ほとんどの場合、サイトで発生する可能性のある最悪の事態は、鎌の「低い」場所です。
重複したテキストを配布する最良の方法は何ですか?-選択するテキストのコピー(つまり、通常または「プリンター用」など)をロボットに提供する代わりに。 robotsファイルを使用して不要なコピーをブロックする
-サイト構造を変更した場合は、301リダイレクトを使用します(.htaccessを使用)。
-/ page /または/ pageまたは/page/index.htmではなく、完全なリンクを使用します
-サブドメインではなくドメインを使用します。また、ランキング時に国の定義が積極的に使用されることを忘れないでください(つまり、ロシア語を話すユーザーは最初に.ruドメインなどが表示されます)
-RSSを慎重に使用し、記事をインポートするサイトがすべての記事のサイトにリンクしていることを常に確認してください
-サイトが「site.ru」と「
www.site.ru 」の両方で参照されている場合、インデックスに登録するサイトの正確なバージョンを指定します。
-ページ上のテキストの重複ブロックを最小限に抑えます。たとえば、各記事の下部または上部に複数の文でコンテンツのコピーなどの禁止事項を書いた場合、最良の解決策は、そのようなテキストを別のページに配置し、すべての記事にリンクすることです。
-リンクのいずれかをクリックして、ユーザーに空のテンプレートが表示される場合(たとえば、文字「I」の記事がなく、「I」へのリンクがある場合)、アルファベット順または国別での公開を避けます。 ユーザーはそのようなジョークを好まないため、ユーザーのために働いています。
-CMSを使用して、コンテンツの複製方法(印刷版、モバイル版など)をすべて見つけてください。
-「心配しないで、幸せに」サイトからコンテンツを複製したり盗んだりすることをあまり心配しないでください。Googleは原則として、こうした泥棒に問題なく対処します。 本当に「コピー機」を入手した場合は、
www.google.com / dmca.htmlに連絡してください。インデックスから削除するリクエストを送信します。
元の記事
http://googlewebmastercentral.blogspot.com/2006/12/deftly-dealing-with-duplicate-content.html記事のロシア語翻訳
http://blog.seotrade.ru/?p=12