重複コンテンツ(コピーコンテンツ)とは?SEOにおける評価とコピペ率を確認する方法等を解説
Googleから重複コンテンツと判断されると、SEOに悪影響を与えます。サイト運営の妨げになることも多いので、コンテンツを作成するときに似た構成や文章にならないようにしっかり対策を取ることが大切です。
重複コンテンツとは
構成や文章がほぼ同じページのことを重複コンテンツといいます。サイト内に似たページが複数あるとSEOに悪影響を与えるため、Googleからの評価が落ちることがあります。最悪の場合、検索結果で順位が下がるため、運営者はサイト内で似たページが存在しないように記事を作成することが必要です。
重複コンテンツはサイト全体で30%以下に抑えてください。また、重複コンテンツで多数のURLが生成されている場合、クロールするURLも多くなる分時間を要するため、クローラビリティが下がります。これら重複ページがあるかないかは、google search consoleで発見ができます。重複ページがあった場合、正規ページURLに統一する必要があります。
コピーコンテンツとは
コピーコンテンツとは、他のコンテンツと内容が全く同じもしくは似通っているコンテンツのことを指します。コンテンツ作成の際には、少なからず他のコンテンツを参考にする事が多いため、どうしても内容が似通ってしまうことはあります。
しかし、全く同じ内容に少し手を加えただけコンテンツや文章や画像をそのままコピーするなどはコピーコンテンツとして判断されてしまいます。コピーコンテンツは、Googleからのペナルティを受ける可能性が高いため、知らず知らずのうちにコピーコンテンツになってしまっていないかを確認することが重要です。重複コンテンツは、狙ってないのに同じような要素で構成されてしまったページコンテンツを指すのに対して、コピーコンテンツは、少なからず他を模倣した結果コピー率が高くなってしまったコンテンツと言えます。
コピーコンテンツに対するGoogleの評価
Googleはユーザーの利便性を第一に考えています。そのため、ユーザーが検索したキーワードに沿ったコンテンツを表示させるようにしています。ユーザーニーズに沿った内容であることはもちろん、コンテンツのオリジナリティや質も評価するようになりました。特に2011年に行われたパンダアップデートにより、質の低いコンテンツやユーザーに価値を与えないコンテンツが厳しく評価されるようになりました。
検索エンジンの、コピーコンテンツを判別するアルゴリズムは日々進化しています。そのため、コピーコンテンツのようなオリジナリティがなくコンテンツの質が低いものは評価されないようになっています。
コピーコンテンツがSEOに与える弊害
現在のアルゴリズムでは、コンテンツの質が重要視されるようになったため、検索順位上位を狙って他のコンテンツをコピーしたり、故意にページを増やす行為などはコンテンツの質を下げてしまいます。コピーコンテンツがSEOに与える弊害としては、次の3つが挙げられます。
- 検索順位が下がる
- 検索結果に表示されない
- 被リンク評価が分散される
ここでは、Googleからのペナルティを受けた場合の。コピーコンテンツのSEOへの弊害を解説していきます。
検索順位が下がる
Googleからの評価を下げてしまうことで、検索順位が下がってしまいます。先にオリジナルコンテンツを作っていたとしても、あとから更にもっと分かりやすく情報を盛り込んだコンテンツを作られてしまうと、Googleは後から作られたより有益なコンテンツを評価します。
このように、オリジナルで作った場合でもあとからコピーコンテンツして判断され、順位が下がることもあります。そのため、コンテンツを定期的に見直し情報の追記やアップデートなどを行いながらリライトをしていくことが重要です。
検索結果に表示されない
Googleからコピーコンテンツと判断されると、検索結果に表示されなくなります。Googleのクローラーがページの内容を評価し、同じようなコンテンツがあった場合には評価が一番高いコンテンツのみを残して検索結果に表示させます。
検索結果に似たコンテンツを複数同時に表示させないことで、ユーザービリティを高めているため、質が低く重複しているコンテンツは検索結果に表示されない仕組みとなっているのです。
検索順位が下がるのと同じように、検索結果に表示されなければそもそもユーザーにコンテンツを見てもらうことができません。
被リンク評価が分散される
重複しているページがあった場合、被リンク評価が分散される可能性があります。1つのページについている評価が100だとすると、重複するコンテンツがあると50・50と2つのページに評価が分散されるということです。
ページの評価は検索順位に大きく影響するため、同じようなコンテンツに評価が分散されてしまうと、そのページの本来の評価が下がってしまうことになります。検索エンジンからの正しい評価を受けることできなくなると、検索順位も下がってしまうため適切に処理する必要があります。
重複コンテンツになる6つの事例
サイト内に似た内容のコンテンツがあると検索エンジンの評価に影響が出ます。該当する事例は、次のとおりです。
2. 他サイトにコンテンツを提供した
3. 複数のURLが存在している
4. 勝手にコンテンツを掲載された
5. 動的URLで生成されている
6. URL表記が統一されていない
サイト内に同じページがある
サイト運営するなかで多くのコンテンツを作成します。ときには、意図せず内容が同じコンテンツを作成してしまうこともあるかもしれません。このような場合、重複コンテンツと判断されるのでサイト全体の評価が下がることがあります。意外と見落としがちですが、他社サイトにも重複するページがないか調べることが大切です。
他サイトにコンテンツを提供した
自社サイトに掲載するコンテンツを他社サイトに提供する場合も、重複コンテンツに該当します。他社に記事を提供するのはシンジケーションと呼ばれる手法で、第三者のサイトに記事を提供して掲載してもらうことができます。集客力が高い大手メディアに記事を掲載してもらえば、認知度の拡大や集客の向上が見込めます。
複数のURLが存在している
スマホから情報を検索するユーザーが増えているため、PCとスマホ向けにそれぞれコンテンツを作成する運営者も多いです。PCとスマホを分けてコンテンツを作成すると、複数のURLが乱立することになります。このような場合、検索エンジンから重複コンテンツになるのでサイト運営に悪影響が出ることがあります。
勝手にコンテンツを掲載された
自社サイトのコンテンツが勝手に他社サイトに掲載された場合、重複コンテンツと判断されます。許可なく記事をコピーされており、運営側が知らないうちに重複コンテンツになっていることがあります。第三者の行動は制限できないため、記事の盗用やコピーを見つけた場合は早急に対処しなければいけません。
動的URLで生成されている
動的なURL表記で生成されている場合、SEOに影響が出ることがあるので注意しましょう。動的URLとは、ユーザーの要求に応じて都度生成されるURLのことです。Gooleから質の低いサイトと評価されるので、静的URLの導入を検討しましょう。
URL表記が統一されていない
コンテンツのURL表記が統一されていない場合も要注意です。URL表記が統一されていないと判断されるのは、「index.html」や「www」の有無が統一されていないといったケースです。URL表記に統一感を持たせるために、代表的なURLを決めるなどの対策が必要になります。
参考:ドメインやURL正規化の方法(リダイレクトやcanonicalカノニカル設定)と期待できるSEO効果を解説
重複コンテンツの対策をおこなうべき3つの理由
検索エンジンに影響を与える重複コンテンツは、サイト全体の評価を低下させる要因になるのでしっかり対策を取ることが必要になります。
主な理由は、次のとおりです。
- 検索結果に表示されない場合がある
- 被リンクの評価を正しく受けられない
- ペナルティの対象となる恐れがある
検索結果に表示されない場合がある
Googleはランダムにコンテンツを表示させているように思えますが、アルゴリズムによりサイトをランキング評価して検索結果に表示させるページを決めています。検索エンジンがサイトをランキングしてページを表示させるのは、ユーザーのニーズに応えるためです。
似た内容のページが検索結果の上位を占めると、Googleの利便性が下がります。結果的にGoogleの検索エンジンを利用するユーザーが減るので、ユーザーの利用率を上げるために重複コンテンツはなるべく避けて表示させようとします。
また、Googleから重複コンテンツや類似ページと判断されるとページの評価が下がります。最終的に検索結果で上位表示されないので、ユーザーの流入も増えません。サイト運営に悪影響を及ぼすので注意してコンテンツ作成をしましょう。
被リンクの評価を正しく受けられない
本来であれば高評価を受けられた被リンクでも、サイト内に似たページがあることで評価が分散され検索エンジンの評価が下がることがあります。
Googleから正しい評価を受けられないコンテンツは、上位表示の妨げになるので要注意です。重複コンテンツにより評価が分散しないように運営側がしっかり対策をおこなうことが必要になります。
ペナルティの対象となる恐れがある
SEO対策として上位表示されたページを参考にして、コンテンツを作成する運営者も少なくありません。検索結果で上位表示されたページを参考にするのは問題ありませんが、構成や内容に似た部分が多いと重複コンテンツと判断されてしまいます。
余程のことがない限り、Googleからペナルティが課されることはありませんが、重複コンテンツが全体の30%以上に増えるとペナルティの可能性が高くなっていきます。サイト運営の妨げになるため、コンテンツ作成時は十分に注意することが必要です。
重複コンテンツを避けるために行うこと
意図しなくても、知らず知らずのうちに重複コンテンツがサイト内に存在する場合もあります。場合によっては、検索順位が下がる要因になるのでサイト運営者はしっかり対策を取ることが大切です。
主な重複コンテンツを避けるための対策は、次のとおりです。
- head内にnoindexタグを設置する
- 301リダイレクト処理をおこなう
- canonicalタグでURLを正規化する
- ドメインはトップレベルを使用する
- メインドメインをGoogleに伝える
- 類似するコンテンツをリライトする
- サイト内の重複コンテンツを削除する
参考:重複コンテンツの作成を避ける|Google検索セントラル
head内にnoindexタグを設置する
重複したページを見つけたら、Googlebotにインデックスさせたくないページにnoindexタグを設置しましょう。noindexタグを設置すればクローラーに認識されなくなります。
301リダイレクト処理をおこなう
特定ページにアクセスしたユーザーを別のページに転送させる方法のことを、301リダイレクト処理といいます。たとえば、サイトをリニューアルした場合、古いURLから新しいURLに自動的に転送することが可能です。コンテンツのURLを統一したいなら、301リダイレクト処理する方法も検討しましょう。
canonicalタグでURLを正規化する
自社サイト内に正規化させたいURLがある場合、canonicalタグを設置してGoogleのクローラーに伝える方法があります。評価が高い正規URLをクローラーに伝えられるので、コンテンツ自体の評価が下がることはありません。PCとスマホでコンテンツを分けている場合、インターネット上には複数のURLがある状態です。Googleの評価に影響を及ぼすため、複数のURLを統一させる必要があります。複数のURLを統一させたいなら、カノニカル設定をしましょう。
ドメインはトップレベルを使用する
海外に向けてサイトを構築している場合、可能な限り国別のトップレベルドメイン(日本でいえば.jp)を使用しましょう。トップレベルドメインとは、インターネットで使われるドメイン名の構成要素のことです。トップレベルドメインを適切に設定することで、異なるコンテンツであると判断されるようになります。
参考:多言語SEOにおける設計のポイントと多言語サイト制作時の注意点
メインドメインをGoogleに伝える
Google Search Consoleを使用すれば、利用中のメインドメインを検索エンジンに伝えられます。Googleクローラーに評価の高いコンテンツを優先的にクロールしてもらえるので、重複コンテンツ対策として有効です。複数のドメインがある場合は、メインドメインを検索エンジンに伝えましょう。
類似するコンテンツをリライトする
サイト内に類似するコンテンツがある場合、どちらかの記事をリライトするのもおすすめです。構成や記事内容を見直してリライすることで、重複コンテンツとして判断されにくくなります。ただし、リライトする記事は評価が低いものを選びましょう。評価の高い記事をリライトすると、評価が下がる場合があるので要注意です。
サイト内の重複コンテンツを削除する
リライトしても似た内容になる場合は、コンテンツ自体を削除する方法もあります。コンテンツを削除すれば、重複コンテンツがなくなるためGoogleからの評価が下がることはありません。サイト全体の評価に影響が出ることもあるので、削除するコンテンツは十分に検討してから実行しましょう。
重複コンテンツの調べ方
重複コンテンツがあるか確認する方法は、次のとおりです。
- Google Search Consoleを活用する
- Google検索のコマンドを使う
- 検索エンジンで検索
- 無料のチェックツールを使用する
Google Search Consoleを活用する
重複コンテンツがあるか確認したい場合、Google Search Consoleが便利です。Google Search Consoleで調べる方法は、まず「セキュリティと手動による対策」から「手動による対策」を選択します。画面に「問題は検出されませんでした」と表示されれば、重複コンテンツはありません。
Google検索のコマンドを使う
コンテンツURLの末尾に「&filter=0」を付けて再検索すれば、意図的に隠されていたコンテンツを表示させることが可能です。検索結果で重複するコンテンツがあるか確認することができます。手軽に重複コンテンツを確認したい方に最適です。
検索エンジンで検索
Google検索では、32文字までの文章の完全一致検索をすることが可能です。コンテンツ内の文章の中で、確認したい文章をダブルクォーテーションマーク(“)囲んで検索します。検索結果に自社ではないページが上位表示された場合、コピーコンテンツである可能性が考えられます。
また、自社よりも上位に表示されているコンテンツのページ内で、さらに文章を検索することで他にも重複しているコンテンツがないかを確認することができます。
コピーコンテンツチェックツールを利用
ツールを活用することで、他のコンテンツとの類似度を判定してくれるためより高い精度でのチェックが可能です。文字数も検索エンジンでの検索とは違い、数千文字まで調べられるツールが多いので、コンテンツ全体を簡単にチェックできます。
また、チェックツールにはコンテンツ内のどの部分が一致しているかを自動で検出してくれるため、リライトの際にも便利です。コピーコンテンツのチェックを行う際には、ツールの利用がおすすめです。短時間で高性能なチェックを行うことができるため、ツールを有効活用しましょう。ここでは、おすすめのコピーコンテンツチェックツールを4つご紹介します。
影武者
影武者は、CROCO株式会社が提供する有料のコピペチェックツールです。有料ツールではありますが、月に10回までであれば無料で使用できます。
自然言語処理技術で、不正なコピペをチェックし自社サイトのテキストの無断転載・盗用もチェックすることができます。
有料なだけに精度が高いため、効果的なコンテンツ作成に役立てることができるおすすめツールです。
ツール名 | 影武者 |
URL | https://kagemusya.biz-samurai.com/ |
価格 | 無料 / 4,400円〜 |
Copy Content Detector
CopyContentDetectorは、株式会社ウェブサークルが運営する無料コピペチェックツールです。4000文字まで無料で診断することができ、短時間で高性能なコピペチェックができるのが特徴です。
独自のアルゴリズムにより、対象Webページとの類似度を判定できる上に、コピペされている部分が一瞬でわかるよう色分けされており、一目でコピペチェックの結果がわかるので、とてもつかいやすいツールです。
ツール名 | CopyContentDetector |
URL | https://ccd.cloud/ |
価格 | 無料 |
こぴらん
こぴらんは、登録不要の完全無料ツールです。4000文字までのチェックができ、文・類似数・リンクの3つの項目でコピペかどうかを判定してくれます。
こぴらんの最大の特徴はブックマークレット機能と呼ばれる機能で、リリースした後の記事など任意のページ内の文章を「範囲選択」するだけで観点にコピペチェックができます。
ツール名 | こぴらん |
URL | https://copyrun.net/ |
価格 | 無料 |
コピペルナー
コピペルナーは、株式会社アンクが提供するコピペ判定ソフトです。レポート・論文の「試験監督」用に作成されたツールで、610校以上の学校や官公庁、一般企業に導入されています。
レポート・論文以外にもWebページのコピーチェックができるので、コピーコンテンツチェックツールとしても役立ちます。また、目的に合わせてカスタマイズすることがき、チェックするページやキーワードを手動で設定することで、より精度の高いコピペチェックが可能になります。
ツール名 | コピペルナー |
URL | http://www.ank.co.jp/works/products/copypelna/Client/index.html |
価格 | 6,660円〜 |
コピーコンテンツの対処方法
他のコンテンツと内容が重複している、コピーコンテンツを見つけた場合は適切に対処する必要があります。適切な対処を行うには、ある程度対処方法を理解しておくことが重要です。
- コピーコンテンツを削除
- 301リダイレクトを設定
- canonicalタグを指定
- アノテーションを設定
- オリジナルコンテンツの設定
ここでは、コピーコンテンツの対処方法を詳しく解説します。
コピーコンテンツを削除
自社サイト内に重複している不要なコンテンツがある場合は、どちらかのコンテンツを削除するというのも方法の1つです。コンテンツを削除はしたくない場合は、headタグ内のmeta要素で「content=”noindex”」を指定する方法もあります。noindexタグを指定することで、ページが検索結果に表示されなくなります。
また、他社サイトから自社サイトのコンテンツをコピーされている場合には、そコンテンツを掲載するサイト運営者への削除の申し立てが必要です。対応してもらうことが難しく、アクセスを奪われている状況にはGoogleSearchConsoleから検索エンジンへ申し立てすることもできます。
301リダイレクトを設定
301リダイレクトとは、ユーザーや検索エンジンに対してページが別の場所に移動したことを知らせる設定のことを指します。301リダイレクトを設定することで、自動的に移動先のページが表示されるようになります。
自社サイト内でのコピーコンテンツ例にあったように、「www.」の有無で複数URLがあるケースや自動作成されたページが存在するケースに有効です。該当ページに一定のアクセスや被リンクがある場合は、単に削除するのももったいないため301リダイレクトの設定が効果的となります。
canonicalタグを指定
canonicalタグは「URL正規化タグ」とも呼ばれ、正しいURLを指定し重複したURLを統合することができます。URLを統合させることで、正しいURLをGoogleに認識させることができるのです。
たとえば、色違いや型番違いの製品を別のURLで販売しているケースや印刷用のコンテンツを用意しているケースなどに有効です。重複しそうなページ全ての<head>要素内に、正規化させたいURLを記述することでcanonicalタグを設定することができます。
コピーコンテンツや類似コンテンツがある場合には、canonicalタグを設定し検索エンジンにその中でも優先して評価してもらいたいURLを指定しておくことが重要です。
アノテーションを設定
アノテーションとは、同じ内容のコンテンツがデバイスごとに別々のページになっていることを検索エンジンに報告する方法を指します。スマートフォンとPCで別々のURLを設定している場合は、アノテーションの設定がおすすめです。
PC用ページにアノテーションの設定を行い、スマートフォン用ページにcanonicalタグによる正規化を行います。このように、アノテーションの設定を行うことで、評価の分散を防ぎPC用ページに評価を集中させることができます。
オリジナルコンテンツの設定
他者のコンテンツと内容が重複してしまっている場合は、オリジナルコンテンツの追記が効果的です。体験談や導入事例、第三者の声などを記載することで他社のコンテンツとは違うオリジナル要素を盛り込むことができます。
コンテンツ作成時にオリジナリティを意識することは重要ですが、自社コンテンツがオリジナルであっても後からコピーコンテンツになることはよくあります。そのため、コンテンツのチェックやリライトを定期的に行うことで、常に更新された情報を配信することが重要です。
単に言い回しや語尾を変えただけのリライトではなく、オリジナルコンテンツとして重み付けすることが大切です。
コンテンツの重複を避けるためのポイント
コンテンツの重複を避けるためには、ユーザーのニーズに沿った自社でしか提供できない有益な情報を盛り込むことが重要です。自社にしか提供できない価値をコンテンツに盛り込むことで、他社には真似されにくいオリジナリティのあるコンテンツになります。
同じように、他社のコンテンツと重複しないためにもオリジナリティを意識する必要があります。しかし、オリジナリティを求めるあまり自社の伝えたいことだけを盛り込んだユーザーにとって役に立たたないコンテンツでは意味がありません。
ユーザーや検索エンジンから評価されるような、ユーザーの意図を汲み取った質の高いコンテンツを作成することが、コンテンツの重複避けるためのポイントにもなります。
まとめ