SEO初心者がまずやるSEO対策1/インデックス確認
WEBサイトを構築しコンテンツ公開したら、次に取り組みたいSEO対策としてインデックス(index / 登録)状況を確認する作業が挙げられます。自社で運用しているWEBサイトのインデックス状況を認識することで、WEBサイトやページが抱えている課題が浮き彫りになり、次に実行するべきアクションがみえてきます。
インデックス確認時には、いくつかチェックポイントがありますので、本記事を読んで把握しておいてください。さらに、まったくインデックスされない場合はサイトやページの改善が必要です。インデックスされない原因を突き止めて、問題を解決してください。
インデックスされているか調べる方法
インデックスされているかどうかを確認するためには、主に2つの方法があります。
- 方法1:Googleサーチコンソールで確認する
- 方法2:Google検索で確認する
方法1:Googleサーチコンソールで確認する
Google Search Console(グーグルサーチコンソール / Googleサーチコンソール) と呼ばれる、WEBサイトを管理するツールを利用することで、インデックス状況をチェックできます。GoogleサーチコンソールはGoogle社が提供するアクセス解析ツールなので、信頼性と機能性が高く、インデックス状況を詳しく調べたいときに活躍します。
インデックスを確認するための機能としては、主に下記のようなものがあります。
- URL検査
- ページのインデックス登録
そもそも、まだGoogleサーチコンソールを利用していない場合は、まずはWEBサイトをGoogleサーチコンソールに登録してください。
関連記事:Google Search Consoleとは?グーグルサーチコンソールの導入方法と使い方を解説
URL検査
URL検査では、ページ単位で詳しいインデックス状況を確認できます。例えば、インデックスされているかどうかだけではなく、下記のような項目も合わせてチェックできます。
- Google botにクロールされているか否か
- クロールされたHTML情報
- モバイル対応しているか否か
- パンくずリストといった、構造化データの情報
ページのインデックス登録
ページのインデックス登録では、サイト全体のインデックス状況を確認できます。具体的には、下記のようなことがわかります。
- サイト全体のうち何ページがインデックスされているか
- 何ページがインデックスされていないか
- インデックスされていない理由
方法2:Google検索で確認する
Google検索を利用することで、誰でも簡単にインデックス状況を確認できます。Google検索ボックスに下記を入力して検索すると、サイトURL以下でインデックスされているページの一覧が検索結果として表示されます。
- site:(※「サイトやページのURL」を入力する)
結果表示されたページは、Googleのデータベースにインデックスされているということになります。
インデックス確認時のチェックポイント
インデックス状況を確認する際は、下記のチェックポイントを抑えてください。
- サイト全体のインデックス状況を確認する
- ページのインデックス状況を確認する
- クロールされているか確認する
サイト全体のインデックス状況を確認する
公開したページのうち、全体の何割程度のページがインデックスされているのか、といったことを確認してください。インデックスされたページの数が極端に少ない場合は、WEBサイトが何かしらの問題を抱えている可能性があります。
ページのインデックス状況を確認する
公開したページ単位で、インデックス状況を詳しく確認してください。インデックスされていたとしても、ページが課題を抱えているケースがあります。例えば、「インデックスされているものの、モバイル非対応の仕様になっている」場合は改修する必要があります。
クロールされているか確認する
インデックスされていないことが判明した場合は、そもそも公開したページがクロールされているか確認してください。
ページがGoogleにインデックスされる工程として、まずはGoogleが開発したGooglebotと呼ばれるクローラーがページをチェックします。このときのチェック内容を基に、インデックスされるか否かをGoogleのシステムが検討します。そもそもクロールされていない場合は、Googleにページを認識されていない状態であることを意味します。
インデックスを確認すべき理由と利点
インデックス状況の確認をすると、下記のような利点があります。
- サイト構造に問題がないかチェックできる
- ページのコンテンツ品質に問題がないかチェックできる
- サイトやページに対するGoogleの評価を推察できる
- サイト全体のインデックス数を把握できる
- インデックスされないときの原因
WEBサイトを更新し続けて、より適切な情報を提供していくことが大切です。そのためには、新規記事の作成や既存記事の更新作業が必要です。インデックス状況の確認は、こうした「なにを作ればよいのか」「なにを修正すればよいのか」といった疑問に対する一助になります。
サイト構造に問題がないかチェックできる
インデックスを確認することで、サイト構造に問題があるか否かが判断できます。例えば、公開記事を増やしているにも関わらず、インデックスされるページの数が少ない場合は、サイトの構造に問題がある可能性があります。
ここでいうサイト構造とは、ディレクトリ構造と呼ばれるサイト階層のことです。サイト構造が不適切だと、Googlebotがサイトの全体像を認識しづらくなります。サイト構造は、極力シンプルにしてわかりやすく構築してください。
ページのコンテンツ品質に問題がないかチェックできる
インデックスを確認すると、ページのコンテンツ品質に問題がないかを確認できます。通常、Googleは低品質の記事を「インデックスする価値が低いコンテンツ」と判断します。さらに、WEBサイト内に低品質の記事が増えていくと、そのサイト自体の評価が落ちて、新規記事がインデックスされにくくなるという悪循環に陥りますので注意してください。
サイトやページに対するGoogleの評価を推察できる
ページ公開後、すばやくインデックスされた場合は、GoogleがWEBサイトやページの品質を高く評価している可能性があります。逆になかなかインデックスが進まないと、「インデックスする優先度が低いサイトやページ」という評価を下されている可能性があります。
インデックスされないときの原因と対処方法
ページがインデックスされない原因は、主に下記のとおりです。
- WEBサイトがGoogleに認知されていない
- コンテンツ品質が低い
- カニバリゼーションを起こしている
- Googleが読み込めない技術を利用している
- インデックスをブロックする指示を出している
- ドメインがGoogleにペナルティを受けている
- インデックスされるまでに一定の時間が必要
WEBサイトがGoogleに認知されていない
立ち上げて間もないWEBサイトは、Googleに認知されていない状態です。Googleから見ると知らない存在なので、良くも悪くも評価がありません。こうしたとき、GoogleにWEBサイトを認知させる方法として下記のような手段があります。
- サイトマップを送る
- クロールリクエストを出す
- 被リンクを獲得する
まずは、Googleにサイトマップを送信してサイトの存在を認知させてください。サイトマップは、Googleサーチコンソールで送信できます。
さらに、Googleサーチコンソール内のURL検査を利用してGooglebotにクロール申請を出せます。新規記事を作成したときに申請を出すことで、Googleにその存在を認知させることが可能です。ただし、実際にクロールしてくれるかどうかはGoogleが判断します。必ずクロールしてくれるわけではないということを把握しておいてください。
関連記事:サーチコンソールのURL検査ツールを使いこなす!SEO対策に欠かせないインデックス登録を促進させる方法をわかりやすく解説
このほか、GoogleにWEBサイトを認知させるための手段としては、良質なコンテンツを作り続けることが挙げられます。そうすると、自ずと被リンクを得る機会が増えるとともに、徐々にGoogleがサイトを認知していってインデックスされやすくなります。
コンテンツ品質が低い
コンテンツ品質が低いページは、インデックスされにくい傾向にあります。品質が低いページとは、サイト訪問者にとって役に立たないページのことなのですが、具体的には下記のような特徴を持ちます。
- コンテンツとしてニーズがない
- インデックス済みの他サイト記事をコピーしている
- 話題を詰め込みすぎて、なにを伝えたいのかわからない
- テキストの文法が不適切で、なにを説明したいのかわからない
- テーマに対して、コンテンツ内容が薄すぎる
- 過剰にデザインされていてテキストの文字が見えづらい
良質なコンテンツであるにも関わらずインデックスされない場合は、Googlebotの仕様を考慮して作成されていない可能性が高いです。ページをインデックスさせるためには、サイト訪問者が記事を閲覧するように、Googlebotでも読めるコンテンツに仕上げてください。
コンテンツ作りに慣れていなければ、Google検索セントラル(旧・Googleウェブマスター) を参考のうえで、作業を進めてください。
カニバリゼーションを起こしている
WEBサイト内でカニバリゼーション(Cannibalization)を起こすと、インデックスされにくくなる要因になります。そもそもカニバリゼーションとは、直訳すると共食いという意味を持つ英単語です。転じて、WEBサイト内で同一キーワードをテーマにしたページが複数あるときに、キーワードが重複することでページ間で競合してしまう現象を指します。
このようなとき、Googleとしてはどの記事を優先してインデックスすればよいのか迷ってしまいます。結果として、記事作成者の狙いと異なるページが優先的にインデックスされ、記事作成者が重視していたページのインデックスが大幅に遅れるといった事故が多々起こります。
カニバリゼーションを起こしていることがわかり、なおかつ重大な問題であるならば、下記のような対策を検討してください。
- ページ間の重複要素を統合する
- ページ自体を統合する
- お互いのページを内部リンクで結ぶ
Googleが読み込めない技術を利用している
Googleには、インデックス登録できるファイル形式とインデックスできないファイル形式があります。そもそもWEBサイトとは、サーバー上に置かれたファイルやフォルダの組み合わせで構成されたものです。ここで使われているファイル形式がGoogleに読み込まれないものであるとインデックスされません。インデックスされるファイル形式とは、下記のようなものです。
- テキスト(.txt、.text、その他のファイル拡張子)。以下の一般的なプログラミング言語のソースコードもこれに含まれます。
- Basic ソースコード(.bas)
- C、C++ ソースコード(.c、.cc、.cpp、.cxx、.h、.hpp)
- C# ソースコード(.cs)
- Java ソースコード(.java)
- Perl ソースコード(.pl)
- Python ソースコード(.py)
引用:Googleによるインデックス登録が可能なファイル形式
インデックスできるファイル形式の詳細は、Google検索セントラルのGoogleによるインデックス登録が可能なファイル形式 で確認できます。
インデックスをブロックする指示を出している
Googleのインデックスをブロックする指示があるのですが、誤ってこの指示を出しているとページがインデックスされません。インデックスをブロックする指示は、主に2つあります。
- robots.txt
- noindex(ノーインデックス)
前者は、クロールを拒否する指示を記述したテキストファイルで、通常はWEBサイトが設置されているルートディレクトリに設置されています。後者は、HTML言語で使われるもので、インデックスを拒否する値です。いずれかが設定されている場合、基本的にはページがインデックスされなくなりますので注意してください。
関連記事:robots.txtとは?設定する目的や具体的な書き方を解説
ドメインがGoogleにペナルティを受けている
ドメインとは、WEBサイトの場所を示す住所のようなものなのですが、過去にGoogleのポリシーに対して重大な違反を犯したことがあると、ドメインがペナルティを受けている可能性があります。
とくに、Google検索セントラルのGoogleウェブ検索のスパムに関するポリシー に該当する違反をしていると注意が必要です。場合によっては、いくら高品質のコンテンツを作成しても、一切インデックスされないといった可能性もあります。
ドメインがペナルティを受けているケースは2パターンあります。
- 過去に自社や自身が違反行為をしてペナルティを受けている
- 取得した中古ドメインの前の持ち主が違反行為をしてペナルティを受けている
一般的にWEBサイト運用の初心者が中古ドメインを利用するケースは少数派です。ただし中古ドメインを購入したつもりがなくても 新規取得したドメインが実は中古ドメインだったというケースは度々あります。不安であれば、Wayback Machine といったツールを利用してドメインの運用履歴をチェックしてみてください。
関連記事:Wayback Machine(ウェイバックマシン)とは
もしドメインがGoogleにペナルティを受けていると判明したら、ドメインの変更を検討してください。
インデックスされるまでに一定の時間が必要
新規サイトに限らず、そもそもインデックスされるまでに一定の時間を要します。はやければ1日以内にインデックスされることもあれば、遅いと1ヶ月以上の時間がかかることもあります。さまざまな対策を模索したにも関わらずインデックスされない場合は、しばらく時間を置いてみてください。
インデックスしたくない場合の対処方法
WEBサイトには、インデックスするべきでないページもあります。例えば、サイトマップを公開している場合やコミュニティといったページが挙げられます。さらに、低品質のページだが残しておきたいといったケースもあります。
このように公開しているもののインデックスしたくないページがある場合、下記の方法でインデックスを避けることが可能です。
- noindexでページ指定する
- txtでクロールをブロックする
ただし、いずれの場合でも必ずインデックスを回避できるとは限りませんので注意してください。
noindexでページ指定する
noindex(ノーインデックス)とは、ページのインデックスをしないように指示するHTML言語のタグです。一般的には、インデックスを避けたい際はnoindexが利用されます。
noindexをHTMLに直接記述する場合は、HTMLの<header></header>の間に下記のように書き込みます。
- <meta name=”robots” content=”noindex” />
関連記事:noindexとは?nofollowとの違いと活用する方法を解説
robots.txtでクロールをブロックする
robots.txtとは、Googlebotにアクセスやクロールを許可するかどうかを指示する、WEBサイトが設置してあるサーバー上のルートディレクトリと呼ばれる階層に置かれるテキストファイルです。
robots.txtを利用することで、Googlebotのクロールをブロックできます。ただし、こちらはインデックスを制御する指示ではありませんので注意が必要です。
関連記事:robots.txtとは?設定する目的や具体的な書き方を解説
インデックス確認時のよくある質問
インデックス確認時のよくある質問と回答をまとめています。
Q:そもそもインデックスとは何のことですか?
Answer)インデックスとは、WEBサイトやページ情報がGoogleのデータベースに登録されることです。インデックス登録されたWEBサイトやページは、Google検索エンジンの検索結果に掲載されます。このときの検索順位は、WEBサイトやページに対するGoogleの評価で決まります。
>>https://www.switchitmaker2.com/wordpress/seo/about-index/
Q:なぜインデックスされることが重要なのですか?
Answer)インデックスは、アクセスの流入経路の確保に直結するため重要視されています。通常、WEBサイトを運営する目的として集客が挙げられます。Google検索エンジンは世界中の生活者に利用されています。WEBサイトやページがインデックスされることで、その膨大なユーザーを自サイトに呼び込めるチャンスが生まれます。
Q:簡単にインデックスを確認する方法はありますか?
Answer)Google検索エンジンで下記のようにURLを検索すると、該当URLやURL以下の階層でインデックスされているページが検索結果に表示されます。
- site:(※「サイトやページのURL」を入力する)
例えば、東京SEOメーカーのインデックス状況をチェックするためには、下記のように検索します。
- site:https://www.switchitmaker2.com/wordpress/
Q:インデックスに必要な時間はどの程度ですか?
Answer)新しいページがインデックスされるために必要な時間は決まっていません。数時間でインデックスされることもあれば数ヶ月を要する場合もあります。
Q:インデックスが遅いのですが、はやくするコツはありますか?
Answer)下記のようなページは、はやくインデックスされる傾向にあります。
- 評価が高いドメインの新規ページ
- 高品質コンテンツと評価される新規ページ
そのため、インデックスを促す施策としては、高品質の記事を作り続けてドメインの評価を上げていくという方法が挙げられます。
Q:インデックス数とは何のことですか?
Answer)インデックス数とは、サイト内でインデックスされたページの数のことです。ただし、インデックス数が多いほど、サイトの評価につながるというものでもありません。サイトの評価を高めるためには、高品質のコンテンツがどの程度インデックスされているかが大切です。
>>https://www.switchitmaker2.com/wordpress/seo/about-index/
Q:インデックスカバレッジとは何のことですか?
Answer)インデックスカバレッジとは、サイト内のインデックス状況をチェックできるGoogleサーチコンソールの機能を指します。もともとはGoogleサーチコンソールのメニューに使われていた単語なのですが、2023年現在では、Googleサーチコンソール内で「カバレッジ」という単語が利用されていません。
>>https://www.switchitmaker2.com/wordpress/seo/index-coverage/
まとめ
インデックス状況は、WEBサイトやページがGoogle検索エンジンに掲載されるか否かの分かれ道になります。効率的にWEBサイトのアクセスを集めるためには、SEO対策をしてインデックス登録を促すことが大切です。そのため、WEBサイトの運用を開始したら、まずはインデックス状況を把握する癖をつけてください。もし、インデックスされない状況が続いたら、インデックスされない原因を突き止めて改修が必要です。