このページでは、almaarea.com(以下「アルマエリア」といいます)の管理人が気になった単語について説明した用語集の中から「インデックス」についての解説を試みています。
「インデックス」以外にも、アルマエリアの説明や内容について、意味の分かり難い言葉がありましたら、Helpページ内の用語集をお試しいただければ幸いです。
インデックス
インデックスとは、英字でindexと表記し、直訳すると、索引や見出し、目次などを意味する言葉です。
その特性上、様々な場面で『インデックス』という名称で呼ばれる言葉を耳にすることがあると思います。
例えば、株式市場においてインデックスと言えば、株価の動きを示す指標である日経平均株価や、TOPIXなどの事を意味します。
また、検索エンジンがホームページを巡回した際に、そのページを自身のデータベースに記録することを『インデックス』と呼び、『インデックス』されることで、始めて、その検索エンジンを使用して、『インデックス』されたページを検索結果に表示することができるようになります。
それから、多くのホームページのトップページは、"index.htm"または"index.html"という名前のファイルで作成されています。
これもインデックス……すなわち、そのホームページの見出し……という意味で用いられています。
ホームページにおけるインデックスの意義
今日のインターネット環境において、検索エンジンを利用することなく、広大な情報網に成長したインターネットの世界から目的の情報を見つけ出すのはとても難しいことです。
言い換えれば、検索エンジンで検索することで、目的の情報を見付けて、その情報に目を通すことで、私たちはインターネットを利用していると言っても過言ではないでしょう。
しかし、それは裏返すと、どんなに素晴らしい情報が掲載されたホームページであっても、検索エンジンに登録され、検索結果の上位に表示されていない限り、知り得る術がない……ということに他なりません。
そのため、多くのホームページでは、いかに検索エンジンに自分のホームページを登録してもらおうかと施策を練っています。
検索エンジンに自分のホームページを登録してもらうために行う施策のことを総称して、SEOと呼び、検索エンジンに自分のホームページが登録されることを『インデックス』されたと言います。
『インデックス』されない限り、検索エンジンの検索結果に自分のホームページが表示されることはありません。
上位表示とインデックスの関係
しかし、インデックスされただけでは、検索エンジンの検索結果に表示される様になっただけで、検索エンジンの検索結果で『上位表示できるようになった』わけではありません。
検索エンジンにインデックスされるということは、多くの人に自分のホームページを見に来てもらうための始まりに過ぎないのです。
自分のホームページのタイトル(題名)を検索エンジンで検索した際、検索結果で一番最初に表示されているでしょうか?
もしも一番最初に表示されている様であれば、検索エンジンは、貴方のホームページが、数多くのホームページの中で、もっともタイトル(題名)に関連付けられたホームページだと認識している証明になります。
残念ながら、自分のホームページよりも、他のホームページが、より上位に表示されているのであれば、その原因を考え、自分のホームページが上位に表示される様に改良を加えることで、徐々に表示順位を高めることができるでしょう。
必ずしも上位表示を目指す必要はありませんが、検索結果に上位表示されるということは、更に多くの集客を期待できるということです。
これがどれほど大きな意味を持つのか……管理者の方々は良くご存知でしょう。
頻繁に増減するインデックス
しかし、現状ではインデックスされたことを手放しで喜んではいられないかもしれません。
インデックスされてから長い期間が経ったある日、当然、自分のホームページが検索エンジンの検索結果から消えてしまった……なんて体験をした方もいらっしゃるのではないでしょうか?
理由は様々ですが、インデックスは一度登録されたら消えない……というものではありません。
いくつかの理由により、頻繁に登録と削除が繰り返されていると考えられています。
また、インデックスが削除されていなかったとしても、あまりに長い間、自分のホームページの更新を休んでしまうと、検索結果での表示順位が下がってしまい、検索結果に表示されなくなってしまったと感じることがあります。この場合、適宜の更新を行うことで、再び、検索結果に表示される様になるのが一般的です。
しかし、次のいずれかの場合には、代表的な大手の検索エンジンはインデックスを削除する可能性があることを公表しています。
- 検索エンジンが定める基準に違反した場合
- クローラーやサーバに起因する情報の未収集による状態
- クローラー訪問時にサーバがダウンしていた為に情報が収集できなかった
- リクエストを出したがサーバ反応が遅くタイムアウトしたため情報が収集できなかった
- クローラーの問題により特定のページの情報が収集できなかった
- 何らかの理由により作成されたインデックスが適正に処理されなかった
- 対象となるページがサーバ上から削除されていた
- 対象となるページへのリンクが確認できず、情報の収集ができなかった
- 対象となるページの情報が以前の情報に比べて大幅に変更されていため、今回はインデックスの作成が見送られた
前者の検索エンジンが定める基準に違反した場合は、スパムの排除を目的として行われる様です。
検索エンジンからスパム行為と疑われる可能性のある行為を行っている場合には、直ちに該当箇所を適正な状態に修復し、更新してください。スパム行為を行っていないことが確認できなければ、再度、インデックスされるはずです。
後者のクローラーやサーバに起因する情報の未収集による状態は、何らかの原因による結果であり、偶発的な事故と言えなくもありません。その時、いくつかの悪条件が重なってしまい、結果としてインデックスを作成し、登録することができなかったと考えられます。
これにはサーバーのタイムアウトや、リンク設定の間違いによる存在しないページへのリンク、または、更新中であったページのクロールなどが含まれています。
これらは、削除されたのではなく、その時点での作成が行われなかったものと考えるべきです。そのため、日を改めてクローラーが来訪した際には、再び、インデックスされるものと考えられます。
以上の様な理由から、インデックスの数は絶えず変動しています。
自然とインデックスが増えることもあれば、逆に、ある時を境にして、どんどん減ってしまうこともあります。
インデックスが急激に減少する様な場合、検索エンジンの評価方法が変更になったことも考えられます。
まずは、検索エンジンのヘルプで確認する様にしましょう。
解決方法が掲載されているかもしれません。
ホームページのページ数とインデックス数の関係
一般的に、ホームページのページ数よりも、インデックスの数の方が少なくなる傾向にあります。
まず、大前提として、検索エンジンのクローラーは、リクエストされたホームページ内のすべてのページをインデックスすることを保証していません。
つまり、どんなに切望しても、必ずインデックスしてくれるわけではないということです。
それから、同じホームページの中で、非情に似通った内容が記載された、検索エンジンのクローラーにとって『重複したページ』と判断できるページがあると、両方のページをインデックスしてから、いずれかのページを削除することがあります。
これは私自身、経験があります。
その時は、meta記述の一つである"description"の表記が全てのページで一緒になっていたことが原因でした。
同様に、全く別のドメインで公開されているホームページであっても、掲載されている内容があまりに似通っていた場合、そのいずれか一つ。または、両方のホームページをインデックスから削除する場合がある様です。
これは同一内容での相互同時表示を目的とするスパム行為と考えられるためです。
いずれの理由にしても、検索エンジンによって積極的に削除されてしまったインデックスは、なかなか復旧しません。
場合によっては、改めて審査を申請し、検索エンジンの検索結果を意図的に歪めることを目的とするスパム行為が排除されたことが確認されるまで、インデックスに登録されるない……なんてことにもなりかねません。
新規のページをインデックスに登録するための情熱と同じくらいの熱意をもって、すでに登録されているページを更新し、情報を最新の状態に保つ様に努めることで、検索エンジンのクローラーから『管理不行き届き』と判断されない様にしたいものです。




