不要なページの処理を間違えたことで、ページの価値が落ちることは珍しくありません。
SEOは検索順位だけの話ではなく、トータル的に価値のあるサイトにしようといった取り組みです。
価値が落ちるとは=順位の下降だけに留まらず、ユーザーにとって使いずらいサイトのことを指します
質の高いコンテンツを追加することだけが最適化ではなく、質の低いコンテンツを検索エンジンにクローリングさせないことも最適化の一つです。
noindex の記事中と同じ内容が出ますが、こちらではnoindex以外での対応方法もご紹介いたします。
クローラーは100%じゃないから最適化をすることでクローラーの手助けをしてあげましょう。
全体的な評価をあげるということは、低評価を減らすことでもある
不要なページに対して行うこと
なんで不要なのか?その理由によって対処法が異なります。- 404ページ: もう誰も訪れないページ・必要のないページ
- 301リダイレクト: 必要のない古いページで間違えてアクセスがあるかもしれない場合
- robots.txt :見るページとしてではなく、PG的に吐き出されてしまったものなど 存在はしていないと困るが、見られても価値のないページなど
404ページ
404ページとはコンテンツが無い、または間違えたURLを開いた時に見るページです。
ウェブページには、ページの状態を表すステータスがいくつかあります。その中で 404は「ページがみつかりません」といったステータスのことを指します。
404のステータスがあることによって、クローラー、見に来る人にとって「アクセスしたページは存在しない」ことを伝えることができます。 見た目404ページではなく、ステータスとして404が返ってきているページのことを指します。
ページ内に404ステータスを返すページのリンクがそれは単純にリンクが間違っているだけですのであれば直しましょう!
だったら不要なページは全て404でいいんじゃないですか?
基本は間違っていませんが、条件によっては好ましくない場合があります。リダイレクトについてご覧ください。
301・302リダイレクトは同内容のURL変更で使うべし
リダイレクトとは、例えば AというページにアクセスしたらBというページに強制的に飛ばされることを言います。
このようによく使われるリダイレクトのステータスとして301リダイレクトと302リダイレクトが存在します。
301と302の違い、- 301リダイレクトはAというページにアクセスしたらBというページに恒久的に飛ぶことを言います。
- 302リダイレクトは、期間は明確に決まっていませんが、いつかAというページにアクセスしたらBには飛ばすAが表示されますといった具合に戻す前提として使います。
301はずっとAからBへリダイレクト
302はいつかリダイレクトを外す前提
引っ越しを想像してください。
Aといった家からBへ引っ越しをしました。間違えてAの家に来たらBまでワープするようなものです(わかりづらかったらスイマセン)
302の場合は、AからBへワープする際に、いつかAにまた戻るよ!と伝えることができるということです。
ユーザーがURLを変えたことに迷わないためにも404ではなく、301を使ったほうが親切といったこともあるのです。
robots.txtを正しく使って効果ある命令を出す
Googleに対して、サイト上から直接命令を出せるファイルです。これは絶対ではないので希望だと思ってください。ファイルの設置方法
ドメイン直下で表示されるようにする正しい例 http://〇〇/robots.txt ダメな例: http://〇〇/△/robots.txt
不要なページの書き方
全ページの訪問を拒否する方法
User-agent: * Disallow: /
User-agent: *
クローラー(検索エンジン)を指定する記述です。
「*」は全てといった意味になります。特別理由がない場合は、「User-agent: *」を記載しましょう。
Disallow: /
Disallow=許可しないといった意味があります。
検索エンジンに来るな!と「/」適用する配下を指定します。
この場合、許可しない場所は /配下なので、全部のページを検索エンジンは来ないよと言った意味です。
例えば、http://〇〇/about/ 配下に来させたくない場合は下記になります。
User-agent: * Disallow: /about/
noindex
検索結果に出したくないときに使います。ページは存在することが前提ですので、厳密には不要なページではありません。 詳しくはこちらのnoindexをご覧ください。- 不要ページおまけ
- インデックスをさせないのであれば robots.txtではなくnoindexを使ってください。 あくまでもrobots.txtはnoindexではなく、クローリング時にこないでくれと言っているだけです。 結果、robots.txtに書かれていても外部からの多くのリンクなどで、ページ自体がインデックス(検索結果に表示)されていることは多々あります。
Q&A
いかがでしょうか?