2007年05月12日
Google の “補足結果” について
Googleで [site:http://(サイトドメイン).com/] なんて検索すると自分のサイトのインデックス状況が分かったりするんですが。
インデックスされている一覧を見ていくと後ろの方のページに“補足結果”という言葉がついているのがある。
補足結果っていうんだから、何か“足りない”ところを“補った”、“結果”なわけで、補足結果と表示されてしまったページは、
サイトの本筋からズレてしまっているのかもしれない。
世の中のSEO Geeks な諸兄は、これを“補足インデックス地獄” だとか、また補足インデックスから通常のインデックスになる事を“補足結果からの生還” とか呼んでいるみたい。
で、この“補足結果”って何なの?って思ったら、これが結構大変な事態みたい。
詳しくは、参照元のサイトをよく読んでもらいたいんですが、要約すると
(通常インデックスされているページよりも)コンテンツが少ない・複数ページの2ページ目以降・ タイトルにキーワードを埋め込み過ぎ・複製コンテンツだと、判断されているページで、 それらのページを通常のインデックスと隔離されてインデックスされている。
この為、検索結果では、(通常インデックスされているページよりも)下位に表示されるということ。
簡単に言えば、「お前さんのページは、“補足インデックス”に入っているから、“通常インデックス” の様に検索上位には、出てこないゼ」とGoogleにレッテルを貼られてしまったようなものですね。
・・・かなり、ヤバイ。いっその事、インデックスされてない方が、良かったなんて思うかもしれない。
(参照元サイト)
以下は、補足インデックスの確認方法と、補足インデックスの対処方法のまとめ。
赤いアクセサリでドレスアップ
|
ケース & バッグ
|
オーディオ & スピーカー
|
ワイヤレス
補足インデックスの確認方法
参照元サイトのWeb担編注にもあるんですが、Googleの検索フォームに
site:http://(調べたいサイトドメイン)/ *** -wbtnsmz
と入力して検索してみると、そのサイトの中で、補足インデックスに入っているページだけが、表示される。
これを通常の(***から後ろを省いた)結果と比較してみると、全インデックス中にいくつ補足結果になっているか、分かると思う。
補足インデックスから通常インデックスへの手順
補足インデックスされてしまったページを救済するには、どーしたらいいかって言うと、以下の11の手順で、 何とかなるかもって事らしいです。
ただ、この手順は、通常インデックスへ移行できた結果と、それまでの作業ログであって、 全てが必要な手順ではないかもしれないと言うこと。また、この手順をマスターしておけば、補足されないという保証は、全くもってない。
- XML形式のサイトマップを作成
- ページタイトルを個別化
- メタタグの説明属性を個別化
- 404ヘッダーを修正
- 合致データがなかったときの404エラーページを作成
- サイトマップファイルを作り直し
- robots.txtファイルを追加
- NOODPタグとNOYDIRタグを追加
- URLを短くて親しみやすいものに
- スパイダーにより多くのデータを見せるように
- ホームページのタイトルを変更
1は、検索エンジンに専用のサイトマップ(URLリスト)を設置してあげる方法。フリーソフトのWebsite Explorerなんかでも簡単に作成できるので、やっておいていいんじゃないでしょうか。
2のページタイトルの個別化は、意外と厄介。
よくあるのが、「サイト名 : ページタイトル」なんてして、タイトルの出だしが全部サイト名(または、同じキーワード)
だったりすることがあるんですが、これがあまり良くないみたいです。そのページを象徴したキーワードにしておくべきのようで、
もしサイト名を入れるなら、タイトルの後ろのほうにしたほうがいいのかも。
3は、メタタグのDescriptionに関すること。
ページタイトルと一緒で、そのページ個別のものにしておくのがいい。
4の404ヘッダーについて。
XREAなんかのレンタルサーバーを使っていると、存在しないページにリンクした時、レンタルサーバーの広告ページが表示されたりして、
そのページのレスポンスヘッダーが200(OK)を返したりすることがある。もし、存在しないページのリンクが多数あった場合、
それらの全てが同じページで、200を返してしまうのだから、これは複製コンテンツ、または、コピーページとみなされても仕方ない。
存在しないページは、存在しない(404)としっかり宣言してあげないといけないみたい。
5、4と同じですな。
6、5までの手順でサイトを修正したら、もう一度サイトマップを作ったって事みたい。
7、robot.txtなんて不要。全部インデックスしてくれって、思ってたらそうじゃないみたい。同じ内容の印刷用ページとか、 アンカーリンクのショッピングカートのページとか、URLパラメータが少し変わって、内容がほとんど同じページについては、 インデックスされないようにブロックしてあげないといけないみたい。
8は、オープンディレクトリの要約文を引用しないようにするタグの設置だそうですが、 もしオープンディレクトリにサイトが登録されているなら、また今後登録されるように申請予定なら、タグを追加しておいていいかも。
9、URLを短くする。実際は、PHPや、
CGIなんかで動的にページを生成していて、短いURLを使うのが難しい場合でも.htaccessファイルなんかを使って、
短いURLに変更できるなら、しておいた方がいいという事。
これは、かなり重要な作業のようで、サイト内のディレクトリ階層も考えて、URLを短くしてあげると、かなり大きな効果が期待できる様です。
10の手順で、参照元サイトでは、
「スパイダーの注意を引く特別なコードを加えて、100個以上の塊でスパイダーの目にとまるようにした」とあるが、具体的なコードは、不明。
ここに何か凄い秘密があるのかも。。
もうひとつの参照元サイトでは、「省略」としてしまっているが、多分重要なポイントなのでしょう。
11は、2の作業と一緒。個別のタイトルにしてあげればいい。
参照元サイトでは、これらの作業の9番目のあたりまで作業した時点で、 かなりの効果が現れたそうで、9番目以降の信憑性は、微妙。
やーなんか、久しぶりの更新で、かなりの長文を書いてしまいました。
っていうか、PageRank下がったの、なんかやなんですけどw。
そんなときは、「らいぶ寿司」でも聴いて和んでください。
- by rosso
- at 20:41


comments