Yahoo seo Google > Googlebot > Googlebotに新しいクロール方法が確認できる

Googlebotに新しいクロール方法が確認できる

Googleウェブマスターツール<クロールエラー>に、奇妙なURLを見つけた。Googleアルゴリズムに修正が加わり、それによってGooglebotに新しいクロール方法が確認できたのであろうか?
Googleウェブマスターツール(現在の)で見つけた奇妙な<クロールエラー>のとは、このような種類のものだ。
http://www.example.com/2010-9-25
未だかつて、このようなURLのウェブページをアップしたことは一度もない。それにも関わらず、Googleウェブマスターツールは「見つかりませんでした」と報告する。早速元を調査すると、リンク元ウェブページからhttp://www.example.com/2010-9-25へのリンクは存在しない!そこにあるのは、http://www.example.com/と “2010-9-25” のだけである。
これは、ある相互リンクサイトのウェブページであり、“2010-9-25” とは登録された日付であり、http://www.example.com/2010-9-25のアンカーテキストでハイパーリンクされているわけではない。ただ素でそう記述されているだけである。
ソースのHTML記述は以下の通りである。
<p><span class="○○">http://www.example.com/</span><span class="○○">2010-9-25</span><span class="○○"><a href="http://www.○○.co.jp/link/content.html">詳細を見る</a></span></p>
「詳細を見る」でアクセスできるウェブページにもhttp://www.example.com/と “2010-9-25” の記述があるが、そこからのリンクはGoogleウェブマスターツール「見つかりませんでした」のリンク元には表示されていない。
このURLへのリンク元はもう1ページあり、それも同一サイトの別ページからのものである。見ると、そこでの記述も先のウェブページと同様のソース記述で、<a href="~">でリンクがされているわけではない。実に興味深い事例ではないか!
では「詳細を見る」でアクセスできるウェブページには、どのようなソースのHTML記述があるか? それが下記である。
<p>http://www.example.com/</p><h3>サイトの概要</h3><p> “サイトの概要が記載されている” </p><h3>登録日</h3><p>2010-9-25</p>
この原因は容易に推測できた。リンク元として表示されるウェブページのGoogleキャッシュから「テキストのみのバージョン」を選択すると、下記のソースが見られる。
<p>http://www.example.com/2010-9-25<a href="http://www.○○.co.jp/link/content.html">詳細を見る</a></p>
見事に<span>タグ内のHTML記述が消され、消されることによってhttp://www.example.com/と “2010-9-25” の記述はhttp://www.example.com/2010-9-25となるわけである。
これが興味深いのは、このURLが「見つかりませんでした」とGoogleウェブマスターツールに表示されたのが今回初めてであることだ。登録日は任意で2010-9-25としたが、実際の年月日は2006年である。つまり長期期間このウェブページは存在していたにも関わらず、この「見つかりませんでした」の表示は初めてされたわけである。つまりは、これを「見つかりませんでした」と表示させるGooglebotの方法が生まれ、そのクロール方法はの修正によって生み出されたものであろうからだ。
それとも巷で言われているように、「5年以上経過したリンクでなければ評価されない」というものなのであろうか?まぁ、それは都市伝説のような気がするが…。(20日付記事「」を参照のこと。)
何れにせよ、ウェブサイトのチェックには「テキストのみのバージョン」を選択する必要があるようだ。
関連のseo記事
  1. (2011/10/29)
  2. (2012/07/13)

コメント

非公開コメント