Yahoo seo Google > インデックスのseo > “noindex”を記述したURLも「構造」の観点からインデックスされるのではないか?

“noindex”を記述したURLも「構造」の観点からインデックスされるのではないか?

“noindex”のアノテーションはGoogle検索されることを拒否するものにすぎないのではないか?
Yahoo seo Googleブログのタグつけ可否を調査していて、そう考えた。
コンテンツがある限り、“noindex”を記述したURLも「構造」の観点からインデックスされるのではないだろうか?
<URLの削除>を使用し「期限切れ」を迎えた旧フィーチャーフォン用URLが<データ ハイライター>でタグつけ可能なのかを調査していた。
実際は“canonical”を<head>に記述していた記事ページに関しては、相当数がタグつけ可能であった。
表示されるコンテンツは旧フィーチャーフォン用のコンテンツであったり、以前記述していた“canonical”タグによって正規化されたURLのコンテンツであったりした。
ここで思わず考え込んでしまったことがインデックスの意味である。
<データ ハイライター>でタグつけが可能でありながらも、ウェブ上でそのURLに関する情報を求めても表示されない。
つまりは<URLの削除>を使用し「期限切れ」を迎えたコンテンツは、現在記述されている“noindex”によってインデックスされていないと考えられるからである。
その事実から考えると、“noindex”はインデックスを防止するアノテーションというよりも、ウェブ検索されることを拒否するアノテーションと考えられないだろうか?
現に“noindex”を記述しながらもコンテンツは存在しているわけであり、だからこそ<データ ハイライター>でのタグつけが可能なのである。
Search Consoleヘルプの「」に以下の文章がある。
ページが Google 検索に表示されないようにするには、noindex メタ タグをページの HTML コードに挿入します。Googlebot はそのページを次にクロールしたときに noindex メタ タグを検出して、他のサイトがそのページにリンクしているかどうかにかかわらず、そのページを Google 検索の検索結果から完全に削除します。
「検索の検索結果から完全に削除します」の部分こそ私が考える“noindex”の意味と合致する。

ではここから考えたいのは、“noindex”を記述したコンテンツを、なぜGoogleはインデックスするのか?という点である。

前回記事「」で「」についた最新のバックリンクを画像で紹介した。
この際、旧フィーチャーフォン用と旧スマートフォン用のコメント投稿ページ、コメント閲覧ページ、トラックバック一覧ページのURLが表示されていることを報告した。
前回記事では以前より“noindex”が記述されていたこれらコメント関連、トラックバック関連ページがバックリンクに表示されるのは、親記事の“canonical”が影響しているのだろうと推測した。
そして実際これらのコメント関連、トラックバック関連ページは、<データ ハイライター>でタグつけしようとしても「URL が見つかりません」という理由で不可能だった。

だが今回、こうしたコメント関連、トラックバック関連ページも含めて<データ ハイライター>でタグつけ可能なのかを調査したところ、タグつけ可能なページが多数発見された。
これらのページには“canonical”で指定するべきページがないから、表示されたのは全て旧フィーチャーフォン用のコンテンツである。
この事実に接して「<URLの削除>で「期限切れ」を迎えたURLが未だにインデックスされている原因」で書いたことは事実に反すると考えなければならないだろう。
それはインデックスに関する考えが異なっているからだ。

<データ ハイライター>でタグつけ可能なページもあれば、「URL が見つかりません」と表示されるページもある。
また「canonicalタグとnoindexタグは一緒に書かない方が良い!」へのバックリンクのように、旧フィーチャーフォン用や旧スマートフォン用のURLが表示されないページだってある。
コンテンツが存在していれば全てインデックスされるという考え方に照らせば、「URL が見つかりません」と表示されることもバックリンクに表示されないことも不可思議な現象だ。
ならばこうしたことが起こる原因と、Googleが“noindex”と記述したコンテンツをインデックスする理由を合わせて考えると、浮かんでくるのが「構造」というキーワードである。

Googleウェブマスター向け公式ブログにて「」と題した記事がエントリーされた。
真っ先に目を引くのが「フィーチャーフォン用Googlebotの廃止」である。
つまりYahoo seo Googleブログをレスポンシブwebデザイン化する以前は、サイトマップに記載した正規URLにフィーチャーフォン用Googlebotがクロールするとフィーチャーフォン用URLにリダイレクトされた。
これにより正規URLとフィーチャーフォン用URLの関係性はGoogleに把握されていた筈である。

この関係性が維持されたままであるなら、<データ ハイライター>でタグつけしようとしても「URL が見つかりません」と表示されるのは理解出来る。
Search Consoleからはフィーチャーフォン用データは排除されているからであり、フィーチャーフォン用URLとして認識されていたURLは「見つからない」のが当然であるからだ。

だが、そうした関係性が維持されないケースがあることは、今までのYahoo seo Googleブログで記事にしてきた通りである。
つまりは現在のSearch Consoleに表示される旧フィーチャーフォンはウェブ用のURLとして認識されている。
記事「canonicalタグとnoindexタグは一緒に書かない方が良い!」のバックリンクに表示される旧フィーチャーフォン用コメント関連、トラックバック関連URLはウェブ用のURLだということだ。

バックリンクに表示される旧フィーチャーフォン用コメント関連、トラックバック関連URLからは旧フィーチャーフォン用記事ページへのリンクがあるが、その記事ページは“canonical”で正規URLのコンテンツを<データ ハイライター>で表示させる。
つまりは「canonicalタグとnoindexタグは一緒に書かない方が良い!」と題した記事は正規URLで統一されているからこそ、<内部リンク>に表示されているということが出来る。

では“noindex”を記述しながらも「構造」の問題からインデックスされるのは、それがコメントやトラックバックに関連するものだからであろう。

正規URLの場合、コメントは記事ページから投稿が出来るし、投稿されたコメントも記事ページ末尾に表示される。
トラックバックも同様で記事の末尾にトラックバックされたものがあれば表示される。
つまりは旧フィーチャーフォン用コメント関連、トラックバック関連URLは正規URLの一部分を分割表示させただけだといえるのである。
言い換えれば正規URLのウェブ用(この場合、スマートフォン用のURLとして認識されていると想定される)として、旧フィーチャーフォン用コメント関連、トラックバック関連URLはインデックスされているのではないか?
」のタイトル通り、2つはセット化されているからこそインデックスされるのである。

では記事「canonicalタグとnoindexタグは一緒に書かない方が良い!」のバックリンクに表示される旧スマートフォン用コメント、トラックバック関連URLは?
旧スマートフォン用のテンプレートは旧フィーチャーフォン用テンプレートとは異なる。
さらに文字コードも異なる。
旧スマートフォン用は「UTF-8」であったが旧フィーチャーフォン用は「Shift_JIS」である。(参考記事「」)
この違いも旧スマートフォン用、旧フィーチャーフォン用双方をインデックスさせた原因ではないか?

持ち上がる問題は、レスポンシブwebデザイン化したために、こうした旧スマートフォン用、旧フィーチャーフォン用URLはインデックス無用のものになったことをGoogleに把握させることだ。
年内に再度記事をエントリー出来るのか不明だが、何らかの変化が確認出来たら、この続きを書こうと思う。
「“noindex”を記述したURLも「構造」の観点からインデックスされるのではないか?」の関連記事リスト

コメント

非公開コメント