Yahoo Seo Google > Google seo 2017年10月~ > リダイレクトの最中、サイトマップが保留だとインデックスされない?

リダイレクトの最中、サイトマップが保留だとインデックスされない?

Yahoo seo GoogleブログのSSL化に際して、サイトマップの役割を検証し直してみた。
旧から新URLへのリダイレクトが進行している最中、サイトマップが「保留」であるとインデックスに支障が出る様である。
Yahoo seo GoogleブログをSSL化して、Search ConsoleでSSL化したバージョンのサイトマップを送信した。
しかしそのサイトマップは未だ「保留」であり、10月30日で38日目を迎えている。

このSSL化する以前のバージョンは9月29日にSearch Consoleから削除した。
しかし削除する以前にも旧サイトマップは「保留」状態であり、それは283日継続されていた。
旧サイトマップが「保留」になったのは2016年12月21日であるが、それ以前にはずっと「保留」されており、2016年10月19日に「解除」される迄に210日間の「保留」期間が存在した。
これは私が知る限りオリジナルドメインではこの様な長期間の「保留」は確認出来ていない。
その為、“fc2”というドメインに関連して起こっていることだと考えている。

何故“fc2”ドメインと関連してサイトマップが「保留」となっているのかは不明である。
だがYahoo seo Googleブログのインデックスを見る限り、このサイトマップの「保留」が大きく関係している様に疑われる。
」の記事で<データ ハイライター>のタグ付け調査を報告したが、タグ付けが可能なURLはウェブ上でもインデックスが確認された。
だがそうしたURLに限って<構造化データ>には表示されないのである。

では<構造化データ>に表示されるURLとはどんなURLか?
<データ ハイライター>のタグ付けでは「seoの為にも記事本文から内部リンクを行うことは重要である」の記事で紹介した画像の様に「見つかりませんでした」と表示された為にFetch as Googleで送信したURLである。
送信したURLは全てではないが殆どが表示された。
これは何を意味するのだろうか?

重要な点、それはサイトマップの働きである。
それは一言で言えば「サイト内URLのインデックスを助ける」ことであろう。
しかしSearch Consoleヘルプの「」の「サイトマップが必要かどうか」の項目を読めば、Yahoo seo Googleブログにはサイトマップは必要ないとも考えられる。
サイトにどこからもリンクされていない、または適切にリンクされていないコンテンツ ページのアーカイブが大量にある。
上記記述に従えば、ブログのどこからもリンクされていないURLはYahoo seo Googleブログにはないからである。
つまりはサイトマップは必要なく、SSL化したブログのリンクをGooglebotがクロールしてくれさえすれば良いのである。
現に<データ ハイライター>でのタグ付けが可能であったURLが存在したのだから、最低限、そのURLからクロールを開始してくれればインデックスは進んだ筈なのである。
だが現実的にインデックスは進まず、だからこそFetch as Googleでの送信が必要だった。
そこから逆算して考えれば、<データ ハイライター>でのタグ付け可能のURLはインデックスされていなかったと言えるだろう。

ではここで「」の記事で書いた2つのインデックスに触れておこう。
<データ ハイライター>のタグ付けでは「見つかりませんでした」と表示され、Fetch as Googleで送信して<構造化データ>に表示されたURLはファスト トラック インデックスされたURLであると言えよう。
あくまでも暫定的にインデックスされたに過ぎず、私達が本来使う意味のプライマリ インデックスとは異なる状態である。
だからこそ日が経つに従い<構造化データ>から消える場合もあるインデックスである。
発リンクと被リンクの観点で語れば、被リンクが見つからない為にプライマリ インデックスされなかったと考えられる。

では<データ ハイライター>のタグ付けが可能であったURLは何だったのか?
それはSSL化する以前の旧URLからリダイレクトされてインデックスされたものだと推測している。
Fetch as Googleで送信して<構造化データ>に表示されたURLは<データ ハイライター>のタグ付けが可能になった。
その逆に<データ ハイライター>のタグ付けが可能でありながらも<構造化データ>に表示されなかった原因は構造化のマークアップがされたソースはSSL化されたソースでは無かったからだ。
説明が必要であろう。

」の記事でリダイレクトに伴うPageRankの喪失が無くなったことを報告した。
つまりこれはリダイレクトされる前のURLとリダイレクトされた後のURLは同一と見倣される事を意味する。
その変更に伴い、SSL化する以前のコンテンツをA.htmlとしSSL化した後のコンテンツをB.htmlとすれば、A.htmlとB.htmlは同一と見倣される。
しかしSSL化する以前のA.htmlのソースとSSL化後のB.htmlはソースが異なる。
A.htmlからの内部リンクはhttpで記述され、B.htmlはhttpsだからである。
つまりソースが異なる為にhttpsでマークアップされた構造化のデータは検出されていない訳である。

以下は2017年10月30日に取得した<インデックス ステータス>の画像である。
上がSSL化した現在のもので下がそれ以前の旧URLのものである。
2017年10月30日に取得したhttpsのインデックス ステータス画像
2017年10月30日に取得したhttpのインデックス ステータス画像
「保留」されているがサイトマップを通じて送信したURLは10月30日段階で1018である。
どれ位かは不明だが、未だリダイレクトが完了せずに重複しているコンテンツがあることだけは想像出来る。
そしてこのリダイレクトが完了されない原因に、サイトマップの「保留」も関係していることだろう。
つまりサイトマップの働きとはインデックスを助けることにある。
そのサイトマップが「保留」されている為にインデックスは促進されないのである。
その為、タグ付け可能であったURLをFetch as Googleで送信してみた。
サイトマップからGooglebotが訪れないのならFetch as Googleで送信する他は無い!と判断したからである。
結果は全てではないが、大部分のURLが<構造化データ>に表示され、マークアップが検出されたことを確認した。

ではサイトマップが「処理」されていたならどうだっただろうか?
サイトマップに記述されたURLこそ正規URLである。
だからこそ旧から新へのリダイレクトが確認された時、Googleがサイトマップを照会したなら、リダイレクト先の新しいURLがインデックスされていたと思われる。
それが「保留」の状態だからこそ、コンテンツは新旧2つのURLでインデックスされるのであろう。
新旧のサイトコマンドで記事タイトルで検索した時、旧では8月29日付けのキャッシュが表示され、新では10月20日のキャッシュが表示された。
当たり前だが、2つともソースは異なっている。
2017年10月30日に取得したエントリー記事no.3のhttpsのキャッシュ
2017年10月30日に取得したエントリー記事no.3のhttpのキャッシュ
」の記事で確認した。
上が新URLで下が旧URLのキャッシュである。

繰り返すが、何故、“fc2”のサイトマップが「保留」になるのか?
“net”“us”の動向を見ていると、「保留」の最大に原因は“fc2.com”ではなく、“fc2.net”と“fc2.us”である様な気がしている。
私からすれば一文の得にもならない“fc2.net”と“fc2.us”は404もしくは410をレスポンスするのが良いと考えている。
それをfc2が何故しないのか、謎である。
「リダイレクトの最中、サイトマップが保留だとインデックスされない?」の関連記事リスト

コメント

非公開コメント