Yahoo seo Google > サイトマップ > リダイレクトの最中、サイトマップが保留だとseo上インデックスに支障あり?

リダイレクトの最中、サイトマップが保留だとseo上インデックスに支障あり?

Yahoo seo GoogleのHTTPS化に際し、サイトマップの役割を再度、検証してみたのだが、旧ドメインから新ドメインへのリダイレクトが進行している最中、サイトマップが保留であると、Googleのseo上、インデックスに支障が出るようである。
Yahoo seo Googleを化して、でHTTPSのアドレスで記載しなおしたサイトマップを送信した。しかし、そのサイトマップは未だ保留であり、2017年10月30日で38日目を迎えている。
HTTPS化する以前のバージョンは29日にSearch Consoleから削除した。しかし、削除する前も旧サイトマップは保留状態で、それは283日間継続されていた。旧サイトマップが保留になったのは21日であるが、それ以前もずっと保留されており、19日にされるまでに210日間の保留期間が存在した。
私が知る限り、オリジナルではこのような長期間の保留は確認できていない。そのため、“blog.fc2.com” というドメインに関連して起こっていることだと考えている。
なぜ、“blog.fc2.com” ドメインと関連してサイトマップが保留となっているのかは不明である。だがYahoo seo Googleブログのを見るに、このサイトマップの保留が大きく影響しているだろうことが疑われる。2017年10月3日付記事「」で、<データハイライター>のタグ付け調査を報告したが、タグ付けが可能なはウェブ上でもインデックスが確認された。だが、そうしたURLに限って<構造化データ>には表示されないのである。
では、<構造化データ>に表示されるのは、どのようなURLか?「seoのためにメイン・コンテンツから内部リンクすることは重要」の記事で紹介したのように、<データハイライター>のタグ付けで「見つかりませんでした」と表示されたため、Fetch as GoogleでしたURLである。送信したURLは全てではないが、ほとんどが表示された。これはを考える上で、どう解釈すれば良いのであろうか?
重要な点、それはサイトマップの働きである。それは一言でいえば、「サイト内URLのインデックスを助ける」ことであろう。しかし、Google検索セントラルの「」の「サイトマップが必要かどうか」の項目を読めば、Yahoo seo Googleにはサイトマップは必要ないとも考えられる。
サイトにどこからもリンクされていない、または適切にリンクされていないコンテンツページのアーカイブが大量にある。
上記記述に従えば、ブログのどこからもリンクされていないURLは、Yahoo seo Googleブログにはないからである。つまりはサイトマップは必要なく、HTTPS化したブログのしてくれさえすれば良いからである。現に<データハイライター>でのタグ付けが可能であったURLが存在したのだから、最低限、そのURLからクロールを開始してくれればインデックスは進んだ筈なのである。だが現実的にインデックスは進まず、だからこそFetch as Googleでのリクエストが必要だった。そこから逆算して考えれば、<データハイライター>でのタグ付け可能のURLは、インデックスされていなかったと言えるだろう。
ではここで20日付記事「」で書いた、2つのインデックスに触れておこう。<データハイライター>のタグ付けでは「見つかりませんでした」と表示され、Fetch as Googleでリクエストして<構造化データ>に表示されたのはファストトラックインデックスされたURLであると言えよう。あくまでも暫定的にインデックスされたに過ぎず、私達が本来使う意味のプライマリインデックスとは異なる状態である。だからこそ日が経つに従い<構造化データ>から消える場合もあるインデックスである。の観点で語れば、被リンクが見つからないために、プライマリインデックスされなかったと考えられる。
では、<データハイライター>のタグ付けが可能であったURLは何だったのか?それはHTTPS化する以前の旧ドメインからされてインデックスされたものだと推測している。Fetch as Googleでリクエストして<構造化データ>に表示されたURLは<データハイライター>のタグ付けが可能になった。その逆に<データハイライター>のタグ付けが可能でありながらも、<構造化データ>に表示されなかった原因は、構造化のマークアップがされたソースがHTTPS化されたソースではなかったからだ。説明が必要であろう。
27日付記事「」で、リダイレクトに伴うPageRankの喪失がなくなったことを報告した。つまりこれは、リダイレクトされる前のURLとリダイレクトされた後のURLは同一と見倣されることを意味する。その変更に伴い、HTTPS化する以前のをA.htmlとし、HTTPS化した後のコンテンツをB.htmlとすれば、A.htmlとB.htmlは同一と見倣される。しかし、HTTPS化する以前のA.htmlのソースとHTTPS化後のB.htmlはソースが異なる。A.htmlからの内部リンクはHTTPでされ、B.htmlはHTTPSだからである。つまりソースが異なるためにHTTPSでマークアップされた構造化のデータは検出されていないわけである。
下は2017年10月30日に取得した<インデックスステータス>の画像である。上がHTTPS化した現在のもので、下がそれ以前の旧URLのものである。2017年10月30日に取得したHTTPSのインデックスステータス画像2017年10月30日に取得したHTTPのインデックスステータス画像保留されているが、サイトマップを通じて送信したURLは10月30日段階で1,018である。どれくらいかは不明だが、未だリダイレクトが完了せずに重複しているコンテンツがあることだけは想像できる。そしてこのリダイレクトが完了されない原因に、サイトマップの保留も関係していることだろう。つまりサイトマップの働きとは、インデックスを助けることにある。そのサイトマップが保留されているためにインデックスは促進されないのである。そのため、タグ付け可能であったURLをFetch as Googleでリクエストしてみた。サイトマップからGooglebotが訪れないのなら、Fetch as Googleでリクエストする他はない!と判断したからである。結果は全てではないが、大部分のURLが<構造化データ>に表示され、マークアップが検出されたことを確認した。
では、サイトマップが処理されていたなら、どうだっただろうか?サイトマップに記載されたURLこそ正規URLである。だからこそ旧から新へのリダイレクトが確認された時、Googleがサイトマップを照会したなら、リダイレクト先の新しいURLがインデックスされていたと思われる。それが保留の状態だからこそ、コンテンツは新旧2つのURLでインデックスされるのであろう。新旧のサイトで記事タイトルで検索した時、旧では29日付けのキャッシュが表示され、新では2017年10月20日のキャッシュが表示された。当たり前だが、2つともソースは異なっている。2017年10月30日に取得した記事番号3のHTTPSのキャッシュ2017年10月30日に取得した記事番号3のHTTPのキャッシュ27日付記事「」で確認した。上が新ドメインで、下が旧ドメインのキャッシュである。
繰り返すが、なぜ、“blog.fc2.com” のサイトマップが保留になるのか?“net” や “us” の動向を見ていると、保留の最大の原因は “blog.fc2.com” ではなく、“fc2.net” と “fc2.us” であるような気がしている。私からすれば一文の得にもならない “fc2.net” と “fc2.us” は “404” もしくは “410” をレスポンスするのが良いと考えている。それをFC2がなぜしないのか、謎である。(“net” や “us” ドメインの問題は、27日付記事「」を参照のこと。)
追記(2022年3月1日)301リダイレクトとサイトマップは、Googleオフライン処理で重要な役割を担っている。詳しくは「」を参照のこと。
関連のseo記事
  1. (2018/01/19)
  2. (2018/03/07)
  3. (2019/08/05)
  4. (2019/10/04)

コメント

非公開コメント