Yahoo seo Google > サイトマップ > サイトマップの保留と処理は、重複の解消が原因ではないか?

サイトマップの保留と処理は、重複の解消が原因ではないか?

Yahoo seo GoogleのHTTPSサイトマップ送信日時は自動更新され、それはパンダアップデートのインデックス入れ替えを想起させた。サイトマップの保留はサイトの重複が原因であり、それが一転して処理に転じたのは、重複が解消されたからではないだろうか?
前回記事「」の最後に、こう書いた。
この “遡り” も、Googlebotのクロールと関係しているように思える。なぜなら、遡るにつれて<モバイルユーザビリティ>に表示されるページ、消えるページが変わるからだ。
一度はしっかり検証してみようと思っていたので、この機に行うこととした。
サイトマップ送信日時の遡りが始まる前、この送信日は1か月に1度の頻度で自動的にされた。そして、この自動更新は入れ替えを想起させると書いた。HTTPとが原因で、パンダアップデートが発動されていたと思われるのだ。(2021年2月2日付記事「」を参照のこと。)

HTTPの「ページにリダイレクトがあります」を調査

HTTPとHTTPSの重複であるなら、に登録したHTTPの「ページにリダイレクトがあります」に表示されているを調査してみようと考えた。2021年2月16日、HTTP「ページにリダイレクトがあります」画像ご覧の通り、2017年、2018年にされたままのURLが並んでいる。
最も古いクロール日時であった記事No.967を<URL検査>した結果が以下である。2021年2月16日、HTTPの記事番号967のURL検査画像No.967も前回記事で紹介したNo.887と同様、21日からの問題が解決されていなかったことが推察される。
No.967の<URL検査>には、が表示されていた。そのURLはFC2のブログランキングのページである。
なぜ、このランキングページが参照元ページに表示されているのか、最初は分からなかった。の管理画面でもランキングは見られるのだが、そこにあるYahoo seo GoogleのURLはHTTPSだったからだ。
しかし、参照元の外部ランキングページにアクセスしてみると、そこではYahoo seo Googleのトップページと、直近にエントリーされた2つの記事にが張られているのだが、そのリンク先URLがHTTPだったのである。HTTPS化したブログであっても全てがHTTPのURLである。
HTTPのURLはHTTPSに301されるが、のクロールがなくともリンクは結ばれてしまう。(14日付記事「」を参照のこと。)だから、HTTPのNo.967の参照元にランキングページが表示されたのだ。ランキング参加を即座に止めた。そうすれば、ブログランキングのページからHTTPでリンクされることはなくなるからである。
次にHTTPSのNo.967を<URL検査>してみた。2021年2月16日、HTTPSの記事番号967のURL検査画像2021年2月16日、HTTPSの記事番号967のURL検査画像その2参照元ページには “40” のブログ番号が付いた旧の同一記事URL、さらにHTTPの同一記事URLが並んで表示されている。つまりはHTTPSを含めて3つのサイトで重複していることになる。
では旧ドメインでNo.967を探すと、「ページにリダイレクトがあります」の中にあった。その<URL検査>した結果が以下だ。2021年2月16日、旧ドメインの記事番号967のURL検査画像3つのサイトの中ではGooglebotのクロールが最も直近だ。
HTTPSへのクロールは旧ドメインからのリダイレクトがメインの流入口だろう。参照元ページと、それぞれのクロール日時を考慮すれば、そうとしか判断できない。
ではHTTPのNo.967はなぜ、「ページにリダイレクトがあります」に今も表示されているのだろうか?旧ドメインのNo.967については参照元ページのアメブロURLは今も存在する。しかし、newentryのページは存在するが、当然ながらNo.967へのリンクは既にない。またHTTPの参照元ページであるブログランキングのページも存在するが、HTTPのNo.967へのリンクはない。参照元ページが改まることを知った今は、リンクのないブログランキングのページは参照元から消え、その他からのリンクが検出されていないなら、HTTPのURLはSearch Consoleから消えると思われる。しかし、実際は今も表示されているのである。

サイトマップ「保留」と「処理」の意味

この疑問に対する答えに、サイトマップを思い浮かべる人が多いのではないか?参照元ページがない、つまりは他のウェブページからのリンクが確認できない状態でも、GoogleはサイトマップのURLリストからページをインデックスすることを知っている人は大勢いる。なのだ。
FC2ブログのサイトマップと言えば、保留は語るに欠かせない事例だ。サイトマップの保留について一番最初に触れた16日付記事「」を読み返して浮かぶキーワードは、やはり “重複” である。この時の重複は、“net” と旧ドメインで生じたものだ。では、保留に対する処理とは、重複の解消を意味するものと解釈しても良いのではないか?
14日付記事「」で報じた2018年11月10日のサイトマップ処理と、28日付記事「」で報じたHTTPのサイトマップに送信日時が表示され、その日付が2018年11月5日であったことから推察すれば、重複が解消され、サイトマップがされ始めた当初にGoogleが正規サイトと選択したのはHTTPではなかったか?そう考えれば、HTTPがデフォルトで処理されていた理由も説明できるし、また、HTTPSのサイトマップの送信日時が自動更新されていたのも説明できる。HTTPのサイトマップを読み込もうとGooglebotがクロールするも、それはHTTPSのサイトマップにリダイレクトされた。だから、このリダイレクトが送信日を更新させていたと説明できるのである。
301リダイレクトは、Google seoの歴史において、その意味合いを変化させてきた。「」を書いた18日では
リダイレクトといえば<海外SEO情報ブログ>の「301リダイレクトで何%のPageRankが失われるのか?」が印象に残っていた。つまりPageRankが僅かながらも減少するということは、301リダイレクトであれ、そこにはリンクという媒介をデータとして残すことを意味する。
しかし、27日に書いた「」では
それに対しPageRankが失われない状況とは、B.htmlとC.htmlは同一のURLとして認識されることを意味するのだろう。
つまりは、301リダイレクトで繋がるページは、かつては別個のページであったが、現在は同一のページとして扱われる。
ただし、同一なのはコンテンツだけでURLは別であることが、インデックスとが別個のseoの問題となる原因なのである。5日付記事『』で書いた
ここから察するに、“サイトマップで宣言された正規ページについて、関連する重複ページを特定” とは、“Googlebotは、コンテンツの類似性に基づいて、どのページが重複しているか(重複ページがあるかどうか)を判断” することなのだろう。そしてこの文言に即して、Googlebotはコンテンツの類似性に基づいて、スマートフォン用 “sp” のパラメータ付URLを正規ページとして選択したのであろう。
この引用した部分が極めて参考になることだろう。
リダイレクトされてHTTPSのサイトマップは26日まで自動更新された。その送信日に “遡り” が起こり始めた。これはHTTPからHTTPSに、Googleが再度、正規サイトの選択を改めたからではないだろうか?その結果として、<>に表示されるページ、消えるページが変わるのだ。これに関する正誤は、HTTPの「ページにリダイレクトがあります」数値が今後どう推移するかで判明するだろう。
追記(2021年2月23日):サイトマップが担う役割についての検証記事「」をエントリーしました。
追記(2021年2月26日):「サイトマップの保留と処理は、重複の解消が原因ではないか?」以降の記事が、インデックスリクエストと同時にサイトマップを読み込んでいた。詳細は「」を参照のこと。
追記(2023年3月6日):サイトマップの<lastmod>に関して、新事実を知った。FC2ブログのサイトマップが保留や処理を繰り返したのは、<lastmod>のデータをGoogleが使用すると決めたからではなかったか?詳しくは「」を参照のこと。
関連のseo記事
  1. (2017/09/25)
  2. (2021/02/19)

コメント

非公開コメント