前回記事からの引き続きで、Yahoo seo Googleの旧ドメインのSearch Consoleデータからseo検証を行ってみたのだが、低品質コンテンツであることが原因でリダイレクトされず、旧ドメインでインデックスされるのではないかと推察した。
2023年07月21日付記事「
インデックスリクエストしてよいURLは?」で、同じく “blog40.fc2.com” の「2023/07/18」<ページのインデックス登録>を紹介したが、この時、「クロール済み-インデックス未登録」とされる
URLはなく、「合格」が表示されていた。それが「2023/08/08」データで1件のURLが表示され、表示も「合格」から「開始前」へと変更されたのである。
画像はデータ内容である。
クロールされたのは、現在は使用していないカテゴリが複数に分割されていた時代のURLである。
初検出日とされる
2022年08月17日以降の「クロール済み-インデックス未登録」データを調べてみると、該当のURLが表示されたのは「2022/11/29」更新時で、「2022/12/13」を最後に消えていた。不可解だった点が、データ表示されていた時の前回クロールが「2022/07/17」であったことだが、このURLも
リダイレクトされるのは、メイン・コンテンツのないコンテンツであるため、このカテゴリも実際のURLとは異なる可能性を考えれば、不可解も不可解と思えなくなる。(2023年8月4日付記事No.1292「
サイトコマンド検索表示からインデックスとリンク、コンテンツとURLの関係を検証」を参照のこと。)
低品質コンテンツがインデックスされる原因を検証
今回のテーマは、この「リダイレクトされるのはメイン・コンテンツのないコンテンツ」でありながらも、旧ドメインで
インデックス登録されたり、クロール済みインデックス未登録とされる事例から、
Google seoを検証することである。つまり、メイン・コンテンツのないコンテンツとは低品質コンテンツとも言い換えられ、それはインデックス登録の対象とはならない種類のコンテンツである筈である。しかしながら、実際はこうしてインデックス登録されたり、クロール済みインデックス未登録とされることから判断すれば、低品質コンテンツとGoogleに認識されていない可能性が浮上する。なぜ、低品質コンテンツと認識されていないのだろうか?
それに対し、ウェブサイトのエンティティに貢献しない
リンクを削除することは、Google seoに貢献する。この場合、この “isolation” のワードは、エンティティから “孤立した” と
日本語訳するのが相応しく感じられる。具体的に説明すれば、Yahoo seo Googleのエンティティは “seo” である。しかしながらこのブログでseoと関係がない映画やらサッカーの記事を書いて内部リンクしても、それはYahoo seo Googleの “seo” のエンティティには貢献しないし、寧ろネガティブに影響する。つまりは、こうしたエンティティに貢献しない記事を削除し、内部リンクから排除することでサイトのエンティティはより強固に一本化される。エンティティから “孤立した” コンテンツの削除は、Google seoにポジティブな影響を与えるということである。
低品質コンテンツが原因でリダイレクトされないのか?
このエンティティという観点で先の低品質コンテンツの問題を考えた時、そのURLはエンティティの一部であることが原因でインデックスに関係していると推察される。そしてそのURLが旧ドメインでインデックスされている原因を考えるに、そこにこそ低品質コンテンツが関係しているのではないか?つまりは、リダイレクト先のコンテンツがメイン・コンテンツのない低品質なものだからこそ、リダイレクトされず、旧ドメインでインデックスされているのではないか?
記事No.1292で、旧ドメインでインデックス登録されたアーカイブページの<ページのインデックス登録>を紹介した。その記事で、『現在の
HTTPSのURLにリダイレクトされていることがGoogleによって認識されているからこそ、「ユーザーが指定した正規URL」はHTTPSの正規URLになること』、しかしながら『「Googleが選択した正規URL」は旧ドメインのURLである』ことを報告した。ユーザーが指定するURLがGoogleによって正規URLとして選択されない原因を「そのアーカイブページには
スマートフォン用
Googlebotのインデックスデータが存在しないこと」としたが、もう1つ、「リダイレクトされる先のコンテンツが低品質であったため」という原因も考えられるのではないか?かつて
canonicalタグの誤用により、Yahoo seo GoogleのデスクトップPC用URLに代わって、
フィーチャーフォン用URLがインデックス登録された経験がある。(
2013年11月22日付記事「
canonicalタグの誤用で、別URLのコンテンツをオリジナルコンテンツとしてしまう」を参照のこと。)つまりGoogleは、それがユーザーが指定する正規URLでなくとも、
Googleアルゴリズムにもっとも相性が良いURLがあればそちらをインデックス登録する。その原則からすると、旧ドメインでインデックス登録されたURLは、リダイレクトされないことで、相応しいコンテンツを有するURLとして認識されている筈である。
今回紹介したカテゴリのURLは現在は使用していないと書いた。だから、リダイレクトされたHTTPSのURLのheadにcanonicalで指定されたURLは、
サイトマップに掲載されていないURLである。そのためインデックス未登録とされたが、インデックスされたアーカイブページのように、サイトマップに掲載されたURLがcanonicalで指定されていたら、旧ドメインでインデックス登録されたのではないだろうか?ちなみに、
FC2ブログは削除したカテゴリのURLに対し、404 not foundの
ステータスコードを出力しない。さらにテンプレートで設定するため、削除したカテゴリページにはcanonicalを指定しない、といった細かい設定はできない。
関連のseo記事
- ヘルプフルコンテンツシステムによる低品質コンテンツの認識(2023/09/29)
コメント