/ /存在しないGoogleインデックスの「ページ」を処理する方法 - php、seo、google-webmaster-tools

php、seo、google-webmaster-toolsなど存在しないGoogleインデックスの 'ページ'を処理する方法

構造がデータベースに階層的に保存されている動的なWebサイトを構築します(Own CMS)。私はこのデータベーステーブルを管理するためにAdjacencyモデルを使用しています(PDOによるPHPとMysql)

私は、グーグルがそうすべきではないページを索引付けしているのを発見した。

ナビゲーションに使用されるツリー構造の例

home
about us
products
productgroup 1
productgroup 2
contact
support
sales

この構造をプルダウンメニューで想像してみてください。ページへのリンク商品 - >商品グループ1を選択すると、www.domain.com/products/productgroup-1のようなURLがデータベースから取得されます(最後のuri要素:productgroup-1、タイトルのスラッグバージョン)。それを私のテンプレートに表示します。すべての要素を問い合わせるのではなく、最後の要素だけを問い合わせます(私は知っているべきです)。

ここまでは順調ですね。グーグルはこのページを予想通りに索引付けしている:

http://www.domain.com/products/productgroup-1

しかし... ... Googleウェブマスターツールを使用すると、404のインデックスが付けられた多くのページが表示されます。

http://www.domain.com/products
http://www.domain.com/contact

そして砦。

これらのページは空であり、ナビゲーション構造内にリンクはありません。

私はこれらのページができるように私の構造を設計しました404エラーを返します。 Webmastertoolsはこれを確認していますが、これらのページのインデックスを作成し続けています。 robots.txtを使用してGoogleの検索ボットを禁止して、インデックスURLからGoogleに送信することを禁止できます。これを行う別の方法はありますか? 404ではなく403を生成する必要がありますか?

ここは暗闇の中です。

回答:

回答№1は1

あなたはいくつかのことをするべきです:

  1. この空のページを関連ページに誘導するには、301 Permanent Redirectionを使用します。

  2. Googleウェブマスターツールにサイトマップを送信する。

    • これはあなたのサイトのURLの決定的なリストです。

    • サイトマップを作成すると、既にGoogleでインデックス登録されている404個のURLのリストが削除されますが、サイト内のすべての "公式" URLと意図されたクロール頻度がGoogleに通知されます。

    • もっと読む Googleウェブマスターツール ここに。

  3. HTMLコードで "/ products"または "/ contact"への参照を確認してください。それ以外の場合、GooglebotはこれらのURLをクロールしません。


回答№2の場合は0

301リダイレクトはあなたがページを望んでいない最善の選択肢であり、またrobots.txtページでそれらのページを割り当てることができます。