/ / Ako zaobchádzať s indexovanými stránkami Google, ktoré neexistujú - php, seo, google-webmaster-tools

Ako spracovať indexáciu stránok Google, ktoré neexistujú - php, seo, google-webmaster-tools

Vytváram dynamické webové stránky, kde je štruktúra hierarchicky uložená v databáze (vlastný CMS). Na správu týchto databázových tabuliek používam model Adjacency (PHP a Mysql prostredníctvom CHOP)

Zistil som, že Google indexuje stránky, ktoré by nemal.

Príklad stromovej štruktúry používanej na navigáciu:

home
about us
products
productgroup 1
productgroup 2
contact
support
sales

Predstavte si túto štruktúru v rozbaľovacej ponuke pomocouodkazy na stránky. Keď vyberiem produkty-> produktová skupina 1, získam webovú adresu, napríklad www.domain.com/products/productgroup-1, ktorá vytiahne údaje z databázy (na základe posledného prvku uri: produktová skupina-1, zjednodušená verzia názvu) a zobrazí sa to v mojej šablóne. Nepýtam sa na všetky prvky, iba na posledný (mal by som, viem).

Zatiaľ je všetko dobré. Google indexuje túto stránku podľa očakávania:

http://www.domain.com/products/productgroup-1

Ale ... Keď používam nástroje správcu webu Google, vidím veľa stránok indexovaných pomocou 404 ", napríklad:

http://www.domain.com/products
http://www.domain.com/contact

A tak pevnosť.

Tieto stránky sú prázdne a neobsahujú žiadny odkaz v navigačnej štruktúre.

Svoju štruktúru som navrhol tak, aby tieto stránkyvráti chybu 404. Webmastertools to potvrdzuje, ale naďalej indexuje tieto stránky. Viem, že môžem použiť súbor robots.txt na zakázanie vyhľadávacích robotov spoločnosti Google, aby som ich udržal v indexovaní adries URL. Existuje iný spôsob, ako to urobiť? Mal by som vygenerovať 403 namiesto 404?

Som tu v tme.

odpovede:

1 pre odpoveď č. 1

Mali by ste urobiť niekoľko vecí:

  1. Pomocou 301 stáleho presmerovania nasmerujte tieto prázdne stránky na relevantnú stránku:

  2. Odošlite súbor Sitemap do nástrojov správcu webu Google.

    • Toto je konečný zoznam adries URL na vašich stránkach.

    • Ak použijete súbor Sitemap, odstráňte zoznam 404 adries URL, ktoré už sú indexované na stránkach Google, ale bude informovať spoločnosť Google o všetkých vašich „oficiálnych“ adresách URL na vašom webe a o predpokladanej frekvencii indexového prehľadávania.

    • Prečítajte si viac od Nástroje správcu webu Google tu.

  3. Skontrolujte kód HTML, či neobsahuje odkazy na „/ products“ alebo „/ contact“. Googlebot nebude tieto adresy URL indexovo prehľadávať.


0 pre odpoveď č. 2

Presmerovanie 301 je najlepšou voľbou, ktorú nechcete, aby ste stránky mali, a tiež ich môžete priradiť na stránke robots.txt.