/ / Come gestire le "pagine" di indicizzazione di Google che non esistono: php, seo, google-webmaster-tools

Come gestire le "pagine" di indicizzazione di Google che non esistono: php, seo, google-webmaster-tools

Costruisco siti Web dinamici in cui la struttura viene salvata gerarchicamente nel database (Own CMS). Sto usando il modello Adjacency per gestire queste tabelle di database (PHP e Mysql attraverso PDO)

Ho rilevato che Google sta indicizzando le pagine che non dovrebbe.

Un esempio di una struttura ad albero utilizzata per la navigazione:

home
about us
products
productgroup 1
productgroup 2
contact
support
sales

Immagina questa struttura in un menu a tendina concollegamenti alle pagine. Quando seleziono prodotti-> gruppo di prodotti 1 ricevo un URL come www.domain.com/products/productgroup-1 che estrae i dati dal database (basato sull'ultimo elemento uri: productgroup-1, una versione slug del titolo) e lo mostra nel mio modello. Non interrogare tutti gli elementi, solo l'ultimo (dovrei, lo so).

Fin qui tutto bene. Google sta indicizzando questa pagina come previsto:

http://www.domain.com/products/productgroup-1

Ma ... Quando uso gli strumenti per i webmaster di Google vedo un sacco di pagine indicizzate con 404 "s, come:

http://www.domain.com/products
http://www.domain.com/contact

E così forte.

Queste pagine sono vuote e non hanno alcun link nella struttura di navigazione.

Ho progettato la mia struttura in modo tale che queste paginerestituisce un errore 404. Webmastertools lo conferma ma continua a indicizzare queste pagine. So che posso utilizzare robots.txt per disabilitare il bot di ricerca di Google per mantenerlo drom indexing url "s. c'è un altro modo per fare ciò? Dovrei generare un 403 invece di un 404?

Sono al buio qui.

risposte:

1 per risposta № 1

Dovresti fare alcune cose:

  1. Utilizza 301 Reindirizzamento permanente per indirizzare queste pagine vuote a una pagina pertinente:

  2. Invia una sitemap agli strumenti per i webmaster di Google.

    • Questo è un elenco definitivo di URL nel tuo sito.

    • Avendo una sitemap noterai rimuovere l'elenco di 404 URL già indicizzati su Google, ma informerà Google di tutti gli URL "ufficiali" nel tuo sito e della frequenza di scansione prevista.

    • Leggi di più da Strumenti per i webmaster di Google Qui.

  3. Controlla il tuo codice HTML per riferimenti a "/ prodotti" o "/ contatto". Googlebot non eseguirà la scansione di questi URL in altro modo.


0 per risposta № 2

Il reindirizzamento 301 è l'opzione migliore che non desideri e anche le pagine possono essere assegnate nella pagina robots.txt.