/ / Jak radzić sobie z indeksowaniem stron "Google", które nie istnieją - php, seo, google-webmaster-tools

Jak radzić sobie z indeksowaniem stron "Google", które nie istnieją - php, seo, google-webmaster-tools

Buduję dynamiczne strony internetowe, na których struktura jest hierarchicznie zapisywana w bazie danych (własny system CMS). Używam modelu Adjacency do zarządzania tabelami bazy danych (PHP i Mysql poprzez PDO)

Wykryłam, że Google indeksuje strony, których nie powinien.

Przykład struktury drzewa używanej do nawigacji:

home
about us
products
productgroup 1
productgroup 2
contact
support
sales

Wyobraź sobie tę strukturę w menu rozwijanym zlinki do stron. Gdy wybieram produkty-> grupa produktów 1, otrzymuję adres URL, taki jak www.domena.com/produkty/produktgrupa-1, który pobiera dane z bazy danych (na podstawie ostatniego elementu uri: productgroup-1, wersja wtyczki tytułowej) i pokazuje go w moim szablonie. Nie pytam o wszystkie elementy, tylko ostatni (powinienem, wiem).

Jak na razie dobrze. Google indeksuje tę stronę zgodnie z oczekiwaniami:

http://www.domain.com/products/productgroup-1

Ale ... Kiedy używam narzędzi Google dla webmasterów, widzę wiele stron indeksowanych w 404 "s, takich jak:

http://www.domain.com/products
http://www.domain.com/contact

A więc fort.

Te strony są puste i nie mają łącza w strukturze nawigacji.

Zaprojektowałem moją strukturę tak, aby te stronyzwróć błąd 404. Webmastertools potwierdza to, ale nadal indeksuje te strony. Wiem, że mogę użyć pliku robots.txt, aby zabronić robota Google do przechowywania adresów URL z indeksu drom. Czy jest inny sposób na zrobienie tego? Czy powinienem wygenerować 403 zamiast 404?

Jestem tutaj w ciemności.

Odpowiedzi:

1 dla odpowiedzi № 1

Powinieneś zrobić kilka rzeczy:

  1. Użyj 301 ciągłego przekierowania, aby skierować puste strony na odpowiednią stronę:

  2. Prześlij mapę witryny do narzędzi Google dla webmasterów.

    • To jest ostateczna lista adresów URL w Twojej witrynie.

    • Po wpisaniu mapy witryny usuniemy listę 404 adresów URL już zaindeksowanych w Google, ale poinformujemy Google o wszystkich "oficjalnych" adresach URL w Twojej witrynie i planowanej częstotliwości przeszukiwania.

    • Czytaj więcej od Narzędzia Google dla webmasterów tutaj.

  3. Sprawdź swój kod HTML, aby znaleźć odniesienia do "/ products" lub "/ contact". Googlebot nie będzie indeksować tych adresów URL w inny sposób.


0 dla odpowiedzi nr 2

Przekierowanie 301 to najlepsza opcja, której nie chcesz stron, a także możesz przypisać te strony na stronie pliku robots.txt.