/ / Как да се справим с индексирането на страници с Google, което не съществува - php, seo, google-webmaster-tools

Как да се справяме с индексирането на "страници" на Google, които не съществуват - php, seo, google-webmaster-tools

Създавам динамични уебсайтове, където структурата е йерархично записана в базата данни (Own CMS). Използвам модела за съседство, за да управлявам тези таблици на базата данни (PHP и Mysql през PDO)

Открих, че Google индексира страниците, които не трябва.

Пример за дървовидна структура, използвана за навигация:

home
about us
products
productgroup 1
productgroup 2
contact
support
sales

Представете си тази структура в падащо меню свръзки към страниците. Когато избирам продукти-> продуктова група 1, получавам URL адрес като www.domain.com/products/productgroup-1, който изтегля данните от базата данни (въз основа на последния елемент uri: productgroup-1, версия на заглавието) и го показва в шаблона ми. Не задавам всички елементи, а само последните (трябва, знам).

Дотук добре. Google индексира тази страница според очакванията:

http://www.domain.com/products/productgroup-1

Но ... Когато използвам Google Инструменти за уеб администратори, виждам много страници, индексирани с 404 инча, като:

http://www.domain.com/products
http://www.domain.com/contact

И така форт.

Тези страници са празни и нямат връзка в навигационната структура.

Аз проектирах структурата си така, че тези страницивръщане на грешка 404. Webmastertools потвърждава това, но продължава да индексира тези страници. Знам, че мога да използвам robots.txt, за да забранявам търсачката на Google, за да я запази. Има ли друг начин да направите това? Трябва ли да генерирам 403 вместо 404?

Тук съм на тъмно.

Отговори:

1 за отговор № 1

Трябва да направите няколко неща:

  1. Използвайте Постоянното пренасочване 301, за да насочите тези празни страници към съответната страница:

    • Дори ако Google не пълзи http://www.domain.com/products, някои хора все още могат да имат достъп до тази връзка, като премахнат последния сегмент от URL адреса от браузъра. Вероятно не искате да им показвате 404, а някои информация.

    • Например можете да пренасочите http://www.domain.com/products И http://www.domain.com/products/ да се http://www.domain.com/products/productgroup-1

    • Научете повече за пренасочването 301 от Моз

    • Възможно е да използвате mod-rewrite за 301 пренасочване, вместо да го правите на ниво код.

  2. Изпратете карта на сайта в Google инструментите за уеб администратори.

    • Това е окончателен списък с URL адреси в сайта Ви.

    • Като карта на сайта ще отбележите премахване на списъка с 404 URL адреса, които вече са индексирани в Google, но ще информирате Google за всичките ви "официални" URL адреси в сайта Ви и за планираната честота на обхождане.

    • Прочетете повече от Google Инструменти за уеб администратори тук.

  3. Проверете HTML кода си за препратки към „/ products“ или „/ contact“. Googlebot няма да обхожда по друг начин тези URL адреси.


0 за отговор № 2

301 пренасочване е най-добрият вариант, който не искате страници, а също така можете да присвоите тези страници в robots.txt страница.