/ / SEO sitemap.xml dynamic content - seo, sitemap, dynamiczne dane

SEO sitemap.xml dynamic content - seo, sitemap, dynamiczne dane

Powiedzmy, że mamy te strony:

1. http://www.mywebsite.com/users/thomas-roberts
2. http://www.mywebsite.com/pages/thomas-roberts/1
3. http://www.mywebsite.com/pages/thomas-roberts/hello-kitty-collection

Czy jest to możliwe w pliku sitemap.xml:

<?xml version="1.0" encoding="utf-8"?>

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://mywebsite.com/users/^(w+)$/</loc>
<lastmod>2006-11-18</lastmod>
<changefreq>daily</changefreq>
<priority>1</priority>
</url>
<url>
<loc>http://mywebsite.com/users/^(w+)$/pages/^(w+)$</loc>
<lastmod>2006-11-18</lastmod>
<changefreq>daily</changefreq>
<priority>0.8</priority>
</url>
<url>
<loc>http://mywebsite.com/users/^(w+)$/pages/^(d+)$</loc>
<lastmod>2006-11-18</lastmod>
<changefreq>daily</changefreq>
<priority>0.6</priority>
</url>
</urlset>

Mam nadzieję, że mój przykład jest jasny, naprawdę nie określamy nowego elementu "url" w pliku sitemap.xml, ale zamiast tego dopasowujemy wyrażenie do adresu URL, a my po prostu wracamy za każdym razem, aby je zaktualizować.

Jeśli to nie może być rozwiązanie, jak działa Twitteri Facebook indeksują wszystkie swoje strony (strony profilowe itp.) w Google? Czy generują nową mapę witryny za każdym razem, gdy tworzony jest nowy użytkownik, i aktualizują jej mapę witryny evertime ktoś aktualizuje swoją stronę / profil?

Byłem bardzo porywczy, gdyby udało nam się jakoś wygenerować plik sitemap.xml (który ma limit 50 000 elementów i 10 MB), co byłoby dobrym pomysłem na generowanie map witryn, jeśli zawartość zostanie zmodyfikowana?

Wielkie dzięki.

Odpowiedzi:

2 dla odpowiedzi № 1

Mapa witryny musi zawierać adresy URL. Regex są niedopuszczalne i zupełnie bezużyteczne, ponieważ nie mówią nic o wyszukiwarkach.

Mapy witryn informują wyszukiwarki, gdzie można znaleźć treści. Więc jeśli treść strony zostanie zmodyfikowana, mapa witryny naprawdę nie wpłynie na nią w odniesieniu do wyszukiwarek.


0 dla odpowiedzi nr 2

Niestety pliki map witryn wymagają wyraźnych adresów URL. Plik Robots.txt zamiast tego przyznaje się do pewnego rodzaju Składnia symboli wieloznacznych poprzez znaki * i + do reprezentowania zbioru adresów URL, ale tak nie jest w przypadku plików map witryn.


0 dla odpowiedzi № 3

Myślę, że najlepszym pomysłem jest aktualizacja adresu URL wbaza danych (lub pamięć podręczna) przy użyciu skryptu uruchamianego przez zadanie cron. Jeśli plik sitemap.xml można wygenerować w ramach limitu czasu serwera, pozwól mu działać w locie przy użyciu danych. Zobacz tutaj na przykład: https://stackoverflow.com/a/29468042/4058484

Jednak jeśli masz ogromną ilość danych, to najlepsze adresy URL znajdują się w wielu mapach witryny, które są dozwolone, o ile są wymienione w pliku sitemap.xml określonym w pliku robots.txt. Zobacz szczegóły tutaj: http://www.sitemaps.org/protocol.html#sitemapIndexXMLExample.