/ / SEO sitemap.xml contenu dynamique - référencement, sitemap, données dynamiques

Contenu dynamique SEO sitemap.xml - seo, sitemap, données dynamiques

Disons que nous avons ces pages:

1. http://www.mywebsite.com/users/thomas-roberts
2. http://www.mywebsite.com/pages/thomas-roberts/1
3. http://www.mywebsite.com/pages/thomas-roberts/hello-kitty-collection

Est-il possible de faire cela dans un sitemap.xml:

<?xml version="1.0" encoding="utf-8"?>

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://mywebsite.com/users/^(w+)$/</loc>
<lastmod>2006-11-18</lastmod>
<changefreq>daily</changefreq>
<priority>1</priority>
</url>
<url>
<loc>http://mywebsite.com/users/^(w+)$/pages/^(w+)$</loc>
<lastmod>2006-11-18</lastmod>
<changefreq>daily</changefreq>
<priority>0.8</priority>
</url>
<url>
<loc>http://mywebsite.com/users/^(w+)$/pages/^(d+)$</loc>
<lastmod>2006-11-18</lastmod>
<changefreq>daily</changefreq>
<priority>0.6</priority>
</url>
</urlset>

J'espère que mon exemple est clair, nous ne spécifions pas vraiment un nouvel élément "url" dans le fichier sitemap.xml, mais nous associons une expression régulière à l'URL, et nous revenons chaque fois pour mettre à jour.

Si ce n'est pas une solution, comment Twitteret Facebook indexe toutes leurs pages (pages de profil, etc.) dans Google? Génèrent-ils un nouveau sitemap chaque fois qu'un nouvel utilisateur est créé et mettent-ils à jour leur sitemap chaque personne met-elle à jour leur page / profil?

J'étais très curieux. Si nous devions générer en quelque sorte le fichier sitemap.xml (limité à 50 000 éléments et 10 Mo), quelle serait une bonne idée de générer des plans Sitemap si le contenu était modifié?

Merci beaucoup.

Réponses:

2 pour la réponse № 1

Le sitemap doit contenir réellement des URL. Les regex ne sont pas acceptables et totalement inutiles car ils ne disent rien aux moteurs de recherche.

Les sitemaps indiquent simplement aux moteurs de recherche où trouver votre contenu. Ainsi, si le contenu d’une page est modifié, le plan du site ne l’affectera pas vraiment en ce qui concerne les moteurs de recherche.


0 pour la réponse № 2

Malheureusement, les fichiers sitemaps nécessitent des URL explicites. Le fichier Robots.txt admet un certain type de Syntaxe générique par des signes * et + pour représenter un ensemble d’URL, mais ce n’est pas le cas pour les fichiers sitemaps.


0 pour la réponse № 3

Je pense que la meilleure idée est de mettre à jour l'URL dans unbase de données (ou un cache) à l’aide d’un script exécuté par le travail cron. Si le fichier sitemap.xml peut être généré dans le délai imparti par le serveur, laissez-le s'exécuter à la volée en utilisant les données. Voir ici pour un exemple: https://stackoverflow.com/a/29468042/4058484

Toutefois, si vous avez une énorme quantité de données, le mieux est de localiser les URL dans plusieurs sitemap, ce qui est autorisé tant que le fichier sitemap.xml spécifié dans le fichier robots.txt est détaillé ici: http://www.sitemaps.org/protocol.html#sitemapIndexXMLExample.