/ / SEO sitemap.xml contenido dinámico - seo, sitemap, datos dinámicos

SEO sitemap.xml contenido dinámico - seo, sitemap, dynamic-data

Digamos que tenemos estas páginas:

1. http://www.mywebsite.com/users/thomas-roberts
2. http://www.mywebsite.com/pages/thomas-roberts/1
3. http://www.mywebsite.com/pages/thomas-roberts/hello-kitty-collection

¿Existe la posibilidad de hacer esto en un sitemap.xml:

<?xml version="1.0" encoding="utf-8"?>

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://mywebsite.com/users/^(w+)$/</loc>
<lastmod>2006-11-18</lastmod>
<changefreq>daily</changefreq>
<priority>1</priority>
</url>
<url>
<loc>http://mywebsite.com/users/^(w+)$/pages/^(w+)$</loc>
<lastmod>2006-11-18</lastmod>
<changefreq>daily</changefreq>
<priority>0.8</priority>
</url>
<url>
<loc>http://mywebsite.com/users/^(w+)$/pages/^(d+)$</loc>
<lastmod>2006-11-18</lastmod>
<changefreq>daily</changefreq>
<priority>0.6</priority>
</url>
</urlset>

Espero que mi ejemplo sea claro, no especificamos realmente un nuevo elemento "url" en el archivo sitemap.xml, pero en cambio, hacemos coincidir una expresión regular con la url, y volvemos cada vez que nos actualizamos.

Si esto podría no ser una solución, ¿cómo Twitter?¿Y el índice de Facebook todas sus páginas (páginas de perfil, etc.) en Google? ¿Generan un nuevo mapa del sitio cada vez que se crea un nuevo usuario y actualizan su mapa del sitio cada vez que alguien actualiza su página / perfil?

Tenía mucha curiosidad, si en el caso de los indead pudiéramos generar de alguna manera el sitemap.xml (que tiene un límite de 50.000 elementos y 10 mb), ¿cuál sería una buena idea para generar sitemaps si se modifica el contenido?

Muchas gracias.

Respuestas

2 para la respuesta № 1

El mapa del sitio debe contener realmente URLs. Los regex no son aceptables e inútiles ya que no le dicen nada a los motores de búsqueda.

Los mapas del sitio solo le dicen a los motores de búsqueda dónde encontrar su contenido. Así que si se modifica el contenido de una página, el mapa del sitio realmente no lo afectará en lo que respecta a los motores de búsqueda.


0 para la respuesta № 2

Desafortunadamente, los archivos de sitemaps requieren URL explícitas en ellos. Robots.txt en su lugar admite cierto tipo de Sintaxis de comodines a través de los signos * y + para representar un conjunto de URL, pero ese no es el caso de los archivos de mapas.


0 para la respuesta № 3

Creo que la mejor idea es actualizar la url en unbase de datos (o un caché) utilizando un script que se ejecuta por trabajo cron. Si el sitemap.xml se puede generar dentro del límite de tiempo del servidor, deje que se ejecute sobre la marcha utilizando los datos. Vea aquí para un ejemplo: https://stackoverflow.com/a/29468042/4058484

Sin embargo, si tiene una gran cantidad de datos, la mejor ubicación es ubicar las URL en varios sitemap, siempre que estén listados como sitemap.xml especificado en robots.txt. Consulte los detalles aquí: http://www.sitemaps.org/protocol.html#sitemapIndexXMLExample.