/ / SEO sitemap.xml dynamischer Inhalt - SEO, Sitemap, dynamische Daten

SEO sitemap.xml dynamischer Inhalt - SEO, Sitemap, dynamische Daten

Sagen wir, wir haben diese Seiten:

1. http://www.mywebsite.com/users/thomas-roberts
2. http://www.mywebsite.com/pages/thomas-roberts/1
3. http://www.mywebsite.com/pages/thomas-roberts/hello-kitty-collection

Gibt es eine Möglichkeit, dies in einer sitemap.xml zu tun:

<?xml version="1.0" encoding="utf-8"?>

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://mywebsite.com/users/^(w+)$/</loc>
<lastmod>2006-11-18</lastmod>
<changefreq>daily</changefreq>
<priority>1</priority>
</url>
<url>
<loc>http://mywebsite.com/users/^(w+)$/pages/^(w+)$</loc>
<lastmod>2006-11-18</lastmod>
<changefreq>daily</changefreq>
<priority>0.8</priority>
</url>
<url>
<loc>http://mywebsite.com/users/^(w+)$/pages/^(d+)$</loc>
<lastmod>2006-11-18</lastmod>
<changefreq>daily</changefreq>
<priority>0.6</priority>
</url>
</urlset>

Ich hoffe, dass mein Beispiel klar ist. Wir geben in der Datei sitemap.xml nicht wirklich ein neues "url" -Element an. Stattdessen passen wir einen Regex an die URL an und kommen jedes Mal zur Aktualisierung zurück.

Wenn dies keine Lösung ist, wie funktioniert Twitter?und Facebook alle ihre Seiten (Profilseiten usw.) in Google indexieren? Generieren sie bei jeder Erstellung eines neuen Benutzers eine neue Sitemap und aktualisieren sie ihre Sitemap, wenn jemand ihre Seite / sein Profil aktualisiert?

Ich war sehr höflich, wenn wir die sitemap.xml (die ein Limit von 50.000 Elementen und 10 MB hat) irgendwie generieren sollten, was wäre eine gute Idee, Sitemaps zu generieren, wenn der Inhalt geändert wird?

Danke vielmals.

Antworten:

2 für die Antwort № 1

Die Sitemap muss tatsächlich URLs enthalten. Regex ist nicht akzeptabel und völlig nutzlos, da sie den Suchmaschinen nichts sagen.

Sitemaps teilen Suchmaschinen lediglich mit, wo sie Ihren Inhalt finden können. Wenn also der Inhalt einer Seite geändert wird, hat dies keinen Einfluss auf die Sitemap, was Suchmaschinen betrifft.


0 für die Antwort № 2

Leider benötigen Sitemaps-Dateien explizite URLs. Die Datei "Robots.txt" lässt stattdessen bestimmte Arten von Dateien zu Platzhaltersyntax durch * und + steht für eine Reihe von URLs, dies gilt jedoch nicht für Sitemaps-Dateien.


0 für die Antwort № 3

Ich denke, die beste Idee ist die Aktualisierung der URL in aDatenbank (oder einen Cache) mit einem Skript, das von cron job ausgeführt wird. Wenn die sitemap.xml innerhalb eines Server-Zeitlimits generiert werden kann, lassen Sie sie mit den Daten im laufenden Betrieb laufen. Siehe hier für ein Beispiel: https://stackoverflow.com/a/29468042/4058484

Wenn Sie jedoch über eine große Datenmenge verfügen, befinden sich die URLs am besten in mehreren Sitemap. Dies ist zulässig, solange die in robots.txt angegebene sitemap.xml aufgeführt ist. Details finden Sie hier: http://www.sitemaps.org/protocol.html#sitemapIndexXMLExample.