/ / SEO sitemap.xml dynamický obsah - SEO, mapa stránok, dynamické dáta

SEO sitemap.xml dynamický obsah - SEO, mapa stránok, dynamické dáta

Povedzme, že máme tieto stránky:

1. http://www.mywebsite.com/users/thomas-roberts
2. http://www.mywebsite.com/pages/thomas-roberts/1
3. http://www.mywebsite.com/pages/thomas-roberts/hello-kitty-collection

Môžete to urobiť v sitemap.xml:

<?xml version="1.0" encoding="utf-8"?>

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://mywebsite.com/users/^(w+)$/</loc>
<lastmod>2006-11-18</lastmod>
<changefreq>daily</changefreq>
<priority>1</priority>
</url>
<url>
<loc>http://mywebsite.com/users/^(w+)$/pages/^(w+)$</loc>
<lastmod>2006-11-18</lastmod>
<changefreq>daily</changefreq>
<priority>0.8</priority>
</url>
<url>
<loc>http://mywebsite.com/users/^(w+)$/pages/^(d+)$</loc>
<lastmod>2006-11-18</lastmod>
<changefreq>daily</changefreq>
<priority>0.6</priority>
</url>
</urlset>

Dúfam, že môj príklad je jasný, že v súbore sitemap.xml neurčíme nový prvok "url", ale namiesto toho sa zhoduje s regexom na adresu URL a my sa vždy vrátime kedykoľvek aktualizovať.

Ak to nemusí byť riešenie, ako Twittera Facebook indexovať všetky svoje stránky (profilové stránky atď.) v službe Google? Vygenerujú nový súbor Sitemap vždy, keď je vytvorený nový používateľ, a aktualizuje ich mapu stránok, kedy niekto aktualizuje svoju stránku alebo profil?

Bol som veľmi kuriózny, ak indead sme sa nejako vygenerovali sitemap.xml (ktorý má limit 50.000 položiek a 10mb), aký by bol dobrý nápad vytvoriť súbory Sitemap, ak sa obsah zmení?

Mnohokrat dakujem.

odpovede:

2 pre odpoveď č. 1

Mapa stránok musí obsahovať skutočne adresy URL. Regex nie je prijateľný a celkom zbytočný, pretože nehovorí vyhľadávačom čokoľvek.

Súbory Sitemap len informujú vyhľadávače, kde nájdu obsah. Takže ak je obsah stránky upravený, mapa stránok naozaj nebude mať vplyv na to, pokiaľ ide o vyhľadávače.


0 pre odpoveď č. 2

Bohužiaľ súbory sitemaps vyžadujú v nich explicitné adresy URL. Súbor robots.txt namiesto toho pripúšťa určitý druh Syntax zástupných znakov prostredníctvom značiek * a +, ktoré predstavujú súbor adries URL, ale to nie je prípad súborov stránok.


0 pre odpoveď č. 3

Myslím, že najlepší nápad je aktualizácia adresy URL v adatabázy (alebo cache) pomocou skriptu, ktorý je spustený pomocou úlohy cron. Ak je možné súbor sitemap.xml vygenerovať v rámci časového limitu servera, nechajte ho bežať v pohybe pomocou údajov. Tu vidíte príklad: https://stackoverflow.com/a/29468042/4058484

Avšak ak máte obrovské množstvo dát, najlepšie sa nachádzajú adresy url vo viacerých mapách, ktoré sú povolené, ak sú uvedené sitemap.xml uvedené v robots.txt vidieť podrobnosti tu: http://www.sitemaps.org/protocol.html#sitemapIndexXMLExample.