/ / Ako to, že google prehľadáva niektoré stránky v reálnom čase? [closed] - hľadať, seo

Ako Google prehľadáva niektoré stránky v reálnom čase? [uzavreté] - vyhľadávanie, seo

Umiestnil som zdrojový kód na codeplex a do svojhoprekvapenie zistilo, že sa objavilo na google do 13 hodín. Tiež keď som urobil nejaké zmeny vo svojom účte na codeplex, tieto zmeny sa prejavili na google v priebehu niekoľkých minút. Ako sa to stalo ? Existuje nejaký zvláštny význam, ktorý Google platí pre stránky ako Codeplex, Stackoverflow atď., Aby sa ich výsledky rýchlo zobrazovali vo výsledkoch vyhľadávania? Existujú nejaké špeciálne kroky, ktoré môžem podniknúť, aby google prehľadal moje stránky o niečo rýchlejšie, ak nie tak rýchlo.

odpovede:

7 pre odpoveď č. 1

Google uprednostňuje niektoré stránky pred inými. Zahŕňa to veľa magických pravidiel, v prípade CodePlex a Stackoverflow môžeme dokonca predpokladať, že ben ručne vložili do nejakej bielej listiny. Potom sa Google prihlási na odber informačného kanála RSS týchto stránok a prehľadá ich vždy, keď dôjde k novému príspevku RSS.

Príklad: Príspevky na mojom blogu sú zahrnuté v indexe do niekoľkých minút, ale ak nebudem zverejňovať príspevky celé týždne, Google prejde okolo každého týždňa.


7 pre odpoveď č. 2

Huh?


5 pre odpoveď č. 3

Pravdepodobne (a musíte byť zasvätený, aby ste to vedeli ...) ak nájdu dostatok zmien od prehľadávania po prehľadávanie, zúžia okno medzi prehľadávaním, kým - stránky ako populárne blogy / správy atď. nebudú prehľadávané každých pár minút.


3 pre odpoveď č. 4

U populárnych webov, ako je stackoverflow.com, sa indexovanie vyskytuje častejšie ako obvykle, čo si môžete všimnúť vyhľadaním otázky, ktorá bola práve položená.


3 pre odpoveď č. 5

Nie je to známe, ale Google sa pri hodnotení stránok spolieha na holuby. Niektoré stránky majú obzvlášť chutnú kukuricu, ktorá priťahuje pozornosť holubov oveľa častejšie ako iné stránky.


0 pre odpoveď č. 6

Vlastne ... Populárne stránky majú určité kanály, ktoré zdieľajú s Googlom. Web aktualizuje tieto informačné kanály a google aktualizuje ich index pri zmene informačného kanála. V prípade iných stránok s dobrým umiestnením sa vyhľadávacie moduly prehľadávajú častejšie, ak dôjde k zmenám. Je pravda, že to nie je verejne známe, a dokonca ani pre populárne stránky neexistujú žiadne záruky týkajúce sa toho, kedy sa novo zverejnené údaje zobrazia v indexe.


0 pre odpoveď č. 7

Vyhľadávanie v reálnom čase je jedno z najnovších módnych slov a bojísk vo vojnách vyhľadávacích strojov. Oznámenie spoločnosti Google /Bingov twitter integrácia sú dobrým príkladom tohto nového zamerania na super čerstvý obsah.

Začlenenie nového obsahu je skutočnou technickou výzvou a priorita pre spoločnosti ako Google, pretože človek musí prechádzaťdokumenty, začleňte ich do indexu (ktorý je rozložený na stovky / tisíce strojov) a potom nejako určte, či je nový obsah pre daný dopyt relevantný. Pamätajte si, že indexujeme úplne nové dokumenty a tweety, že tieto veci nebudú mať veľa prichádzajúcich odkazov, čo je typická vec, ktorá zvyšuje hodnotenie PageRank.

Najlepší spôsob, ako nechať prehľadávať Google / Yahoo / Bingvašou stránkou je častejšie mať web s často aktualizovaným obsahom, ktorý dosahuje slušnú premávku. (Všetky tieto spoločnosti vedia, aké populárne sú weby, a venujú viac webov na indexovanie zdrojov, ako sú stackoverflow, nytimes a amazon)

Ďalšou vecou, ​​ktorú môžete urobiť, je zabezpečiť, aby váš súbor robots.txt nebránil pavúkom v prehľadávaní vášho webu toľko, koľko chcete, a odoslať sitemap googliť / bing-hoo, aby mali zoznam vašich adries URL. Buďte však opatrní, čo si prajete: http://blog.stackoverflow.com/2009/06/the-perfect-web-spider-storm/


0 pre odpoveď č. 8

No aj môj vlastný blog sa zobrazuje v reálnom čase (je to však pagerank 3), takže si myslím, že to nie je až taký veľký problém :)

Napríklad som to práve zverejnil a objavilo sa to v Google minimálne pred 37 minútami (možno to bolo v reálnom čase, pretože som to predtým nekontroloval) http://www.google.com/search?q=rebol+cgi+hosting