/ / Какво е алгоритъм за "тенденции в темата" на search.twitter.com? - алгоритъм, търсене, twitter, trending

Какво представлява алгоритъмът "търсене на тенденции" в search.twitter.com? - алгоритъм, търсене, twitter, trending

Кой алгоритъм използва Twitter, за да определи 10 теми, на които можете да видите search.twitter.com? Бих искал да внедря този алгоритъм и бих искал да покажа и 50-те най-популярни теми (вместо 10). Можете ли да опишете най-ефективния алгоритъм?

Благодаря!

(Twitters API може да се намери на- http://apiwiki.twitter.com/REST%20API%20Documentation)

Също така, бих искал да мога да внедря алгоритъма, като търся публична хронология - http://twitter.com/statuses/public_timeline.rss

Отговори:

12 за отговор № 1

Треньорският алгоритъм на Twitter не е просто обем от ключови думи, но това е част от него, но има и фактор на разпад, така че "justin beiber" не е най-треньорът завинаги.

Тази публикация на quora подкрепя това. http://www.quora.com/Trending-Topics-Twitter/What-is-the-basis-of-Twitters-current-Trending-Topics-algorithm?q=trending+algorithm

разпадането обикновено се извършва, като се използва относителната възраст на публикацията в алгоритъма, придавайки по-голяма тежест на по-новите теми / публикации и т.н.

Вижте също http://www.quora.com/What-tools-algorithms-or-data-structures-would-you-use-to-build-a-Trending-Topics-algorithm-for-a-high-velocity-stream?q=trending+algorithm


1 за отговор № 2

Така че това, което вероятно прави Twitter, е товаброй споменавания на конкретен термин минус спри думи (спрете думи като: направете, аз, вие, аз, не, и т.н.) Така че "котката е излязла от торбата" и "кучето ми яде котката ми" означава, че котката, кучето и торбата ще бъдат термините, които тя извлича (останалите са всички думи за спиране) И тогава броят на "котката" като 2 препратки, така че "котка" ще бъде тенденция в този случай.