Помощ при програмиране, отговори на въпроси / Ява / Дали този уеб робот прави търсене с широчина или търсене в дълбочина? - java, web-crawler, търсене на ширина-първо, търсене на дълбочина-първо

Този уеб робот извършва ли търсене на първо място или търсене в дълбочина? - java, web-crawler, breadth-first-search, depth-first-search

Някой знае ли ако описаният тук уеб кроулер използва търсене на дълбочина или първо? Инстинктът ми казва, че това е първоначално търсене, но аз не съм 100% сигурен в това.

Също така, обичайно ли е уеб търсачът да използва тези начини за търсене (по-специално чрез рекурсия)?

Отговори:

2 за отговор № 1

Това е първоначално търсене. Забележете този код:

//get all links and recursively call the processPage method
Elements questions = doc.select("a[href]");
for(Element link: questions){
if(link.attr("href").contains("mit.edu"))
processPage(link.attr("abs:href"));
}

Този код ще рекурсивно изследва всички връзкиоткрити на страницата, като изцяло проучват първата връзка и всичко, което е достъпно, след това втората връзка и всичко, което е достъпно и т.н.

Това ще бъде наистина ли бавно, защото само една нишка правипроучване. Това вероятно ще бъде много по-ефикасно, ако бъде пренаписано като модифициран BFS, който поставя неизследвани страници в работен списък и има куп нишки, които грабват неизследвани страници и ги обработват.

Също така не е добра идея да използвате рекурсия, когатопроучване на уеб връзки. Лесно ще задушите стека на обажданията, ако се опитате да направите това, тъй като всеки достатъчно голям уебсайт ще има връзки, които се намират навсякъде.

Надявам се това да помогне!

Свързани въпроси

Как да определите точката на спиране на цикъл при обхождане на уеб сайт - уеб, робот на уеб

Къде уеб-роботите получават своя списък от сайтове, за да обхождат? - уеб робот

Направи робот на Google обхожда моя уеб сайт правилно - търсене, уеб сайт, уеб робот, авторитет

Microsoft SharePoint Search - Пренебрегване на части от страницата - търсене, мъх

Проверете само ако две възли са в рамките на дадено разстояние (дължина на пътя) в графиката - питон, графика, възли, разстояние, ширина - първо търсене

Куинс Пъзел - първият - питън, изкуствен интелект, n-queens

Има ли библиотека за уеб роботи за PHP или Ruby? [затворен] - php, рубин, уеб робот

Java 8 CompletedFuture уеб робот не обхожда миналото един URL адрес - multithreading, concurrency, java-8, уеб-робот, изпълним-бъдеще

Десериализира Двойно търсене Дърво от низ - java, алгоритъм, рекурсия, двоично-търсене-дърво, ширина-първо-търсене

Java Breadth Първо търсене с помощта на Queue [затворен] - java

Дълбочин-първо търсене използване на стека - графика, дълбочина-първо търсене

Как да търсите дърво за определен клас възли - c #, .net, структури от данни, дърво, trie

A * търсене на играта Rush Hour? - c #, алгоритъм, а-звезда

Breadth първо търсене в насочена графика - C + +, търсене, графика, дълбочина-първо-търсене, ширина-първо-търсене

как да разберем въпроса за паметта на ширината - първото търсене в бранша и обвързаността - ширината - първото търсене, клонът и връзката

намерете най-малката възлова точка на листа в bst - двоично-търсене дърво, дълбочина

Защо е казано, че дълбоко-първото търсене страда от безкрайни линии? - алгоритъм, търсене, дълбочина-първо търсене, ширина-първо търсене

Най-къс пътека от корен до лист - алгоритъм, рекурсия, двоично дърво, ширина - първо търсене

Възможно ли е първото търсене и дълбочината за търсене на ширина да имат едно и също преместване на определена графика? - алгоритъм, графика

Как тези два проблема за търсене на първото търсене са различни - алгоритъм, матрица, ширина - първо търсене