Допомога у програмуванні, відповіді на питання / Java / Як знайти попередніх N братів і сестер елемента - java, html, xpath, html-parsing, htmlunit

Як знайти попередніх N братів і сестер елемента - java, html, xpath, html-parsing, htmlunit

Я використовую HtmlUnit для розбору HTML pae в java, я хочу отримати всі таблиці з сторінки, а потім знайти 5 попередніх братів і сестер для кожної таблиці. Ось як я розбираю таблиці на сторінці:

List<HtmlTable> tables = (List<HtmlTable>) page.getByXPath("//table");
if(tables!=null && tables.size()>0) {
for(int k=tables.size()-1; k>=0; k--) {
for (HtmlTableRow row : tables.get(k).getRows()) {
List<HtmlTableCell> tds = row.getCells();
}
}
}

Отже, якщо таблиця така:

<p></p>
<p></p>
<div></div>
<table>
.
.
</table>

Мені потрібно отримати <div> і два <p> елементи

JSoup, здається, має метод для братів і сестер http://jsoup.org/apidocs/org/jsoup/nodes/Element.html#previousElementSibling%28%29 , в HtmlUnit не вдалося знайти подібну річ.

Відповіді:

2 для відповіді № 1

Є багато функцій, доступних у HtmlUnit теж. Перевірте наступні в Інтернеті HtmlUnit документація:

Спробуйте скористатися цим, щоб отримати те, що ви намагаєтеся досягти.

2 для відповіді № 2

Просто скористайтеся більш підходящим XPath вираз:

//table/preceding-sibling::*[position()<=3]

Дано

<html>
<p/>
<p/>
<div/>
<table>
<tr>
<td>sdf</td>
</tr>
</table>
</html>

Це повернеться:

  <p/>
<p/>
<div/>

Перевірте це тут.

Тоді ви просто перебираєте результати найпростішим способом.

Схожі запитання

XPath _relative_ до заданого елементу в HTMLUnit / Groovy? - xpath, groovy, htmlunit

XPath, щоб знайти комірку зі специфічними текстовими розбірками HTML-таблиць - xml, xpath, groovy, htmlunit

Запуск htmlunit для .net selenium-webdriver? - webdriver, htmlunit

Невирішена залежність: net.sourceforge.htmlдля створення в SBT - sbt, htmlunit

Як вибрати елемент, у якому немає видимих братів і сестер, використовуючи jQuery? - jquery, видимий, брати і сестри

StackOverflowError в String.toLowerCase - java, string, htmlunit, stack-overflow

Чому мій XPath нічого не повертає? - java, xpath, htmlunit

Як натиснути кнопку з назвою ідентифікатора - java, htmlunit

натисніть посилання в htmlUnit - java, htmlunit

Найкращий спосіб виявити зміни HTML-елементів? [closed] - java, php, html, sql

Як перейти на іншу сторінку після виклику кліку? - java, htmlunit

Сайт відстеження XHR з Java - java, xmlhttprequest, htmlunit

Отримати вміст списку елементів інтервалу з HTMLUnit і XPath - java, xpath, htmlunit

отримання декількох помилок при використанні HtmlUnit WebClient.getPage - java, webclient, htmlunit

Що саме вибрати цей запит XPath? - java, xml, xpath, xml-парсинг, jdom

Список HTML-тегів з рядка - Java, HTML, синтаксичний аналіз, теги

Як отримати посилання за допомогою htmlunit - java, htmlunit

Grab HTML Table Data [closed] - java, html

Вилучення значення атрибута з HTML за допомогою HtmlUnit / XPath? - html, синтаксичний аналіз, xpath, htmlunit

Вибір піднабору XPath - html, xml, xpath