Pomoc w programowaniu, odpowiedzi na pytania / Xpath / Xpath - wyklucz elementy w TD - xpath, scraping sieci

Xpath - Wyklucz elementy w TD - xpath, web-scraping

Próbuję użyć rozszerzenia skrobaka Chrome za pomocą XPath. Byłem w stanie zeskrobać wszystko, czego potrzebuję ze stołu, ale utknąłem w jednym miejscu. Oto źródło

<td>
<p class="pClass">
<a href="theurl" target="_blank">
<i class="iClass">someText</i>
Anchor text
</a>
</p>
</td>

Próbuję pobrać tylko adres URL, ale używając mojego kodu Xpath jako td[9]/p/a chwyta część ikony z napisem „someText”. Czy istnieje sposób, aby po prostu pobrać adres URL?

Odpowiedzi:

1 dla odpowiedzi № 1

Aby wyodrębnić adres URL, po prostu dodaj @href do wyrażenia xpath powinno to działać: //td[9]/p/a/@href. Do usuwania białych znaków możesz użyć funkcji xpath normalizuj-przestrzeń ().

Powiązane pytania

Próbujesz uzyskać wiersze tabeli za pomocą funkcji Scrapy xpath - xpath, scrapy

Testy wyrażeń XPath 2.0, które mogą sprawdzić, czy parser obsługuje XPath 2.0 - xpath, testcase, xpath-2.0

XPath 2.0 - 1.0 odpowiednik? - xml, xpath, xpath-2.0, xpath-1.0

Który język programowania pojedynczej strony internetowej skrobanie? [zamknięty] - skrobanie ekranu

Dlaczego ten Nokogiri XPath ma zerowy zwrot? - ruby, xpath, nokogiri

xpath nie działa na tej stronie - python, python-2.7, xpath, scrapy

XPath - Jak uzyskać dostęp do tekstu zakotwiczenia i href z bieżącego węzła w pętli - python, xpath, web-scraping, scrapy

Scrapy / Python / XPath - Jak wyodrębnić dane z danych? - python, xpath, web-scraping, scrapy

Używanie zmiennych list w xpath - python, python-3.x, xpath, web scraping, scrapy

Sprawdź poprawność składni xpath w php - php, xml, validation, xpath, składni

Zaniedbanie zawartości tagu skryptu za pomocą DOM Xpath - php, xpath

php, xpath, screen-scring

xpath zwraca pustą nodelistę podczas przechwytywania tekstu - php, xpath

Usunięcie elementów <script> kodu HTML - html, css, xpath, nokogiri

xpath wyklucza pewne elementy potomne z klasą - html, xpath, web-scraping

selektor css lub xpath: elementy, które mają dowolny atrybut o określonej wartości - html, css, dom, xpath, css-selectors

HTML Agility Pack nie może znaleźć xPath - c #, web-scraping, html-agility-pack

Nie można zlokalizować elementów przez XPath w appium 1.7.1. Ios automatyzacji aplikacji - c #, iphone, appium-ios

Selektor CSS w XPath - css, xpath, css-selectors

Jak zdobyć ścieżkę xpath dla przeglądarki UI Automator dla automatyzacji mobilnej? - Android, Xpath, Appium