Pomoc pri programovaní, odpovede na otázky / XPath / Xpath - Vylúčenie prvkov v rámci TD - xpath, web-scraping

Xpath - Vylúčenie prvkov v TD - xpath, web-scraping

Snažím sa používať rozšírenie škrabáka Chrome pomocou XPath. Som schopný zoškrabať všetko, čo potrebujem, zo stola, ale ja som uviazol na jednom mieste. Tu je zdroj

<td>
<p class="pClass">
<a href="theurl" target="_blank">
<i class="iClass">someText</i>
Anchor text
</a>
</p>
</td>

Snažím sa chytiť len adresu URL, ale pri použití kódu Xpath as td[9]/p/a chytí časť s ikonou, ktorá hovorí "someText". Existuje spôsob, ako jednoducho chytiť URL?

odpovede:

1 pre odpoveď č. 1

Aby bolo možné extrahovať url len pridať @href k vášmu výrazu xpath by to malo fungovať: //td[9]/p/a/@href, Na odstraňovanie bieleho priestoru môžete použiť funkciu xpath normalizovať-priestor ().

Súvisiace otázky

Pokúšame sa získať riadky stôp pomocou Scrapy xpath - xpath, scrapy

Testcases XPath 2.0 výrazy, ktoré môžu testovať, či je analyzátor podporovaný XPath 2.0 - xpath, testcase, xpath-2.0

XPath 2.0 - 1.0 ekvivalent? - xml, xpath, xpath-2.0, xpath-1.0

Ktorý programovací jazyk na jednej stránke škrabanie? [zatvorené] - skrátenie obrazovky

Prečo má tento Nokogiri XPath nulový návrat? rubín, xpath, nokogiri

xpath nefunguje na tejto webovej lokalite - python, python-2.7, xpath, scrapy

XPath - Ako pristupovať k ukotvenému textu a href z aktuálneho uzla v slučke - python, xpath, škrabanie na webe, scrapy

Scrapy / Python / XPath - Ako extrahovať údaje z dát? - python, xpath, web-scraping, scrapy

Použitie premenných zoznamu v súboroch xpath - python, python-3.x, xpath, web-scraping, scrapy

Overenie správnosti syntaxe xpath v php - php, xml, validácia, xpath, syntax

Zanedbanie obsahu značky skriptu pomocou nástroja DOM Xpath - php, xpath

php xpath obrazovka scrape problém - php, xpath, screen-škrabanie

xpath vracia prázdny nodelist pri grabovaní textu - php, xpath

Odstránenie prvkov <script> HTML - html, css, xpath, nokogiri

xpath vylučuje určitý podradený element s triedou - html, xpath, web-scraping

css alebo xpath selektor: prvky, ktoré majú akýkoľvek atribút s konkrétnou hodnotou - html, css, dom, xpath, css-selectors

Balík HTML Agility nemôže nájsť xPath - c #, škrabanie na webe, html-agility-pack

Nepodarilo sa nájsť prvky XPath v appium 1.7.1 ios app automation - c #, iphone, appium-ios

CSS selektor vnútri XPath - css, xpath, css-selektory

Ako získať xpath pre aplikáciu UI Automator Viewer pre mobilnú automatizáciu? - android, xpath, appium