/ / Xpath - Vylúčenie prvkov v rámci TD - xpath, web-scraping

Xpath - Vylúčenie prvkov v TD - xpath, web-scraping

Snažím sa používať rozšírenie škrabáka Chrome pomocou XPath. Som schopný zoškrabať všetko, čo potrebujem, zo stola, ale ja som uviazol na jednom mieste. Tu je zdroj

<td>
<p class="pClass">
<a href="theurl" target="_blank">
<i class="iClass">someText</i>
Anchor text
</a>
</p>
</td>

Snažím sa chytiť len adresu URL, ale pri použití kódu Xpath as td[9]/p/a chytí časť s ikonou, ktorá hovorí "someText". Existuje spôsob, ako jednoducho chytiť URL?

odpovede:

1 pre odpoveď č. 1

Aby bolo možné extrahovať url len pridať @href k vášmu výrazu xpath by to malo fungovať: //td[9]/p/a/@href, Na odstraňovanie bieleho priestoru môžete použiť funkciu xpath normalizovať-priestor ().