Snažím sa používať rozšírenie škrabáka Chrome pomocou XPath. Som schopný zoškrabať všetko, čo potrebujem, zo stola, ale ja som uviazol na jednom mieste. Tu je zdroj
<td>
<p class="pClass">
<a href="theurl" target="_blank">
<i class="iClass">someText</i>
Anchor text
</a>
</p>
</td>
Snažím sa chytiť len adresu URL, ale pri použití kódu Xpath as td[9]/p/a
chytí časť s ikonou, ktorá hovorí "someText". Existuje spôsob, ako jednoducho chytiť URL?
odpovede:
1 pre odpoveď č. 1Aby bolo možné extrahovať url len pridať @href
k vášmu výrazu xpath by to malo fungovať: //td[9]/p/a/@href
, Na odstraňovanie bieleho priestoru môžete použiť funkciu xpath normalizovať-priestor ().