/ / Verwenden Sie Python, um HTML- oder JS-Tags zu finden. (Regex?) - Python, HTML, Regex

Verwenden Sie Python, um HTML- oder JS-Tags zu finden. (Regex?) - Python, HTML, Regex

Ich bin auch offen für andere Lösungen als Regex. würde das Prüfen von spitzen Klammern ausreichen? irgendwelche Vorschläge? Vielen Dank!

Edit: Was ich brauche, ist NICHT HTML-Tags zu analysieren, sondern nur um zu überprüfen, ob es diese Tags hat oder nicht

Antworten:

1 für die Antwort № 1

Sie können verwenden BeautifulSuppe Parser und prüfen Sie, ob Tags vorhanden sind, indem Sie BeautifulSoup Objekt und prüfen, ob es mindestens eine gibt Tag Element:

from bs4 import BeautifulSoup, Tag

l = ["test", "test <br>", "<br>"]
for item in l:
soup = BeautifulSoup(item, "html.parser")
print item, any(isinstance(element, Tag) for element in soup)

Drucke:

test False
test <br> True
<br> True

Ich hoffe, das hilft.


0 für die Antwort № 2

Ich empfehle sehr lxml.html was das Parsing betrifft (xml, html, xhtml ...) Um die ganze Idee zu bekommen, werfen Sie einen Blick auf diese Grafiken und du wirst wissen worüber ich spreche;)

Für einen detaillierteren Vergleich schauen Sie bitte nach Hier.