Ich bin auch offen für andere Lösungen als Regex. würde das Prüfen von spitzen Klammern ausreichen? irgendwelche Vorschläge? Vielen Dank!
Edit: Was ich brauche, ist NICHT HTML-Tags zu analysieren, sondern nur um zu überprüfen, ob es diese Tags hat oder nicht
Antworten:
1 für die Antwort № 1Sie können verwenden BeautifulSuppe Parser und prüfen Sie, ob Tags vorhanden sind, indem Sie BeautifulSoup
Objekt und prüfen, ob es mindestens eine gibt Tag
Element:
from bs4 import BeautifulSoup, Tag
l = ["test", "test <br>", "<br>"]
for item in l:
soup = BeautifulSoup(item, "html.parser")
print item, any(isinstance(element, Tag) for element in soup)
Drucke:
test False
test <br> True
<br> True
Ich hoffe, das hilft.
0 für die Antwort № 2
Ich empfehle sehr lxml.html was das Parsing betrifft (xml, html, xhtml ...) Um die ganze Idee zu bekommen, werfen Sie einen Blick auf diese Grafiken und du wirst wissen worüber ich spreche;)
Für einen detaillierteren Vergleich schauen Sie bitte nach Hier.