Hilfe bei der Programmierung, Antworten auf Fragen / Python / Verwenden Sie Python, um HTML- oder JS-Tags zu finden. (Regex?) - Python, HTML, Regex

Verwenden Sie Python, um HTML- oder JS-Tags zu finden. (Regex?) - Python, HTML, Regex

Ich bin auch offen für andere Lösungen als Regex. würde das Prüfen von spitzen Klammern ausreichen? irgendwelche Vorschläge? Vielen Dank!

Edit: Was ich brauche, ist NICHT HTML-Tags zu analysieren, sondern nur um zu überprüfen, ob es diese Tags hat oder nicht

Antworten:

1 für die Antwort № 1

Sie können verwenden BeautifulSuppe Parser und prüfen Sie, ob Tags vorhanden sind, indem Sie BeautifulSoup Objekt und prüfen, ob es mindestens eine gibt Tag Element:

from bs4 import BeautifulSoup, Tag

l = ["test", "test <br>", "<br>"]
for item in l:
soup = BeautifulSoup(item, "html.parser")
print item, any(isinstance(element, Tag) for element in soup)

Drucke:

test False
test <br> True
<br> True

Ich hoffe, das hilft.

0 für die Antwort № 2

Ich empfehle sehr lxml.html was das Parsing betrifft (xml, html, xhtml ...) Um die ganze Idee zu bekommen, werfen Sie einen Blick auf diese Grafiken und du wirst wissen worüber ich spreche;)

Für einen detaillierteren Vergleich schauen Sie bitte nach Hier.

Verwandte Fragen

Regex: Wie passe ich eine Regex-Logik 1 oder öfter an? - Regex

Visual Studio Suchen und Ersetzen von Inhalten zwischen HTML-Tags mit Regex - Regex, Visual Studio, IDE, suchen

Reguläre Ausdrücke aus einer XML-Datei lesen, in einer Liste speichern und anschließend verwenden - python, regex, xml, list

Python: RegEx, alle Vorkommen von Text "NN.N Prozent" bis "NN.N%" - Python, Regex, Python-3.x

Wählen Sie <p> -Tags, die durch n - python, regex getrennt sind

Wie man Regex verwendet, um Zeichenketten innerhalb bestimmter HTML-Tags zu entfernen und Zeichenketten müssen Leerzeichen enthalten - python, regex

Python Regex [: Alpha:] - Python, Regex

RegEx Perl-Syntax zu Python - Python, Regex

wie suche und ersetze string mit reg ex in python in folgender bedingung? [geschlossen] - Python, Regex, String, ersetzen

Python Regex DUPLICATE_NAMES Flag - Python, Regex, Python-2.7

HTML-Tag-Ersatz mit Regex und Python - Python, HTML, Regex, Tags

Übereinstimmende Eingaben mit einem regulären Ausdruck in Python [duplizieren] - python, regex, input, match

Python-Regex zum Entfernen aller Tags, die nicht zwischen zwei anderen Tags liegen - python, html, regex

Problem mit Regex-Rückreferenz in Python - Python, Regex, Python-3.x

Entfernen Sie die HTML-Tags in Regex [Duplizieren] - Python, Regex

Negative Regex Python - Python, Regex

Kann mir jemand mit meinem Regex helfen, den Text in HTML-Code zu bekommen? [Duplizieren] - PHP, HTML, Regex

Unterschiede in der Regex-Syntax in Python und Java - Java, Python, Regex

Entfernen Sie HTML-Tags aus der Zeichenkette mit Regex, ohne Zeichen aus dem eigentlichen Text zwischen Tags - c #, html, regex, string, tags - zu entfernen

Regex, um alle HTML-Tags außer <p> und </ p> in C # [doppelt] - c #, Regex zu finden