Hilfe bei der Programmierung, Antworten auf Fragen / Python / In Python, wie überprüft man, ob eine Zeichenkette mit einer der Regex im Array 'effizient' übereinstimmt? - Python, Regex, Python-3.x

Wie kann man in Python prüfen, ob eine Zeichenkette mit einer der Regex im Array "effizient" übereinstimmt? - Python, Regex, Python-3.x

Ich weiß, dass es bereits einige Threads über passende Regex im Array gibt: Wie verwenden Sie eine Regex in einem Listenverständnis in Python? Aber ich denke nicht, dass diese Ansätze sehr skalierbar sind.

Meine Frage ist, wie man den Regex-Abgleich so effizient wie möglich macht. Zum Beispiel habe ich unten eine Liste mit Gotteslästerungen (sie hat insgesamt 2000 Zeilen):

.*damn
bollock.*
...

(Du hast die Idee…)

Ich möchte so schnell wie möglich herausfinden, ob ein Satz irgendein Schimpfwort / Muster enthält. Verketten Sie alle diese Muster zu einem Muster mit | wird zu einem super-riesigen Muster führen. Hat jemand Ideen, wie man es in Python optimieren kann?

Antworten:

-1 für die Antwort № 1

Ich werde es für diese Bibliothek versuchen:

https://code.google.com/archive/p/esmre/

Reguläre Ausdrucksbeschleunigung in Python mit Aho-Corasick

Oder dieses:

https://github.com/WojciechMula/pyahocorasick/

Verwandte Fragen

nur eins (Regex mit Quantifier und Gruppierung in Python) - Regex

Python re.findall alle Muster drucken - Python, Regex, Fundall

Python Regex mit Lookbehind und Lookahead funktioniert nicht - Python, Regex

regex - wie man eine Gruppe von eindeutigen Zeichen bestimmter Länge abgleicht - python, regex, capturing-group

Python: RegEx, alle Vorkommen von Text "NN.N Prozent" bis "NN.N%" - Python, Regex, Python-3.x

Äquivalent von assertRegexMatches in Python 2.4 - Python, Unit-Testing

Python Regex gibt eine übereinstimmende Zeichenkette zurück, gibt aber auch Leerzeichen zurück, wo es nicht mit [duplicate] übereinstimmt - python, regex, python-2.7

Python-Regex-Zeichenfolgenabgleich? - Python, Regex, Mustervergleich

RegEx Perl-Syntax zu Python - Python, Regex

Verwenden von Regex mit Python re.match - Python, Regex

Python Regex DUPLICATE_NAMES Flag - Python, Regex, Python-2.7

Regex für Großbuchstaben und Unterstriche zwischen Prozentzeichen - Python, Regex

Übereinstimmende Eingaben mit einem regulären Ausdruck in Python [duplizieren] - python, regex, input, match

Nicht gierige Python-Regexes - Python, Regex, Regex-Greedy

Warum passt der Regex "java" nicht zu "/something.java" mit Pythons re-Modul? [Duplizieren] - Python, Regex, Mustervergleich, Übereinstimmung

Problem mit Regex-Rückreferenz in Python - Python, Regex, Python-3.x

Negative Regex Python - Python, Regex

Konvertieren von RE-Code von PHP zu Python - PHP, Python, Regex

Regex-Abgleich in Python 2.7 [Duplizieren] - Java, Python, Regex, Python-2.7

Unterschiede in der Regex-Syntax in Python und Java - Java, Python, Regex