/ / Effizienter Trie-Speicher für eine Web-App - Python, Trie, Aho-Corasick

Effizienter Trie-Speicher für eine Web-App - Python, Trie, Aho-Corasick

Ich habe einen Aho Corasick-Versuch, einen Körper zu analysierenvon Text durch. Jetzt existiert dieser Versuch als Teil meiner Flaschen-App. Es ist auf Heroku implementiert, und derzeit speichere ich naiv eine eingelegte Form des Automaten, entferne sie bei Bedarf und verwende sie. Was wäre ein besserer Weg, um den Aho Corasick-Automaten für eine Web-App wie diese effizient zu speichern?

Antworten:

2 für die Antwort № 1

Der Zugriff auf einen Test auf der Festplatte ist nicht ganz einfach. Daher ist das Laden in den Speicher ein guter Ansatz.

Probieren Sie die Pyahocorasick-Bibliothek FWIW. http://pyahocorasick.readthedocs.io/ ist dein Freund. Es nimmt den Automaten in Ordnung und verwendet ein kompaktes Speicherschema, um die Speichernutzung zu begrenzen