Pomoc w programowaniu, odpowiedzi na pytania / Pyton / Can xml.minidom parsuje XML - python, html-parsing

Czy xml.minidom potrafi parsować XML - python, html-parsing

Uwaga: Nie mogę używać modułów stron trzecich, więc bs4 i lxml nie są opcją.

Muszę parsować HTML za pomocą Python 3 std lib. Myślałem, że xml.minidom byłby drogą do zrobienia, ale wydaje się, że nie jest w stanie parsować nieprawidłowego XML / HTML bez zgłaszania wyjątku takiego jak błąd składni.

Czy brakuje mi czegoś w module xml, który może zrobić to, czego szukam?

Czy brakuje mi czegoś w std lib?

Odpowiedzi:

1 dla odpowiedzi № 1

Zakładając, że brak możliwości korzystania z modułów stron trzecich jest uzasadniony, masz większą szansę html.parser, co powinno dać ci bardziej niskopoziomową kontrolę nad procesem parsowania.

xml.dom.minidom, Obawiam się, ogólnie, nie będzie w stanie przeanalizować zepsutego dokumentu.

-2 dla odpowiedzi nr 2

jeśli potrzebujesz obsługi zepsutego html / xml, polecam ckech Beautiful Soup 4

Powiązane pytania

python 2 xml do sortowania i usuwania duplikatów - xml, xml-parsing, python-2.6

Deduplicating minidom xml output - xml, python-2.7, minidom

Python: która biblioteka analizowania XML będzie działać natychmiast po uruchomieniu w Pythonie w wersji 2.4 i nowszych? - python, xml

python nieobsługiwany wyjątek - python, scripting, xml-parsing

Jak parsować XML z atrybutem w pythonie? [duplicate] - python, xml

Próbujesz parsować duży plik xml w Pythonie - Błędy pamięci - python, xml, parsing, xml-parsing, bigdata

Minidom (XML Parsing) z Pythonem - nie chcę zbierać żadnych węzłów potomnych dziecka - python, xml, parsing, minidom

Python "Walk" katalogu do czynienia z xml - python, xml

Python 3.5 Nie można napisać xml za pomocą minidom - python, xml

Metaprogramowanie w Pythonie do parsowania XML - python, xml, metaprogramming

Python modyfikuje plik xml - python, xml, add

Czy istnieje sposób na sparsowanie html z lxml, ale manipulowanie nim przy pomocy minidoma? - python, html, dom, parsing, lxml

Jak uzyskać "jakiś tekst" z <abc> trochę tekstu </ abc> z pythonem? - python, xml, dom

Jak ustawić tekst w elemencie DOM - python, xml, dom, svg, minidom

jak przeanalizować zdalny dokument? - python, python-3.x

Informacje o łowach za pomocą xml.dom.minidom - python, xml, eclipse, intellij-idea

Xml parsowanie za pomocą xml.dom - python, xml

Korzystanie z Pythona xml.dom.minidom - python, xml

parsowanie pliku xml [closed] - python, xml

zaimportuj plik XML wygenerowany przez Excel w Pythonie - python-2.7, minidom