/ / naprawianie zniekształconego XML - xml, parsowanie, zniekształcone

naprawianie zniekształconego XML - xml, parsowanie, zniekształcone

Mam ogromny plik, który składa się ze zniekształconego pliku XML(głównie niezapisane znaki XML i sekcje CDATA). Szukam porządnego parsera, który może naprawić zniekształcony xml. Użyłem IntelliJIdea do obejścia mniejszych plików xml, ale IDE zawiesza się, gdy daje mu ogromny plik.

Czy są jakieś przyzwoite narzędzia, które mogą naprawić zniekształcony XML?

Odpowiedzi:

0 dla odpowiedzi № 1

„Jestem pewien, że ktoś powie ci, abyś wrócił i naprawił generator pliku. Jeśli to możliwe, z pewnością byłoby to najlepsze.

Wygląda na to, że planujesz to zrobić bardziej lubmniej ręcznie - szukanie wzorów defektów i ich naprawianie. W tym celu użyłem Notepad ++ - tylko dlatego, że to wiem, będzie obsługiwał naprawdę duże pliki i ma dobre funkcje wyszukiwania / zastępowania, w tym wyrażenia regularne. Istnieje jednak wiele możliwości ulepszeń - w szczególności regularne język wyrażeń jest nieco słaby, jeśli jesteś regexpert.

Wszystko, co próbuje zrozumieć XML, aby zrobić coś więcej niż chromowanie, może być powolne w przypadku takiego pliku.

Obsługa XML w Intellij jest szokująco zła, pod względem wydajności, biorąc pod uwagę jej ogólną doskonałość.