/ / itext pdf generowanie nie powiodło się podczas analizowania niektórych tagów HTML - java, html, pdf, html-parsing, itext

itext generowanie pdf nie przetwarza niektórych znaczników html - java, html, pdf, html-parsing, itext

Mam ten kod HTML, który znajduje się w db i chcę go przeanalizować w formacie pdf. Używam itext do generowania pdf. oto html w db:

<p>no note.</p><br>
<ul><br>
<li><strong>section</strong></li><br>
</ul><br>
<ol><br>
<li>first</li><br>
<li><em>second</em></li><br>
<li><span style="text-decoration: underline;">third</span></li><br>
</ol><br>

a oto co jest parsowane i wstawiane do pdf:

<p>no note.</p><br>
<strong>section</strong><br>
first<br>
<em>second</em><br>
<span style="text-decoration: underline;">third</span><br>

a także tutaj jest mój kod do parsowania html na pdf:

org.jsoup.nodes.Document doc = Jsoup.parse(text);
List<Element> objects;
objects = HTMLWorker.parseToList(new StringReader(doc.outerHtml()), null);
for (Element object : objects) {
Element ele = (Element) object;
document.add(ele);
}

jak widać liczby i punktory nie są wyświetlane (które są tagami „ol” i „li” w html). Jak to rozwiązać?

Edytować

Aby uzyskać więcej wyjaśnień. Oto tekst, który mam w html:

wprowadź opis obrazu tutaj

a oto uwaga wstawiona do pdf:

wprowadź opis obrazu tutaj

Odpowiedzi:

0 dla odpowiedzi № 1

mój przyjaciel właśnie to rozwiązał:

XMLWorkerHelper.getInstance().parseXHtml(new XHtmlElementHandler(document), new StringReader(text));

prosty :)