/ / itext generovanie pdf zlyhá pri analýze niektorých značiek html - java, html, pdf, html-parsing, itext

itext generovanie PDF zlyhá pri analýze niektorých html tagov - java, html, pdf, html-parsing, itext

Mám tento html kód, ktorý sa nachádza v db a chcem ho analyzovať v pdf. Používam ho na generovanie pdf. tu je html v db:

<p>no note.</p><br>
<ul><br>
<li><strong>section</strong></li><br>
</ul><br>
<ol><br>
<li>first</li><br>
<li><em>second</em></li><br>
<li><span style="text-decoration: underline;">third</span></li><br>
</ol><br>

a tu je to, čo je analyzované a vložené do pdf:

<p>no note.</p><br>
<strong>section</strong><br>
first<br>
<em>second</em><br>
<span style="text-decoration: underline;">third</span><br>

a tiež tu je môj kód na analýzu html do formátu pdf:

org.jsoup.nodes.Document doc = Jsoup.parse(text);
List<Element> objects;
objects = HTMLWorker.parseToList(new StringReader(doc.outerHtml()), null);
for (Element object : objects) {
Element ele = (Element) object;
document.add(ele);
}

ako je vidieť, čísla a odrážky nie sú zobrazené (čo sú značky „ol“ a „li“ v html). Ako to vyriešiť?

editovať

Pre ďalšie objasnenie. Tu je text, ktorý mám v html:

tu zadajte popis obrázku

a tu je poznámka vložená do pdf:

tu zadajte popis obrázku

odpovede:

0 pre odpoveď č. 1

môj priateľ to práve vyriešil:

XMLWorkerHelper.getInstance().parseXHtml(new XHtmlElementHandler(document), new StringReader(text));

jednoduché :)