私はpdfファイルを持っています:
Aspose.pdfによってワードに変換され、出力は次のとおりです。
https://ufile.io/ikwgx pdfからwordに変換した後、wordのテキストが領域外であり、テキストがグループ形式である理由。
このコードを編集して目標を達成するにはどうすればよいですか?
私のコードは:
Document document = new Document("x"+".pdf");
document.save("x" + ".docx", SaveFormat.DocX);
回答:
回答№1は0テキストのグループ化の問題については、このコードをテストして、問題を解決しました。
DocSaveOptions saveOptions = new DocSaveOptions();
saveOptions.setMode(DocSaveOptions.RecognitionMode.Flow);
saveOptions.setFormat(DocSaveOptions.DocFormat.DocX);
document.save(Constants.EXP_DIR + token + ".docx", saveOptions);
しかし、表外のテキストの問題については、まだ問題があります。