以下经验内容分享通过Java 程序将PDF文档转为Html的方法。
jar文件导入:
-
1
方法1. 可在E-iceblue官网下载Free Spire.PDF for Java包,下载后,解压,将lib文件夹下的Spire.Pdf.jar文件导入Java程序;
方法2. 或者在Maven项目中配置pom.xml文件(即指定Maven仓库路径和Spire.Pdf.free的依赖),如下配置:
<repositories>
<repository>
<id>com.e-iceblue</id>
<url>http://repo.e-iceblue.cn/repository/maven-public/</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>e-iceblue</groupId>
<artifactId>spire.pdf.free</artifactId>
<version>3.9.0</version>
</dependency>
</dependencies>
END
Java 代码示例
-
1
import com.spire.pdf.*;
public class PDFtoHtml {
public static void main(String[] args) {
//加载PDF测试文档
PdfDocument pdf = new PdfDocument();
pdf.loadFromFile("sample.pdf");
//保存为html格式的文件
pdf.saveToFile("PDFtoHtml.html",FileFormat.HTML);
pdf.dispose();
}
}
-
2
文档转换前后对比,如下图:
END
文章评论