在企业级应用或办公自动化系统中,经常需要将网页内容(HTML)导出为 Word 文档(.docx)。本文介绍如何使用 Java 技术栈高效完成这一任务。
以下是一个简单的 Java 示例,展示如何将 HTML 字符串转换为 Word 文档:
import org.docx4j.convert.in.xhtml.XHTMLImporterImpl;
import org.docx4j.openpackaging.packages.WordprocessingMLPackage;
public class HtmlToWord {
public static void main(String[] args) throws Exception {
String html = "<html><body><h1>Hello from HTML!</h1><p>This is a paragraph.</p></body></html>";
WordprocessingMLPackage wordMLPackage = XHTMLImporterImpl.convert(html, null);
wordMLPackage.save(new java.io.File("output.docx"));
System.out.println("Word文档已生成:output.docx");
}
}
需添加 Maven 依赖:
<dependency>
<groupId>org.docx4j</groupId>
<artifactId>docx4j-core</artifactId>
<version>11.4.7</version>
</dependency>
如需快速转换,也可使用以下在线服务辅助测试或非开发场景使用: