国产化Word处理控件Spire.Doc教程:用Java实现TXT文本与Word互转的完整教程


纯文本(.txt)文件因简洁通用被广泛使用,但无法支持字体、表格、图片等格式;而 Word(.docx)文件虽具备丰富的排版能力,却难以直接用于文本分析、索引等场景。本文将详细介绍如何通过 Spire.Doc for Java(一款轻量级 Word 处理库),快速实现 TXT 文本文件与 Word 的双向转换

Spire.Doc for Java下载 ,请联系E-iceblue Spire官方授权代理商慧都科技

欢迎加入Spire技术交流Q群(125237868),与更多小伙伴一起提升开发技能!

为何选择 Spire.Doc for Java?

相比其他 Java 文档处理工具,Spire.Doc for Java 在格式转换场景中具备显著优势:

  • 格式保真:TXT 转 Word 时完整保留原文件的换行结构与内容,避免乱码或内容丢失;
  • 扩展灵活:支持后续编辑(如修改字体、添加水印、插入脚注等),满足个性化格式需求;
  • 多格式兼容:除 TXT 与 Word 互转外,还可实现 Word 转 PDF、HTML、TIFF 等10+格式,适配多场景需求;
  • 轻量化部署:无需安装 Office 环境,仅需引入 JAR 包即可运行,降低项目依赖复杂度。

前置准备:环境配置

要使用 Spire.Doc for Java 顺利完成 TXT 文本到 Word 的转换,您需要先从慧都网下载该库,并将 Spire.Doc.jar 文件作为依赖项添加到 Java 程序中。

若项目使用 Maven 管理依赖,直接在 pom.xml 中添加以下配置(无需手动下载 JAR 包):

<repositories>
    <repository>
        <id>com.e-iceblue</id>
        <name>e-iceblue</name>
        <url>https://repo.e-iceblue.cn/repository/maven-public/</url>
    </repository>
</repositories>
<dependencies>
    <dependency>
        <groupId>e-iceblue</groupId>
        <artifactId>spire.doc</artifactId>
        <version>13.9.19</version>
    </dependency>
</dependencies>

使用 Java 将 TXT 转换为 Word

TXT 转 Word 的核心逻辑是:通过 Document 类加载 TXT 文件,再以 Word 格式保存。整个过程只需几行代码即可完成,且支持自定义输出路径。

核心API说明

  • Document:核心类,用于在内存中表示 Word 文档。
  • loadFromFile():通过内部解析器读取 TXT 内容,并将其封装到单个 Word 章节中,同时应用默认字体和页边距。
  • saveToFile():调用该方法时,Spire.Doc 会自动将纯文本转换为 .docx 文件,本质是生成符合 OpenXML 格式的结构化 Word 文档。

以下是分步代码示例:

import com.spire.doc.Document;
import com.spire.doc.FileFormat;

public class ConvertTextToWord {

    public static void main(String[] args) {

        // 创建 Document 对象
        Document txt = new Document();

        // 加载 .txt 文本文件
        txt.loadFromFile("介绍.txt");

        // 将文件保存为 Word 格式
        txt.saveToFile("TXT转Word.docx", FileFormat.Docx);

        // 释放资源
        txt.dispose();
    }
}

转换结果:

 

 

扩展技巧:

将 TXT 文本文件转换为 DOC/DOCX 格式后,您可以根据需求进一步自定义文档格式。为简化这一过程,Spire.Doc for Java 提供了内置接口来编辑文本属性,如修改字体颜色、插入脚注、添加文字和图片水印等。

使用 Java 将 Word 转换为 TXT 文本

除了 TXT 转 Word,Spire.Doc for Java 还支持将 DOC/DOCX 文件转换为 TXT 格式,便于从格式丰富的 Word 文档中提取纯文本。该功能在以下场景中尤为实用:剥离格式和布局以获取简洁的原始内容,例如用于文本分析、搜索索引、归档,或导入仅支持纯文本的其他系统。

实现逻辑与 TXT 转 Word 类似,仅需修改保存格式:

import com.spire.doc.Document;
import com.spire.doc.FileFormat;

public class ConvertWordtoText {

    public static void main(String[] args) {

        // 创建 Document 对象
        Document doc = new Document();

        // 加载 Word 文件
        doc.loadFromFile("示例.docx");

        // 将文档保存为 TXT 格
        doc.saveToFile("Word转文本.txt", FileFormat.Txt);

        // 释放资源
        doc.dispose();
    }
}

转换结果:

 

总结

使用 Spire.Doc for Java 实现 TXT 与 Word 的双向转换,具有速度快、准确性高的特点,且无需安装 Microsoft Word。这对于开发报表、文档生成或文件转换工具的 Java 开发者来说尤为实用。

Spire.Doc for Java下载 ,请联系E-iceblue Spire官方授权代理商慧都科技

欢迎加入Spire技术交流Q群(125237868),与更多小伙伴一起提升开发技能!