Aspose.word的Document对象的使用(一)

Aspose.word介绍

Aspose.Words是一个商业.NET类库,可以使得应用程序处理大量的文件任务。Aspose.Words支持Doc,Docx,RTF,HTML,OpenDocument,PDF,XPS,EPUB和其他格式。使用Aspose.Words可以在不使用Microsoft.Word的情况下生成、修改、转换和打印文档。在项目中使用Aspose.Words可以有以下好处。

使用Aspose.word操作word文档

,这里还提供一种官方下载的方式,从官网上直接下载jar,或者引入,本人引入pom会有问题,推荐使用jar

Aspose.word主要的相关类

Document 是表示 Microsoft Word 文档的对象模型的主要类。 DocumentBuilder 提供了一种将内容和格式插入到文档中的简单方法。 Node 是文档中所有节点的基类。 CompositeNode 是文档的所有节点的基类,可以包含其他节点,例如 Paragraph、 Section和 Table和 。

介绍Document相关的构造方法

public Document() – 主要用来创建一个空Document对象 public Document(Stream) – 用输入流的方式来创建Document对象 public Document(Stream, LoadOptions) – 用输入流的方式来创建Document对象LoadOptions主要是附加参数,例如文档有密码时可以LoadOptions options = new LoadOptions( "docPassword" );用这个来传输文档密码 public Document(String) – 使用文件路径来创建Document对象 public Document(String, LoadOptions) – 使用文件路径来创建Document对象,同上的流创建方式

Document相关的方法使用

Section的定义

这里是指word文档的一个部分,可以通过document.getSections()来获取,返回值是SectionCollection集合使用toArray之后再使用,直接上代码来展示,下面代码就可以获取到对应文档中的内容
// ocument读取word中的内容,Document 是表示 Microsoft Word 文档的对象模型的主要类。
        Document document=new Document("C:/Users/zpj/Desktop/增加模板.docx");
        // 获取到这一部分的所有段落
        Paragraph[] paragraphs = document.getFirstSection().getBody().getParagraphs().toArray();
        // 通过循环来获取段落中的内容
        for (int i = 0; i < paragraphs.length; i++) {
          
   
            paragraphs[i].getText();
            // 获取到这一个段落中的所有行
            Run[] runs = paragraphs[i].getRuns().toArray();
            for (Run run : runs) {
          
   
                // 获取到每一行的文字打印
                run.getText();
            }
        }
经验分享 程序员 微信小程序 职场和发展