编程语言
首页 > 编程语言> > java-读取,替换占位符并使用docx4j写入word文件

java-读取,替换占位符并使用docx4j写入word文件

作者:互联网

我有一个Word文件,看起来像这样:

您不需要了解内容,只需看看我的占位符< env>和.这些占位符共有10页,现在我应该用其他内容替换它们.黑框和黄框是我不会分享的公司图片.

现在,我开始阅读整个docx4j doc并在一段时间后生成以下代码:

public void manipulateWord(String path, String env, String appl) {
    try {
        WordprocessingMLPackage wpml = WordprocessingMLPackage.load(new File(path));

        MainDocumentPart mdp = wpml.getMainDocumentPart();

        List<Object> content = mdp.getContent();

        // Include all Strings to replace
        HashMap<String, String> mappings = new HashMap<String, String>();
        mappings.put("<env>", env);
        mappings.put("<applikationsabkürzung>", appl);

        for (Object object : content) {
            Text textElement = (Text) object;
            String textToReplace = textElement.getValue();
            if (mappings.keySet().contains(textToReplace)) {
                textElement.setValue(mappings.get(textToReplace));
            }
        }

        wpml.save(new File("C:\\Users\\kristina\\Desktop\\outputfile.docx"));

    } catch (Docx4JException e) {
        LOG.error(e);
    }

一些解释:

>字符串路径是上图中文件的路径
>字符串env是应替换< env>
>字符串appl是应替换

但是,当我运行该方法时,什么也没发生,我的控制台仅输出一些信息.如果它们很重要,我将编辑该帖子,但我不这么认为.

那我的错在哪里呢?这样行吗?我快要绝望了…

解决方法:

MainDocumentPart.getContent()将返回主文档流中的所有OpenXml组件(页眉和页脚之类的元素都有自己的元素).您的代码假设List< Object>的结果为内容将是Text元素的集合,不一定是这种情况.例如,典型的(简单)文档结构如下所示:

P  // Paragraph element
    -> R  // Run element
        -> Text  // Text element

…所以getContent()很可能会吐出一个P对象的负载作为开始.

遍历docx4文件有几种方法-有关更多信息,请参见docx4j主站点-但下面的方法中显示了一种方法.您可以传入MaindocumentPart作为第一个Object,并将Text.class作为要搜索的对象类型.然后,这应有助于识别包含映射值之一的所有Text元素:

public List<Object> getAllElementFromObject(Object obj, Class<?> toSearch) {
    List<Object> result = new ArrayList<Object>();
    if (obj instanceof JAXBElement)
        obj = ((JAXBElement<?>) obj).getValue();

    if (obj.getClass().equals(toSearch))
        result.add(obj);
    else if (obj instanceof ContentAccessor) {
        List<?> children = ((ContentAccessor) obj).getContent();
        for (Object child : children) {
            result.addAll(getAllElementFromObject(child, toSearch));
        }
    }

    return result;
}

标签:docx4j,java
来源: https://codeday.me/bug/20191123/2064677.html