编程语言
首页 > 编程语言> > Java JTextPane HTML编辑器UTF-8字符编码

Java JTextPane HTML编辑器UTF-8字符编码

作者:互联网

我使用JTextPane作为简单的html编辑器.

jtp=new JTextPane();
jtp.setContentType("text/html;charset=UTF-8");
jtp.setEditorKit(new HTMLEditorKit());

当我调用jtp.getText()时,我得到了漂亮的html代码,其中转义了所有特殊字符.但我不想转义国家字符(波兰语),而只希望使用&,<,>
当我进入编辑器时

<foo>ą ś &

我懂了

&lt;foo&gt;&#261; &#347; &amp;

但我想得到

&lt;foo&gt;ą ś &amp;

可能性如何?

解决方法:

不幸的是,那是不可能的.

javax.swing.text.html.HTMLWriter内部存在缺陷-对其进行了硬编码,以将非ASCII的任何符号转换为其数字表示形式:

default:
    if (chars[counter] < ' ' || chars[counter] > 127) {
        if (counter > last) {
            super.output(chars, last, counter - last);
        }
        last = counter + 1;
        // If the character is outside of ascii, write the
        // numeric value.
        output("&#");
        output(String.valueOf((int)chars[counter]));
        output(";");
    }
    break;
}

不能以任何方式控制此逻辑.

但是,如果您确实需要该功能,则可以执行疯狂的操作:

>将HTMLWriter源代码复制并粘贴到HTMLWriterHack中(在同一包javax.swing.text.html中,并重命名其中的所有字符串)
>用诸如output(String.valueOf(chars [counter]));之类的东西替换上面列出的三行输出;
>将HTMLDocument源代码复制并粘贴到HTMLDocumentHack中(在同一包javax.swing.text.html中,重命名其中的所有字符串,使其扩展HTMLDocument并删除冲突方法)
>使用下面列出的CustomEditorKit代替HTMLEditorKit

class CustomEditorKit extends HTMLEditorKit {
    @Override
    public void write(Writer out, Document doc, int pos, int len) throws IOException, BadLocationException {
        HTMLWriterHack writer = new HTMLWriterHack(out, (HTMLDocumentHack) doc);
        writer.write();
    }
    @Override
    public Document createDefaultDocument() {
        StyleSheet styles = getStyleSheet();
        StyleSheet ss = new StyleSheet();
        ss.addStyleSheet(styles);
        HTMLDocumentHack doc = new HTMLDocumentHack(ss);
        doc.setParser(getParser());
        doc.setAsynchronousLoadPriority(4);
        doc.setTokenThreshold(100);
        return doc;
    }
}

尽管上面的步骤可以工作(我已经测试过),但是我当然不建议这样做.

标签:jtextpane,character-encoding,utf-8,html-entities,java
来源: https://codeday.me/bug/20191102/1987611.html