Java JTextPane HTML编辑器UTF-8字符编码
作者:互联网
我使用JTextPane作为简单的html编辑器.
jtp=new JTextPane();
jtp.setContentType("text/html;charset=UTF-8");
jtp.setEditorKit(new HTMLEditorKit());
当我调用jtp.getText()时,我得到了漂亮的html代码,其中转义了所有特殊字符.但我不想转义国家字符(波兰语),而只希望使用&,<,>
当我进入编辑器时
<foo>ą ś &
我懂了
<foo>ą ś &
但我想得到
<foo>ą ś &
可能性如何?
解决方法:
不幸的是,那是不可能的.
javax.swing.text.html.HTMLWriter内部存在缺陷-对其进行了硬编码,以将非ASCII的任何符号转换为其数字表示形式:
default:
if (chars[counter] < ' ' || chars[counter] > 127) {
if (counter > last) {
super.output(chars, last, counter - last);
}
last = counter + 1;
// If the character is outside of ascii, write the
// numeric value.
output("&#");
output(String.valueOf((int)chars[counter]));
output(";");
}
break;
}
不能以任何方式控制此逻辑.
但是,如果您确实需要该功能,则可以执行疯狂的操作:
>将HTMLWriter源代码复制并粘贴到HTMLWriterHack中(在同一包javax.swing.text.html中,并重命名其中的所有字符串)
>用诸如output(String.valueOf(chars [counter]));之类的东西替换上面列出的三行输出;
>将HTMLDocument源代码复制并粘贴到HTMLDocumentHack中(在同一包javax.swing.text.html中,重命名其中的所有字符串,使其扩展HTMLDocument并删除冲突方法)
>使用下面列出的CustomEditorKit代替HTMLEditorKit
class CustomEditorKit extends HTMLEditorKit {
@Override
public void write(Writer out, Document doc, int pos, int len) throws IOException, BadLocationException {
HTMLWriterHack writer = new HTMLWriterHack(out, (HTMLDocumentHack) doc);
writer.write();
}
@Override
public Document createDefaultDocument() {
StyleSheet styles = getStyleSheet();
StyleSheet ss = new StyleSheet();
ss.addStyleSheet(styles);
HTMLDocumentHack doc = new HTMLDocumentHack(ss);
doc.setParser(getParser());
doc.setAsynchronousLoadPriority(4);
doc.setTokenThreshold(100);
return doc;
}
}
尽管上面的步骤可以工作(我已经测试过),但是我当然不建议这样做.
标签:jtextpane,character-encoding,utf-8,html-entities,java 来源: https://codeday.me/bug/20191102/1987611.html