编程语言
首页 > 编程语言> > Java中的URL解码日语字符等

Java中的URL解码日语字符等

作者:互联网

我有一个servlet接收一些POST数据.因为该数据是x-www-form-urlencoded,所以诸如サボテン的字符串将被编码为サボテン.

如何将此字符串取消编码回正确的字符?我尝试过使用URLDecoder.decode(“encoded string”,“UTF-8”);但它并没有什么区别.

我想取消编码的原因是因为,在我在网页上显示这些数据之前,我是逃避&到& amp;目前,它正在转换编码字符串中的& s,因此字符没有正确显示.

解决方法:

那些不是URL encodings.它看起来像サボテン.这些是decimal HTML/XML entities.要浏览HTML / XML实体,请使用Apache Commons Lang StringEscapeUtils.

根据评论更新:当响应编码不是UTF-8时,您将收到问号.如果您正在使用JSP,只需将以下行添加到页面顶部:

<%@ page pageEncoding="UTF-8" %>

请参阅有关this article中途的解决方案的更多详细信息.我更倾向于使用-UTF8-all-the-way来摆弄正则表达式,因为正则表达式不会让你为世界统治做好准备.

标签:url-encoding,java,character-encoding,servlets
来源: https://codeday.me/bug/20190827/1737829.html