Java中的URL解码日语字符等
作者:互联网
我有一个servlet接收一些POST数据.因为该数据是x-www-form-urlencoded,所以诸如サボテン的字符串将被编码为サボテン.
如何将此字符串取消编码回正确的字符?我尝试过使用URLDecoder.decode(“encoded string”,“UTF-8”);但它并没有什么区别.
我想取消编码的原因是因为,在我在网页上显示这些数据之前,我是逃避&到& amp;目前,它正在转换编码字符串中的& s,因此字符没有正确显示.
解决方法:
那些不是URL encodings.它看起来像サボテン.这些是decimal HTML/XML entities.要浏览HTML / XML实体,请使用Apache Commons Lang StringEscapeUtils
.
根据评论更新:当响应编码不是UTF-8时,您将收到问号.如果您正在使用JSP,只需将以下行添加到页面顶部:
<%@ page pageEncoding="UTF-8" %>
请参阅有关this article中途的解决方案的更多详细信息.我更倾向于使用-UTF8-all-the-way来摆弄正则表达式,因为正则表达式不会让你为世界统治做好准备.
标签:url-encoding,java,character-encoding,servlets 来源: https://codeday.me/bug/20190827/1737829.html