ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

URL编码

2020-06-18 18:02:10  阅读:410  来源: 互联网

标签:unquote 编码 URL quote urllib 字符串


为什么在URL中的字符需要被编码

因为URL参数字符串中使用key=value键值对这样的形式来传参,键值对之间以&符号分隔,如果参数中有"="或"&"则会引起误解

如何编码

使用urllib.parse的quote和unquote方法,如:

>>> quote("环==//()WLKJLI__..--~~")
'%E7%8E%AF%3D%3D//%28%29WLKJLI__..--%7E%7E'

不会被编码的非特殊字符:字母、数字、"_.-"、默认的安全字符"/"

urllib.parse.quote(string, safe='/', encoding=None, errors=None)

quote方法会将字符串中的特殊字符进行UTF-8编码(默认编码方式),然后每个字节用16进制表示,字节前加上"%"符号分割,如"环"的UTF-8编码是:

>>> "环".encode("utf-8")
b'\xe7\x8e\xaf'

就表示成%E7%8E%AF

quote的返回值仍是unicode字符串

如何解码

如果在浏览器或Postman中用了被编码的参数字符串放在url中发起请求,它们会自动将请求的参数unquote,如

GET http://127.0.0.1:8000/api/order/?orderId=WoQ%3D%3D

观察浏览器发起的请求参数发现orderId: WoQ==。已经解码

而如果是用request发起get请求,则需要将放到data中的数据先用unquote解码,否则,requests会将已经编码的字符串再次编码,如

# client
requests.get('http://127.0.0.1:5000/api/test_quote/', {"order_id": "1%3D%3D1"})

# server
[18/Jun/2020 17:55:28] "GET /api/test_quote/?order_id=1%253D%253D1 HTTP/1.1" 200 2

参考资料

urllib.parse --- Parse URLs into components

python之urlencode(),quote()及unquote()

标签:unquote,编码,URL,quote,urllib,字符串
来源: https://www.cnblogs.com/luozx207/p/13158953.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有