编程语言
首页 > 编程语言> > python中的HeaderParseError

python中的HeaderParseError

作者:互联网

如果我尝试使用python 2.6.5(和2.7)中的decode_header()解析此字符串,我会得到一个HeaderParseError.这里是字符串的repr():

 '=?iso-8859-1?B?QW5tZWxkdW5nIE5ldHphbnNjaGx1c3MgU_xkcmluZzNwLmpwZw==?='

此字符串来自包含JPEG图片的mime电子邮件.雷鸟可以
解码文件名(包含德语变音符号).

>>> from email.header import decode_header
>>> decode_header('=?iso-8859-1?B?QW5tZWxkdW5nIE5ldHphbnNjaGx1c3MgU_xkcmluZzNwLmpwZw==?=')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/usr/lib64/python2.6/email/header.py", line 101, in decode_header
    raise HeaderParseError
email.errors.HeaderParseError

解决方法:

对于base64编码的字符串的Python字符集和邮件代理之间似乎不兼容:

>>> from email.header import decode_header
>>> a='QW5tZWxkdW5nIE5ldHphbnNjaGx1c3MgU_xkcmluZzNwLmpwZw=='
>>> decode_header(a)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/usr/lib/python2.7/email/header.py", line 108, in decode_header
    raise HeaderParseError
email.errors.HeaderParseError
>>> a1= a.replace('_', '/')
>>> decode_header(a1)
[('Anmeldung Netzanschluss S\xecdring3p.jpg', 'iso-8859-1')]
>>> print _[0][0].decode(_[0][1])
Anmeldung Netzanschluss Südring3p.jpg

Python使用Wikipedia article建议的字符集(即0-9,A-Z,a-z,/).在同一篇文章中,包括了一些替代方案(包括这里的问题的下划线);然而,下划线的值是模糊的(它的值为62或63,取决于替代方案).

我不知道Python可以做些什么来猜测b0rken邮件代理的意图;所以我建议你在decode_header失败时做一些适当的猜测.

我称之为“已损坏”的邮件代理,因为无需转义消息头中的任何一个或/:它不是URL,所以为什么不使用典型的字符集?

标签:python,email-parsing
来源: https://codeday.me/bug/20190710/1419159.html