编程语言
首页 > 编程语言> > 如何从python中的URL获取域名(名称TLD)

如何从python中的URL获取域名(名称TLD)

作者:互联网

我想从URL列表中提取域名(站点TLD的名称),这些URL的格式可能不同.
例如:
 当前状态—->我想要什么

mail.yahoo.com------> yahoo.com
account.hotmail.co.uk---->hotmail.co.uk
x.it--->x.it
google.mail.com---> google.com

是否有任何python代码可以帮助我从URL中提取我想要的内容,还是应该手动执行?

解决方法:

这有点不重要,因为没有简单的规则来确定什么是有效的公共后缀(站点名称TLD).相反,制作公共后缀的是maintained as a list at PublicSuffix.org.

存在查询列表(本地存储)的python包;它被称为publicsuffix

>>> from publicsuffix import PublicSuffixList
>>> psl = PublicSuffixList()
>>> print psl.get_public_suffix('mail.yahoo.com')
yahoo.com
>>> print psl.get_public_suffix('account.hotmail.co.uk')
hotmail.co.uk

标签:python,url,python-2-7,domain-name
来源: https://codeday.me/bug/20190718/1493523.html