首页 > TAG信息列表 > feedparser

如何使用Python和Universal Feed Parser从此BBC feed获取图像

我正在使用此供稿http://feeds.bbci.co.uk/news/rss.xml,并希望获取所有media:thumbnail条目.即所有图片 import feedparser d = feedparser.parse('http://feeds.bbci.co.uk/news/rss.xml') e = d['entries'][0] print e.media_thumbnail ## this returns '

的RSS.NET无法解析feedburner提要

我正在将RSS.NET用于.NET 2.0.尽我所能,我得到以下0个频道: feed = RssFeed.Read("http://feeds.feedburner.com/punchfire?format=xml"); 我注意到对于其他供稿,例如 feed = RssFeed.Read("http://www.engadget.com/rss.xml"); 我猜它必须是有效的xml文档.您认为我应该在我的应

如何在feedparser(Python)中解析多个URL?

我正在使用一些固定的供稿制作一个Web应用程序(已修复,您无法在Feedly或Google Reader中添加供稿) 我尝试了这个,没有运气 RSS_URLS = [ 'http://feeds.feedburner.com/RockPaperShotgun', 'http://www.gameinformer.com/b/MainFeed.aspx?Tags=preview', ] feed = fe

feedparser在脚本运行期间失败,但无法在交互式python控制台中重现

当我运行eclipse或在iPython中运行脚本时,此操作将失败: 'ascii' codec can't decode byte 0xe2 in position 32: ordinal not in range(128) 我不知道为什么,但是当我简单地使用相同的URL执行feedparse.parse(url)语句时,不会引发任何错误.这让我很沮丧. 代码很简单: try:

php – 如何检测页面是RSS还是ATOM提要

我目前正在用PHP构建一个新的在线Feed阅读器.我正在研究的功能之一是Feed自动发现.如果用户输入网站URL,脚本将检测到它不是Feed,并通过解析HTML以获取正确的标记来查找实际的Feed URL. 问题是,我目前正在检测URL是Feed还是网站的方式只能部分工作,我知道它不是最好的解决方案.现在

python – 尝试安装feedparser时’egg_base’选项出错

我想安装feedparser. 这是尝试在Windows命令行中安装feedparser时发生的情况. > python.exe setup.py install running install running bdist_egg error: error in 'egg_base' option: 'feedparser does not exist or is not a directory 我正在使用Python 2.7(feedparser网站声

如何使Universal Feed Parser只解析feed?

我正在尝试使用Universal Feed Parser从我的Django网站上获取外部源的内容.我希望有一些用户错误处理,例如如果用户提供的网址不是Feed.当我尝试feedparser如何响应错误的输入时,我惊讶地发现feedparser根本没有抛出任何异常.例如.在HTML内容上,它尝试从HTML代码中解析一些信息,在

在Django模板标记库中导入外部库时出错

所以我正在尝试编写一个Django可重用的应用程序,它提供了一种在页面上显示Twitter提要的方法.我知道它已经存在了20次.这是一次学术练习.

Python CouchDB无法保存从feedparser条目创建的dict? (没有属性’读’)

我有一个脚本,我想读取RSS源中的条目,并将各个条目以JSON格式存储到CouchDB数据库中. 我的代码中有趣的部分看起来像这样: Feed = namedtuple('Feed', ['name', 'url']) couch = couchdb.Server(COUCH_HOST) couch.resource.credentials = (COUCH_USER, COUCH_PASS) db = couch['

python – 对于存在的索引,我得到的List索引超出范围错误

我使用feed解析器来获取rss对象.我跑的时候 live_leak.links 我明白了 [{'type': 'text/html', 'rel': 'alternate', 'href': 'http://www.liveleak.com/view?i=abf_1476121939'}, {'type': 'application/x-sho

如何通过python中的feedparser收集所有feed?

我正在尝试使用feedparser从reuters.com获取RSS源.我访问了链接http://in.reuters.com/tools/rss以获取RSS订阅源链接,例如http://feeds.reuters.com/reuters/INtopNews.当我使用feedparser在python中实现代码时,我只得到10个帖子,如下所示: import feedparser feeds = feedparser

python feedparser ImportError:没有名为feedparser的模块

当我尝试将feedparser库包含到交互式Python环境中时收到错误: >>>> import feedparser Traceback (most recent call last): File "<stdin>", line 1, in <module> ImportError: No module named feedparser 这也发生在BeautifulSoup和pydelicious.为什么我收到此错误? 使用O

如何使用feedparser解析“”?

rss文件如下所示,我想获取部分media:group中的内容.我查看了feedparser的文档,但似乎没有提到这一点.怎么做?任何帮助表示赞赏. <?xml version="1.0" encoding="UTF-8"?> <rss xmlns:ymusic="http://music.yahoo.com/rss/1.0/ymusic/" xmlns:media="http://search.yahoo.com/

Python RSS Parser也处理FeedBurner

我正在为RSS feed编写Python解析器脚本.我正在使用feedparser,但是,我一直在解析FeedBurner的Feed.谁现在需要FeedBurner?无论如何.. 例如,我找不到解析的方法 http://feeds.wired.com/wired/index http://feeds2.feedburner.com/ziffdavis/pcmag 当我把它们放入feedparser库时,似乎

Python etag / last修改不起作用;如何获得最新的rss

我正在尝试编写一个python程序,它将抓取并显示自上次运行程序以来的任何rss更新.我正在使用feedparser并尝试使用etags并按照here on SO所述进行修改,但我的测试脚本似乎无法正常工作. import feedparser rsslist=["http://skottieyoung.tumblr.com/rss","http://mrjakeparker.com