编程语言
首页 > 编程语言> > 评估本地html文件上的javascript(无浏览器)

评估本地html文件上的javascript(无浏览器)

作者:互联网

这是我正在努力工作的项目的一部分.

我想自动化一个Sharepoint站点,特别是从我和我的同事只有前端访问权限的数据库中提取数据.

我最终设法使用Python-NTLM来获得机械化(在python中),并通过修补其部分源代码来修复重复出现的错误.

现在,我希望是我最后的障碍:我需要提交的表单的一部分似乎是JavaScript函数的输出:并且看到…… Mechanize不支持javascript.我不想在python中自己模仿javascript功能,因为我理想地喜欢可重用的解决方案……

那么,有没有人知道我如何评估我从sharepoint下载的本地html上的javascript?我只是想以某种方式运行javascript(以完成页面的加载),但没有浏览器.

我已经研究过selenium,但是我需要完成的工作量很慢……我目前正在调查PyV8以尝试自己评估javascript …但肯定必须有一个应用程序或库(什么都可以做到这一点?

解决方法:

好吧,最后我得出以下可能的解决方案:

>运行Chrome无头并收集html输出(感谢koenp链接!)
>运行PhantomJS,一个带有javascript api的无头浏览器
>运行HTMLUnit;同样的事情,但对于Java
>使用Ghost.py,一个基于python的无头浏览器(由于某种原因,我还没有看到任何建议!)
>编写基于Pyv8(谷歌v8 javascript引擎)的基于DOM的javascript解释器,并将其添加到我当前使用mechanize的“半解决方案”中.

现在,我决定使用Ghost.py或我自己修改的PySide / PyQT Webkit(鬼如何工作)来评估javascript,因为显然它们可以运行得非常快,如果你优化它们不下载图像并禁用GUI.

希望其他人会发现此列表有用!

标签:html,javascript,python,eval,screen-scraping
来源: https://codeday.me/bug/20190929/1831744.html