首页 > TAG信息列表 > goutte

PHP Goutte.没有“值”字段的选择按钮

这是我的目标网站:http://www.rapid7.com/db/,我想在那里进行搜索,比如说字符串“ Symphony”以检查其漏洞. 检查输入表单的元素后,我看到它的名称是“ q”,到目前为止很好,但是按钮没有值,相反,我需要提交查询的按钮是:< span id =“ run_search” class =“ vbsearchBtn“< / span>

php-在Goutte中发送具有相同参数名称的发布请求

我要抓取的一个网站的两个参数使用相同的名称,因此我想执行以下操作: $params = array('dates' => '20140414', 'o' => '192382', 'o' => '213003' etc...); $crawler = $client->request('POST', $url, $params); 但是,由

php-如何在Goutte中设置cookie?

我不知道如何在Goutte中设置cookie.我正在尝试以下代码: $client->setHeader('User-Agent', 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/40.0.2214.111 Safari/537.36'); $client->getCookieJar()->set(�

php – 如何使用Goutte刮擦laravel 5.2?

我是Laravel 5.2的新手,我想抓一个网页.我开始知道它可以通过使用Goutte完成.并且在不知道如何使用它. 我已经安装了Laravel和Goutte,但是如何使用呢?如何设置控制器,路由和所有需要的东西?解决方法:我找到了答案. 我只是添加URL来路由并创建控制器 Route::resource('scrape','WebSc

php – Behat:Goutte / Guzzle通过cURL下载文件“警告:curl_setopt_array():3607不是有效的文件句柄资源”

使用Behat测试涉及下载文件的某些行为.使用Goutte和Guzzle来拦截文件下载,这样我就可以在另一个步骤中与它进行交互. //Where to put the file $tmpFile = 'download.zip'; $handle = fopen($tmpFile, 'w'); $goutteDriver = $this->getSession()->getDriver(); $goutteClient =

php – 如何在Guzzle中捕获cURL使用的IP?

我正在使用Goutte(内部使用Guzzle)进行网络抓取项目.我正在研究自定义速率限制器,因此我将所有HTTP操作存储到数据库表中,以便我可以检查是否在最近的时间范围内对主机进行了调用. 目前我正在使用gethostbyname将已知主机名转换为IP地址,但Guzzle已经进行了查找,因此这可能是浪费.

php – Goutte – dom crawler – 删除节点

我的网站上有html(http://testsite.com/test.php): <div class="first"> <div class="second"> <a href="/test.php">click</a> <span>back</span> </div> </div> <div class=&qu

如果数据是通过Javascript加载的,如何使用php Goutte和Guzzle进行爬网?

很多时候,当我们遇到问题时,我们会遇到使用Javascript生成页面上呈现的内容的问题,因此scrapy无法为其抓取(例如,ajax请求,jQuery)解决方法:你想看看phantomjs.有这个PHP实现: http://jonnnnyw.github.io/php-phantomjs/ 如果你需要让它与PHP一起工作当然. 你可以阅读页面,然后将内