首页 > TAG信息列表 > simple-html-dom

php-如何在两个特定关键字中获取html文件的所有文本

我有一个html文件和两个关键字,我想获取位于这两个关键字内的所有文本.我应该使用正则表达式吗?我想将这两个关键字用作输入. 如果您举个例子,将会很有帮助.解决方法:是的,使用正则表达式:keyword1(.*?)keyword2. PHP示例: preg_match_all('/'.$kwdOne.'(.*?)'.$kwdTwo.'/s', $str, $m

php-foreach仅查找数组的最后一个元素

我试图获取数组的所有值,但仅获取最后一个元素. (最后的描述和最后的链接). 这是代码: $content = str_get_html($html); $links = $content->find('.myclass a'); foreach($links as $k => $v) { $descr= $v-> plaintext; $link_to= $v->href; $a=array(

php-特定于HTML表格的抓取

我正在尝试使用PHP刮取一个表,但事实是我设法刮了它,但是我在网页的表上得到了所有东西.我不确定如何指定要抓取的TD和/或TR. 这是PHP代码 <?php include("simple_html_dom.php"); $html=file_get_html("http://www.premierleague.com/en-gb/matchday/league-table.html"); $html=

php-使用简单的html dom获取链接

我正在尝试从网站获取链接. “ http://www.perfumesclub.com/es/perfume/mujer/c/” 为此,在简单的html Sun中使用“ user-agent”. 但是我得到这个错误.. Fatal error: Call to a member function find() on string in C:\Users\Desktop\www\funciones.php on line 448 这是我的

PHP-SimpleHTMLDom:调用数组中的成员函数find()

所以我想在大型html页面中循环通过特定的TD.我正在使用simplehtmldom来实现这一目标.问题是,如果不将所有步骤都放在foreach中,我将无法使其工作. 这是我的PHP include('../inc/simple_html_dom.php'); $html = file_get_html("http://www.bjork-family.com/f43-london-stories");

php-在39个结果后删除txt文件中的数据

目前,我正在使用以下内容将网址写入txt文件. $data['url'] = $element->href; $data['image'] = $image->content; $data['title'] = $title2->plaintext; $data['genre'] = $genre->plaintext; file_put_contents('do

如何使用PHP Simple HTML DOM Parser添加自定义属性

我正在一个需要使用PHP Simple HTML Dom Parser的项目中工作,我需要一种基于类名将自定义属性添加到许多元素的方法. 我可以使用foreach循环遍历元素,并且设置标准属性(例如href)很容易,但是我找不到添加自定义属性的方法. 我能猜到的最接近的是: foreach($html -> find(".myelems"

PHP获取网页内容

因此,我正在使用PHP Simple HTML DOM Parser来获取网页的内容.在我知道自己所做的事情是对的之后,我仍然得到一个错误,那就是找不到任何东西. 因此,这就是我用来查看是否确实有任何东西被捕获的原因: <?php include_once('simple_html_dom.php'); error_reporting(E_ALL); ini_set

只有用PHP显示的第一个标题词

所以我试图在我的另一个网站上显示一个列表,一切正常,但只存储了’title’属性的第一个单词.我知道整个标题是从其他网站检索的,所以如何让它存储所有这些. 这是代码,如果它有帮助. <?php include "simple_html_dom.php"; $page = file_get_html("http://www.blade-edge.com/image

PHP简单HTML DOM解析器的字符编码问题

我正在使用PHP Simple HTML DOM Parser http://simplehtmldom.sourceforge.net/从其他域获取页面标题,元描述和元标记等数据,然后将其插入数据库. 但我有一些编码问题.问题是我没有从那些不是英语的网站上得到正确的字符. 以下是代码: <?php require 'init.php'; $curl = new curl

php – 如何使用Simple-HTML-DOM提取完整的子链接?

以下是我用来从页面中提取子链接的基本代码: <?php include_once('simple_html_dom.php'); function extract_links($target_url) { $html = new simple_html_dom(); $html->load_file($target_url); $i=0; $crawl =array();

php简单的html dom解析img html5属性?

如何使用simple html dom解析img html5属性:data-original $htmls = '<img class="lazy" alt="Nubifragio a Verbania , ferite 2 turiste Gravi danni, chiesto stato di calamità foto" title="Nubifragio a Verbania , ferite 2 turiste Gr

php – 如何使用简单的html dom打印表格的单元格

我有这个HTML代码.我使用Simple HTML Dom将数据解析为我自己的php脚本. <table> <tr> <td class="header">Name</td> <td class="header">City</td> </tr> <tr> <td class="tex

如何使用CURL和PHP简单的HTML DOM解析器与对象

使用CURL从网站获取内容.在对象中获得响应.如何将该对象转换为PHP Simple HTML DOM Parser      function get_data($url) { $ch = curl_init(); $timeout = 30; curl_setopt($ch,CURLOPT_URL,$url); curl_setopt($ch,CURLOPT_RETURNTRANSFER,false); cu

PHP Simple HTML DOM属性列表

simple_html_dom库非常适合获取已知属性,但是有没有办法获取元素的所有属性列表? 例如,如果我有: <div id="test" custom1="custom" custom2="custom"> 我很容易得到id: $el = $html->find('div'); $id = $el->id; 但是,如果不提前知道custom1和custom2是否可能?理想情况下,该解决

如何通过任何爬虫PHP获取悬停数据(ajax)

我正在抓取一个网站的数据.我能够在一个页面上完整的内容.但页面上的一些数据是在悬停在某些图标上并显示为工具提示之后出现的.所以我也需要这些数据.是否可以使用任何爬虫. 我正在使用PHP和simplehtmldom来解析/抓取页面.解决方法:任何抓取工具都无法获取悬停数据. 爬网程序抓取

php – 同时执行三个功能

我有三个这样的函数sript php: public function a($html,$text) { //blaa return array(); } public function b($html,$text){ //blaa return array(); } public function c($html,$text){ //blaa return array(); } require_once 'simple_html_dom.php'; $a=a

php – 属性中的简单HTML DOM通配符

我有以下标签 <div class="col *">Text</div> *是什么. 我想使用Simple HTML DOM得到所有带有class属性的div标签包含col(如我的例子中所示).解决方法:由于Simple HTML DOM已经有一种方法可以选择包含特定值和/或其他内容的属性.例如 $html->find("div[class*=col]", 0)->outer

PHP Simple Html Dom获取div的纯文本,但避免使用所有其他标记

我使用PHP Simple Html Dom来获取一些HTML,现在我有一个像跟随代码的html dom,我需要获取纯文本内部div,但避免使用p标签及其内容(仅返回111111),谁可以帮助我?谢谢提前! <div> <p>00000000</p> 111111 <p>22222222</p> </div> 解决方法:这取决于你的意思是“避免使用p

PHP:simple_html_dom – 如何查找不在某个类中的元素?

我在PHP中使用simple_html_dom来获取html页面中的所有A-tags.但有些标签位于div内部,应该被忽略. 我想我需要这样的东西: $htmldom-> find(“!div [class = blabla] a”); 我发现我可以使用[attribute!= value]来指定没有特定属性值的元素,但是这对于元素有什么作用呢?解决方法:你基本

php – 使用Simple HTML DOM Parser按ID查找表

去年我写了一个数据库播种器,它刮掉了一个统计网站.在重新访问我的代码后,它似乎不再起作用了,我对它的原因感到有点难过. $html-> find()应该返回找到的元素数组,但是它似乎只是在使用时找到第一个表. 根据文档,我尝试使用find()并指定每个表的ID,但这似乎也失败了. $table_passi

javascript – 他们是如何做到这一点的?模态书签和即时抓取?

我希望用户从书签中打开弹出窗口,但页面加载的方式类似于jquery模式 – 这意味着没有丑陋的浏览器边框. 请参阅此处的示例,亚马逊如何做到这一点? http://www.amazon.co.uk/wishlist/get-button 此外,他们显然是在抓取页面来获取信息,但页面加载几乎是即时的,他们是否缓存用户以某种

php – 如何设置Simple_HTML_DOM输出的样式

我使用Simple HTML DOM Parser使用以下代码获取图像及其URL: <?php include_once('simple_html_dom.php'); $url = "http://www.tokyobit.com"; $html = new simple_html_dom(); $html->load_file($url); foreach($html->find('img&#

使用DOM PHP Web爬网程序从外部站点选择性地提取数据

我有这个PHP dom网络爬虫,工作正常.它从(外部)论坛网站到我的页面提取提到的标签及其链接. 但最近我遇到了一个问题.喜欢 这是论坛数据的HTML :: <tbody> <tr> <td width="1%" height="25">&nbsp;</td> <td width="64%" height="25" class="Foot

php – 使用Simple HTML Dom获取所有HTML列表元素

目前我正在开展一个项目,要求我从另一个网站解析一些数据,我遇到了一些问题(注意我对PHP编码很新.) 这是我在其返回的内容下面使用的代码. $dl = $html2->find('ol.tracklist',0); print $dl = $dl->outertext; 上面的代码返回我们想要得到的数据,如果你想看到click here,它会在