php解析html页面的函数库之一,操作类似于原生js和jquery,主要用于采集html页面和解析node节点。simple_html_dom的常用操作: include 'simple_html_dom.php'; //面向过程方式2种读取方式 $html = file_get_html('http://www.baidu.com'); $html = str_get_html(file_get_contents('http://www.baidu.com')); //面向对象方式2种读取方式 $html = new simple_html_dom(); $html->load_file('http://www.baidu.com'); $html->load(file_get_contents('http://www.baidu.com')); foreach($html->find('img') as $img) { print_r($img->src)."<br>"; } simple_html_dom主打find方法,如果find只有一个参数其查找到的元素一般以对象数组的方式进行遍历;如果添加第二个参数表示索引则返回一个元素,如下: echo "<pre>"; print_r($html->find('img', 0)->src); echo "</pre>"; simple_html_dom的find方法参数一与jquery的模式基本一致,可以使用条件搜索,返回的变量e是一个对象,具有以下几类属性: $e->tag 与原生js的tagName对应,jquery的$(e).attr('nodeName')对应 $e->outertext 与原生js的outerHTML对应,jquery的$(e).attr('outerHTML')对应 $e->innertext 与原生js的innerHTML对应,jquery的$(e).attr('innerHTML')或$(e).html()对应 $e->plaintext 与原生js的innerText对应,jquery的$(e).attr('innerText')或$(e).text()对应 常用的方法如下: mixed $e->children(index) index为索引序号,返回第n个子节点对象 element $e->parent() 返回父节点对象 element $e->first_child() 返回第一个子节点对象 element $e->last_child() 返回最后一个子节点对象 element $e->next_sibling() 返回下一个邻节点对象 element $e->prev_sibling() 返回上一个邻节点对象 功能虽然发现的不多,但对应一般的html解析已经足够。如果需要解析大量html建议使用$html->clear()释放内存。
- mjyzy2015-11-15挺好挺实用的
- hancheng2015-06-10不要分,就是好。这个类还是很快了,自己对CURL再改一下更远 快
- 粉丝: 1
- 资源: 11
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- Fortran语言语法快速入门.pdf
- 明日方舟 年 鼠标指针.rar
- 全国银行经济监管可视化系统
- e商小二-供应链管理物流交仓创业商业计划书.rar
- Edge浏览器下载文件提示 “无法安全下载” 的解决方法
- 基于springboot+layui的医院日常耗材管理系统.zip
- Emkex亿迈克思新型互联网磁材供应链商业计划书.rar
- 计算机毕业设计-ASP.NET某店POS积分管理系统-销售情况,会员卡再发行数据生成(源代码+)-毕设源码实例.zip
- 计算机毕业设计-asp.net某店POS积分管理系统-清除履历表、日志表、月购买额(源代码+)-毕设源码实例.zip
- 计算机毕业设计-ASP.NET某店POS积分管理系统-积分实绩更新及销售状况统计(源代码+)-毕设源码实例.zip