#QueryList交流社区: [http://querylist.cc/](http://querylist.cc/)
#QueryList交流QQ群:123266961 <a target="_blank" href="http://shang.qq.com/wpa/qunwpa?idkey=a1b248ae30b3f711bdab4f799df839300dc7fed54331177035efa0513da027f6"><img border="0" src="http://pub.idqqimg.com/wpa/images/group.png" alt="╰☆邪恶 魔方☆" title="╰☆邪恶 魔方☆"></a>
#QueryList简介
***
QueryList是一个基于phpQuery的通用列表采集类,是一个简单、 灵活、强大的采集工具,采集任何复杂的页面 基本上就一句话就能搞定了。
#QueryList 使用
```php
//获取采集对象
$hj = QueryList::Query('http://www.baidu.com/s?wd=QueryList',array('title'=>array('h3','text'),'link'=>array('h3>a','href')));
//输出结果:二维关联数组
print_r($hj->data);
```
上面的代码实现的功能是采集百度搜索结果页面的所有搜索结果的标题和链接,然后分别以二维关联数组的格式输出。
###QueryList 静态方法
* **主方法**
>***Query***($page,array $regArr, $regRange = '', $outputEncoding = null, $inputEncoding = null,$removeHead = false)
一共有六个参数,后面四个参数是可选的,返回QueryList对象。
>$page
>>类型: **string**
>>说明: **必选参数,要抓取的网页URL地址(支持https),或者是html源代码;这意味着你可以直接传一个网址给QueryList,也可以将通过自己的方式获取到的并经过你自己处理过的HTML源码传给QueryList**
>$regArr
>>类型: **array**
>> 说明: **必选参数,选择器数组,格式array("名称"=>array("选择器","类型"[,"标签过滤列表"][,"回调函数"]),.......[,"callback"=>"全局回调函数"]);**
>>>+ **选择器**:可以为任意的jQuery选择器语法
>>>+ **类型**:值 "text" ,"html" ,"HTML标签属性"
>>>+ **标签过滤列表**:可选,当标签名前面添加减号(-)时(此时标签可以为任意的元素选择器),表示移除该标签以及标签内容;否则当 **类型** 值为text时表示需要保留的HTML标签,为html时表示要过滤掉的HTML标签。有减号与没有减号的区别就在于,有减号时会移除那个标签包括那个标签内的所有内容,没有减号时只会移除那个标签并不会移除标签内的内容
>>>+ **回调函数** / **全局回调函数**:可选,字符串(函数名) 或 数组(array("类名","类的静态方法"))或 匿名函数,回调函数应有俩个参数,第一个参数是选择到的内容,第二个参数是选择器数组下标,回调函数会覆盖全局回调函数
>$regRange
>>类型: **array**
>默认值: **''**
>说明: **可选参数,块选择器,指 先按照规则 选出 几个大块 ,然后再分别再在块里面 进行相关的选择**
>$outputEncoding
>>类型: **string**
>>默认值: **null**
>>可选值: **'UTF-8','GB2312'等**
>>说明: **可选参数,输出的编码格式,指要以什么编码输出(UTF-8,GB2312,.....),防止出现乱码,如果设置为 假值 则不改变原字符串编码**
>$inputEncoding
>>类型: **string**
>>默认值: **null**
>>可选值: **'UTF-8','GB2312'等**
>>说明: **可选参数,输入的编码格式,明确指定输入的页面编码格式(UTF-8,GB2312,.....),防止出现乱码,如果设置为 假值 则自动识别**
>$removeHead
>>类型: **bool**
>>默认值: **false**
>>可选值: **true,false**
>>说明: **可选参数,是否移除页面头部区域,乱码终极解决方案。(注意:设置为true后将采集不到head区域的内容!)**
* **运行QueryList扩展方法**
>***run($class,$args = array())***
>
>$class
>>类型: **string**
>>说明: **插件名称**
>$args
>>类型: **mix**
>>说明: **参数**
###QueryList 属性
* **得到多维数组格式的采集结果**
>***data***
###QueryList 方法
* **重新设置选择器**
>void ***setQuery***(array $regArr, $regRange = '',$outputEncoding = null, $inputEncoding = null,$removeHead = false)
一共两个参数,第二个参数是可选的,参数意义同构造函数。
##QueryList 依赖库
```
phpQuery
```
phpQuery项目主页:[https://code.google.com/p/phpquery/](https://code.google.com/p/phpquery/)
##其它说明
QueryList 内置的只是简单的源码抓取方法,遇到更复杂的抓取情况,如:需要登陆
身份验证 时,请配合其它的PHP的HTTP类来使用,通过将辅助的HTTP类抓取到的网页源码传给QueryList即可。
##DEMO站
<s>
微动态:[http://querylist.jaekj.com/](http://querylist.jaekj.com/)
* thinkphp版本:V3.1.2
* QueryList版本:V1.6
* 后台地址: /admin
* 后台账号密码: guest guest
</s>
这个demo站实现的功能相当于一个轻量级的微博站,内容全自动采集更新,可以自定义时间间隔采集任意站点的信息,自动更新到这个站点来,只需要在后台规则库简单的添加一条规则就可以实现全自动采集了,大家可以自行进入后台进行尝试,体验QueryList的魅力!
冷云搞笑:[http://x.44i.cc/](http://x.44i.cc/)
##作者信息
```
Author : Jaeger
Email : [email protected]
交流QQ群:123266961
```
没有合适的资源?快使用搜索试试~ 我知道了~
PHP实例开发源码-咖啡蜘蛛池 php版.zip
共2000个文件
jpg:1741个
png:211个
gif:157个
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 15 浏览量
2022-11-22
12:53:17
上传
评论
收藏 17.69MB ZIP 举报
温馨提示
PHP实例开发源码—咖啡蜘蛛池 php版.zip PHP实例开发源码—咖啡蜘蛛池 php版.zip PHP实例开发源码—咖啡蜘蛛池 php版.zip
资源推荐
资源详情
资源评论
收起资源包目录
PHP实例开发源码-咖啡蜘蛛池 php版.zip (2000个子文件)
pinyin.php.bak 16KB
bootstrap.css 104KB
bootstrap.css 104KB
bootstrap.css 104KB
style_7_common.css 78KB
style_7_forum_viewthread.css 54KB
jiathis_share.css 47KB
jiathis_share.css 47KB
jiathis_share.css 47KB
ueditor.css 44KB
content.css 35KB
content.css 35KB
content.css 35KB
ueditor.min.css 34KB
lib1.css 30KB
lib1.css 30KB
lib1.css 30KB
base.css 30KB
base.css 30KB
base.css 30KB
style_7_forum_forumdisplay.css 29KB
home.css 27KB
bootstrap-responsive.css 24KB
bootstrap-responsive.css 24KB
bootstrap-responsive.css 24KB
stylet.css 21KB
stylet.css 21KB
stylet.css 21KB
read.css 19KB
read.css 19KB
read.css 19KB
common.css 18KB
common.css 18KB
common.css 18KB
titleBar.css 17KB
titleBar.css 17KB
titleBar.css 17KB
sw.css 15KB
sw.css 15KB
sw.css 15KB
css.css 14KB
css.css 14KB
dedecms.css 14KB
dedecms.css 14KB
dedecms.css 14KB
common.css 14KB
common.css 14KB
common.css 14KB
stylelist.css 13KB
stylelist.css 13KB
stylelist.css 13KB
pindao.css 12KB
style.css 11KB
style.css 11KB
style.css 11KB
style.css 11KB
style.css 11KB
style.css 11KB
2014news.css 10KB
newsV3.css 10KB
newsV3.css 10KB
newsV3.css 10KB
2014news.css 10KB
2014news.css 10KB
ningmp.css 10KB
bdsstyle.css 10KB
bdsstyle.css 10KB
bdsstyle.css 10KB
bdsstyle.css 10KB
bdsstyle.css 10KB
imgshare.css 10KB
imgshare.css 10KB
imgshare.css 10KB
bdsstyle.css 9KB
shCoreDefault.css 9KB
patch.css 8KB
index.css 6KB
index.css 6KB
index.css 6KB
install.css 5KB
titlelist.css 5KB
titlelist.css 5KB
titlelist.css 5KB
indexz.css 5KB
indexz.css 5KB
indexz.css 5KB
public.css 5KB
share_popup.css 4KB
share_popup.css 4KB
share_popup.css 4KB
jiathis_counter.css 4KB
jiathis_counter.css 4KB
jiathis_counter.css 4KB
share_style1_16.css 4KB
share_style1_16.css 4KB
share_style1_16.css 4KB
nav.css 4KB
nav.css 4KB
nav.css 4KB
share_style0_16.css 4KB
共 2000 条
- 1
- 2
- 3
- 4
- 5
- 6
- 20
资源评论
毕业_设计
- 粉丝: 1935
- 资源: 1万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- n.cpp
- jdk-8u411-windows-x64下载安装可用
- vgg模型-图像分类算法对水果识别-不含数据集图片-含逐行注释和说明文档.zip
- KMP算法(Knuth-Morris-Pratt算法
- vgg模型-python语言pytorch框架训练识别化妆品分类-不含数据集图片-含逐行注释和说明文档.zip
- KMP算法(Knuth-Morris-Pratt算法
- shufflenet模型-基于人工智能的卷积网络训练识别狗的表情-不含数据集图片-含逐行注释和说明文档.zip
- shufflenet模型-python语言pytorch框架训练识别张嘴闭嘴-不含数据集图片-含逐行注释和说明文档.zip
- resnet模型-基于人工智能的卷积网络训练识别面部表情识别-不含数据集图片-含逐行注释和说明文档
- resnet模型-python语言pytorch框架训练识别香蕉品质-不含数据集图片-含逐行注释和说明文档.zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功