#QueryList交流社区: [http://querylist.cc/](http://querylist.cc/)
#QueryList交流QQ群:123266961 <a target="_blank" href="http://shang.qq.com/wpa/qunwpa?idkey=a1b248ae30b3f711bdab4f799df839300dc7fed54331177035efa0513da027f6"><img border="0" src="http://pub.idqqimg.com/wpa/images/group.png" alt="╰☆邪恶 魔方☆" title="╰☆邪恶 魔方☆"></a>
#QueryList简介
***
QueryList是一个基于phpQuery的通用列表采集类,是一个简单、 灵活、强大的采集工具,采集任何复杂的页面 基本上就一句话就能搞定了。
#QueryList 使用
```php
//获取采集对象
$hj = QueryList::Query('http://www.baidu.com/s?wd=QueryList',array('title'=>array('h3','text'),'link'=>array('h3>a','href')));
//输出结果:二维关联数组
print_r($hj->data);
```
上面的代码实现的功能是采集百度搜索结果页面的所有搜索结果的标题和链接,然后分别以二维关联数组的格式输出。
###QueryList 静态方法
* **主方法**
>***Query***($page,array $regArr, $regRange = '', $outputEncoding = null, $inputEncoding = null,$removeHead = false)
一共有六个参数,后面四个参数是可选的,返回QueryList对象。
>$page
>>类型: **string**
>>说明: **必选参数,要抓取的网页URL地址(支持https),或者是html源代码;这意味着你可以直接传一个网址给QueryList,也可以将通过自己的方式获取到的并经过你自己处理过的HTML源码传给QueryList**
>$regArr
>>类型: **array**
>> 说明: **必选参数,选择器数组,格式array("名称"=>array("选择器","类型"[,"标签过滤列表"][,"回调函数"]),.......[,"callback"=>"全局回调函数"]);**
>>>+ **选择器**:可以为任意的jQuery选择器语法
>>>+ **类型**:值 "text" ,"html" ,"HTML标签属性"
>>>+ **标签过滤列表**:可选,当标签名前面添加减号(-)时(此时标签可以为任意的元素选择器),表示移除该标签以及标签内容;否则当 **类型** 值为text时表示需要保留的HTML标签,为html时表示要过滤掉的HTML标签。有减号与没有减号的区别就在于,有减号时会移除那个标签包括那个标签内的所有内容,没有减号时只会移除那个标签并不会移除标签内的内容
>>>+ **回调函数** / **全局回调函数**:可选,字符串(函数名) 或 数组(array("类名","类的静态方法"))或 匿名函数,回调函数应有俩个参数,第一个参数是选择到的内容,第二个参数是选择器数组下标,回调函数会覆盖全局回调函数
>$regRange
>>类型: **array**
>默认值: **''**
>说明: **可选参数,块选择器,指 先按照规则 选出 几个大块 ,然后再分别再在块里面 进行相关的选择**
>$outputEncoding
>>类型: **string**
>>默认值: **null**
>>可选值: **'UTF-8','GB2312'等**
>>说明: **可选参数,输出的编码格式,指要以什么编码输出(UTF-8,GB2312,.....),防止出现乱码,如果设置为 假值 则不改变原字符串编码**
>$inputEncoding
>>类型: **string**
>>默认值: **null**
>>可选值: **'UTF-8','GB2312'等**
>>说明: **可选参数,输入的编码格式,明确指定输入的页面编码格式(UTF-8,GB2312,.....),防止出现乱码,如果设置为 假值 则自动识别**
>$removeHead
>>类型: **bool**
>>默认值: **false**
>>可选值: **true,false**
>>说明: **可选参数,是否移除页面头部区域,乱码终极解决方案。(注意:设置为true后将采集不到head区域的内容!)**
* **运行QueryList扩展方法**
>***run($class,$args = array())***
>
>$class
>>类型: **string**
>>说明: **插件名称**
>$args
>>类型: **mix**
>>说明: **参数**
###QueryList 属性
* **得到多维数组格式的采集结果**
>***data***
###QueryList 方法
* **重新设置选择器**
>void ***setQuery***(array $regArr, $regRange = '',$outputEncoding = null, $inputEncoding = null,$removeHead = false)
一共两个参数,第二个参数是可选的,参数意义同构造函数。
##QueryList 依赖库
```
phpQuery
```
phpQuery项目主页:[https://code.google.com/p/phpquery/](https://code.google.com/p/phpquery/)
##其它说明
QueryList 内置的只是简单的源码抓取方法,遇到更复杂的抓取情况,如:需要登陆
身份验证 时,请配合其它的PHP的HTTP类来使用,通过将辅助的HTTP类抓取到的网页源码传给QueryList即可。
##DEMO站
<s>
微动态:[http://querylist.jaekj.com/](http://querylist.jaekj.com/)
* thinkphp版本:V3.1.2
* QueryList版本:V1.6
* 后台地址: /admin
* 后台账号密码: guest guest
</s>
这个demo站实现的功能相当于一个轻量级的微博站,内容全自动采集更新,可以自定义时间间隔采集任意站点的信息,自动更新到这个站点来,只需要在后台规则库简单的添加一条规则就可以实现全自动采集了,大家可以自行进入后台进行尝试,体验QueryList的魅力!
冷云搞笑:[http://x.44i.cc/](http://x.44i.cc/)
##作者信息
```
Author : Jaeger
Email : hj.q@qq.com
交流QQ群:123266961
```
没有合适的资源?快使用搜索试试~ 我知道了~
PHP实例开发源码-阿里蜘蛛池 php版.zip
共1940个文件
jpg:1679个
png:88个
php:76个
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 72 浏览量
2022-11-23
16:24:47
上传
评论
收藏 14.27MB ZIP 举报
温馨提示
PHP实例开发源码—阿里蜘蛛池 php版.zip PHP实例开发源码—阿里蜘蛛池 php版.zip PHP实例开发源码—阿里蜘蛛池 php版.zip
资源推荐
资源详情
资源评论
收起资源包目录
PHP实例开发源码-阿里蜘蛛池 php版.zip (1940个子文件)
ueditor.css 44KB
ueditor.min.css 34KB
css.css 14KB
css.css 14KB
install.css 5KB
public.css 5KB
public.css 4KB
page.css 2KB
page.css 2KB
lhgcalendar.css 2KB
dialogbase.css 2KB
pageGroup.css 780B
pageGroup.css 740B
iframe.css 42B
qqwry.dat 8.84MB
load.gif 188KB
chilun.gif 128KB
icons.gif 20KB
icons-all.gif 4KB
loading.gif 3KB
videologo.gif 2KB
cancelbutton.gif 1KB
button-bg.gif 1KB
lock.gif 1KB
word.gif 1019B
loading.gif 734B
i_ok.gif 679B
d_a_bg.gif 674B
error.gif 616B
correct.gif 536B
d_t_bg.gif 453B
cursor_v.gif 370B
i_mng.gif 369B
gth.gif 345B
i_c_bbg.gif 335B
cursor_h.gif 253B
i_index.gif 226B
i_c_tbg.gif 193B
anchor.gif 184B
date.gif 153B
highlighted.gif 111B
unhighlighted.gif 111B
d_h_bg.gif 101B
pagebreak.gif 54B
spacer.gif 43B
.gitignore 29B
.htaccess 264B
shouye.html 40KB
map.html 32KB
neirong.html 13KB
shouye.html 12KB
neirong.html 4KB
index.html 3KB
favicon.ico 1KB
logBanner.jpg 256KB
i_hd_bg.jpg 202KB
thumb.jpg 193KB
thumb.jpg 119KB
i_loadin.jpg 93KB
i_c_icon.jpg 36KB
logo.jpg 35KB
Mobile_thumb.jpg 23KB
Baidu_thumb.jpg 22KB
wellcom.jpg 21KB
Google_thumb.jpg 19KB
Sogou_thumb.jpg 19KB
Haosou_thumb.jpg 18KB
Yahoo_thumb.jpg 18KB
Bing_thumb.jpg 17KB
i_t_btn.jpg 9KB
i_ok.jpg 8KB
i_gth.jpg 5KB
Ndn19JRf.jpg 4KB
JZv3nTbl.jpg 4KB
nt1nprbv.jpg 4KB
3vFX7J73.jpg 4KB
qcSma22i.jpg 4KB
1lx5B9z9.jpg 4KB
GqEwW20y.jpg 4KB
N3Ljbx7h.jpg 4KB
2Y8MqQ2w.jpg 4KB
RNBLx5P5.jpg 4KB
XH3NTuF6.jpg 4KB
7bzvX9tf.jpg 4KB
j7XXD1fX.jpg 4KB
HX1Lfhrf.jpg 4KB
5JL75bhv.jpg 4KB
LznRnPnB.jpg 4KB
PNL5FpfJ.jpg 4KB
93rxR1Jb.jpg 4KB
jFHv975p.jpg 4KB
hH7FBdXJ.jpg 4KB
L19rH1VH.jpg 4KB
pvNVVXdP.jpg 4KB
0mqQUiC8.jpg 4KB
H5xpvvvB.jpg 4KB
5N5p977t.jpg 4KB
1vbv9Nhl.jpg 4KB
5jZ3xZRn.jpg 4KB
nNf5zJZ7.jpg 4KB
共 1940 条
- 1
- 2
- 3
- 4
- 5
- 6
- 20
资源评论
毕业_设计
- 粉丝: 1940
- 资源: 1万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功