没有合适的资源?快使用搜索试试~ 我知道了~
PHP提取html尖括号中的内容,抓取页面内容的时候用得上。
资源推荐
资源详情
资源评论
preg_match("/(<([\w]+)[^>]*>)(.*)(<\/\\2>)/",$string,$match);
$content=trim($match[3]);
分享一个正则表达式,上述这个表达式可以提取字符串中两个尖括号之间的内容,用来提取HTML标签中的内容很方便;
目前我还没搞清楚这个正则的原理,不过$match[3]中存放的就是尖括号中的内容,比如
<td>你好</td>
$match[3]就等于"你好"。
int preg_match_all ( string pattern, string subject, array matches [, int flags] )
array matches 是一个数组,matches[0]表示匹配的字符串数组, 为第一个括号中的子模式所匹配的字符串组成的数组, 为第二个括号中的子模式所匹配的字符串组成的数组,和perl的正则里面的$1,$2,$3 类似
<?php
// \\2 是一个逆向引用的例子,其在 PCRE 中的含义是
// 必须匹配正则表达式本身中第二组括号内的内容,本例中
// 就是 ([\w]+)。因为字符串在双引号中,所以需要
// 多加一个反斜线。
$html = "<b>bold text</b><a href=howdy.html>click me</a>";
preg_match_all ("/(<([\w]+)[^>]*>)(.*)(<\/\\2>)/", $html, $matches);
for ($i=0; $i< count($matches[0]); $i++) {
echo "matched: ".$matches[0][$i]."\n";
echo "part 1: ".$matches[1][$i]."\n";
echo "part 2: ".$matches[3][$i]."\n";
echo "part 3: ".$matches[4][$i]."\n\n";
}
?>
$content=trim($match[3]);
分享一个正则表达式,上述这个表达式可以提取字符串中两个尖括号之间的内容,用来提取HTML标签中的内容很方便;
目前我还没搞清楚这个正则的原理,不过$match[3]中存放的就是尖括号中的内容,比如
<td>你好</td>
$match[3]就等于"你好"。
int preg_match_all ( string pattern, string subject, array matches [, int flags] )
array matches 是一个数组,matches[0]表示匹配的字符串数组, 为第一个括号中的子模式所匹配的字符串组成的数组, 为第二个括号中的子模式所匹配的字符串组成的数组,和perl的正则里面的$1,$2,$3 类似
<?php
// \\2 是一个逆向引用的例子,其在 PCRE 中的含义是
// 必须匹配正则表达式本身中第二组括号内的内容,本例中
// 就是 ([\w]+)。因为字符串在双引号中,所以需要
// 多加一个反斜线。
$html = "<b>bold text</b><a href=howdy.html>click me</a>";
preg_match_all ("/(<([\w]+)[^>]*>)(.*)(<\/\\2>)/", $html, $matches);
for ($i=0; $i< count($matches[0]); $i++) {
echo "matched: ".$matches[0][$i]."\n";
echo "part 1: ".$matches[1][$i]."\n";
echo "part 2: ".$matches[3][$i]."\n";
echo "part 3: ".$matches[4][$i]."\n\n";
}
?>
资源评论
w171432511
- 粉丝: 3
- 资源: 22
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功