没有合适的资源?快使用搜索试试~ 我知道了~
DAG_text:有向无环图在大文本匹配N多关键字中的应用
共5个文件
java:4个
md:1个
需积分: 10 0 下载量 93 浏览量
2021-04-30
02:44:39
上传
评论
收藏 5KB ZIP 举报
温馨提示
问题 文本中匹配关键字,正则表达式决定是首选,可是如果是下面的情况呢? 需要同时匹配的关键字,数量有成千上万个 文本超大,需要将每个位置的关键字都标记出来 然后你就会看到很多OOM...... 有向无环图 在中,如果一个从任意顶点出发无法经过若干条边回到该点,则这个图是一个有向无环图(DAG图)。 将所有需要匹配的关键字按照如上结构加入图中 步骤 初始化图指针指向图的第一列位置 开始遍历文本字节序 发现当前字节匹配图指向列中的任意字符时,缓存子图搜索路径(当前文本位置,当前图指针的下一列位置) 遍历所有子图搜索路径,匹配当前字符,如果发现字符与当前路径不匹配,则删除路径。否则更新当前子图搜索路径(图指针的下一列位置) 如果发现路径已经到达结尾处,则将文本开始位置到当前位置的关键字提取出来 循环2-5 得到的关键字可能内嵌、交叉、相邻,需要考虑贪婪匹配 性能 上万关键字大文本提取百万qps
资源推荐
资源详情
资源评论
收起资源包目录
DAG_text-master.zip (5个子文件)
DAG_text-master
src
com
example
DAG_text
Node.java 621B
Keyword.java 1KB
Graphs.java 3KB
Test.java 1KB
README.md 1KB
共 5 条
- 1
资源评论
八普
- 粉丝: 34
- 资源: 4551
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功