# Check_Info
基于 **KMP** 算法实现的 **文本** 和 **网页** **敏感信息检测** api。
## - Description
- 基于 **springboot** 框架实现,敏感词信息使用mysql数据库储存,用kmp字符串匹配算法查询目标内容中的敏感词。
- 使用 **JPA** 实现了敏感词数据库的增删改查操作,但没有做出引用,按自己需求实现controller层代码即可。
- 使用封装了 **jsonp** 中的一些方法实现了解析指定url的html内容。
- url 中敏感信息匹配的实现是使用正则表达式过滤掉 **标签,空格,换行** 后进行的,可以根据需求修改正则规则实现自己想要的效果。
## - ResType
- **文本敏感词检测**
| **请求地址** | http://domain/Check/Text |
| :------: | :--------------------------------------: |
| **请求方式** | **POST** |
| **请求示例** | {"content": "test嗷嗷傻逼,sb"} |
| **返回格式** | **JSON** |
| **返回示例** | {"code":200,"msg":"匹配成功","data":{"res_idx":[{"first":"test","second":0},{"first":"sb","second":9},{"first":"傻逼","second":7}],"res_times":[{"first":"test","second":1},{"first":"sb","second":1},{"first":"傻逼","second":1}]}} |
**注:res_idx 中 first 为敏感词,second 为第一次出现的位置下标;res_times 中 first 为敏感词,second 为出现次数。**
- **url敏感词检测**
| 请求地址 | http://domain/Check/Url |
| :------: | :--------------------------------------: |
| **请求方式** | **POST** |
| **请求示例** | {"url": "http://domain/"} |
| **返回格式** | **JSON** |
| **返回示例** | {"code":200,"msg":"获取成功","data":{"test":7}} |
**注:返回的data中格式为 "铭感词" : "出现次数" 。**
没有合适的资源?快使用搜索试试~ 我知道了~
基于KMP算法实现的敏感信息检测.zip
共5个文件
md:2个
txt:1个
license:1个
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 55 浏览量
2024-05-23
21:22:14
上传
评论
收藏 7KB ZIP 举报
温馨提示
kmp算法 KMP算法是三位学者在 Brute-Force算法的基础上同时提出的模式匹配的改进算法。Brute- Force算法在模式串中有多个字符和主串中的若干个连续字符比较都相等,但最后一个字符比较不相等时,主串的比较位置需要回退。KMP算法在上述情况下,主串位置不需要回退,从而可以大大提高效率 字符串的模式匹配 字符串的模式匹配是一种常用的运算。所谓模式匹配,可以简单地理解为在目标(字符串)中寻找一个给定的模式(也是字符串),返回目标和模式匹配的第一个子串的首字符位置。通常目标串比较大,而模式串则比较短小 模式匹配的类型 (1)精确匹配 如果在目标T中至少一处存在模式P,则称匹配成功,否则即使目标与模式只有一个字符不同也不能称为匹配成功,即匹配失败。给定一个字符或符号组成的字符串目标对象T和一个字符串模式P,模式匹配的目的是在目标T中搜索与模式P完全相同的子串,返回T和P匹配的第一个字符串的首字母位置 (2)近似匹配 如果模式P与目标T(或其子串)存在某种程度的相似,则认为匹配成功。常用的衡量字符串相似度的方法是根据一个串转换成另一个串所需的基本操作数目来确定。基本操作由字符串
资源推荐
资源详情
资源评论
收起资源包目录
基于KMP算法实现的敏感信息检测.zip (5个子文件)
Check_Info-master
LICENSE 11KB
.gitignore 350B
README.en.md 853B
README.md 2KB
新建文本文档.txt 2KB
共 5 条
- 1
资源评论
野生的狒狒
- 粉丝: 3393
- 资源: 2436
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功