没有合适的资源?快使用搜索试试~ 我知道了~
weebly-page-parser:使用jsoup的Weebly页面的常规解析器
共2个文件
java:1个
md:1个
需积分: 5 0 下载量 20 浏览量
2021-02-12
20:06:38
上传
评论
收藏 4KB ZIP 举报
温馨提示
weebly页面解析器 使用从未发布的Weebly页面提取内容的通用过程和解析器。 为什么? 我们遇到了这样一种情况,我们有两个使用Web托管平台Weebly(, )制作的网页,这些网页需要未发布,审阅,内部存档以及可能被删除。 我们没有找到一种简单的方法来使用Weebly或其他工具保存未发布站点的本地副本。 此过程和代码为未发布页面的半自动内容提取提供了基础。 它能做什么 照原样,此工具从每个页面提取4种文本:类博客内容的标题,段落文本内容,外部链接和嵌入式YouTube链接。 标题–网站上的某些页面像博客一样设置,因为在不同的日期都有大量独立的帖子撰写和发布。 每个帖子的名称将显示在“标题”部分。 博客文章的文本将在下一部分中,并且都应以相同的顺序进行,因此很容易将标题和文章的文本进行匹配。 段落内容–这应该是每个页面上显示的所有单词(博客标题,菜单等除外)。 有时段落标题
资源推荐
资源详情
资源评论
收起资源包目录
weebly-page-parser-master.zip (2个子文件)
weebly-page-parser-master
parser.java 4KB
README.md 6KB
共 2 条
- 1
资源评论
矢量边界
- 粉丝: 20
- 资源: 4608
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功