没有合适的资源?快使用搜索试试~ 我知道了~
AddressCrawer:全国各城市地名抓取,包含街道、村落、小区、商店、景点等
共3个文件
md:1个
py:1个
gitignore:1个
需积分: 19 9 下载量 15 浏览量
2021-05-14
04:14:33
上传
评论
收藏 3KB ZIP 举报
温馨提示
AddressCrawer 全国各城市地名抓取,包含街道、村落、小区、商店、景点等 博客链接: 之前做命名实体识别地址时,因为丽江很多地名比较奇怪,不能直接用pyltp提取,准备添加自定义字典,增加地址提取准确率。 地址数据源: 这里以丽江为例,其他地方的地名爬取原理一样的。 获取地址分类: // 当前页面地址:http://poi.mapbar.com/lijiang/901/ // css选择器 $(".sortBox a") // init(211) [a#520, a#530, a#541, a $(".sortBox a")[0][removed] // "超市" $(".sortBox a")[0].href // "http://poi.mapbar.com/lijiang/520/" 提取地名: // 提取某个分类下所有地名标签 // css选择器 $(".sortC a
资源推荐
资源详情
资源评论
收起资源包目录
AddressCrawer-master.zip (3个子文件)
AddressCrawer-master
address_crawer.py 1KB
README.md 2KB
.gitignore 1KB
共 3 条
- 1
资源评论
空气安全讲堂
- 粉丝: 41
- 资源: 4795
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 三维装箱问题(Three-Dimensional Bin Packing Problem,3D-BPP)是一个经典的组合优化问题
- 以下是一些关于Linux线程同步的基本概念和方法.txt
- 以下是一个简化的示例,它使用pygame库来模拟烟花动画的框架.txt
- Linux线程同步机制深度解析与实用指南.zip
- PTA题库C语言解题策略与实战.rar
- SVPWM控制技术的simulink建模与仿真【包括simulink模型,参考文献,操作步骤】
- AI高清修复图片画质易语言易语言源码易语言填表
- 映射窗口.ec易语言易语言模块CPU占用0%游戏监控窗口监控
- 易语言 361窗口模块高效、便捷、自封装、自用
- 易语言 窗口排列 模块 ,简单、高效、体积小
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功