没有合适的资源?快使用搜索试试~ 我知道了~
CorpusMaker:提取Web社区的语料库
共8个文件
py:5个
gitignore:1个
md:1个
需积分: 9 0 下载量 87 浏览量
2021-05-19
05:43:08
上传
评论
收藏 5KB ZIP 举报
温馨提示
语料库 提取Web社区的语料库 如何使用 安装 当前未作为软件包提供 git clone 将CorpusMaker模块复制到Python外部模块路径 依存关系 请求( ) 正则表达式( ) lxml( ) libextract.api( ) 使用例 from CorpusMaker import cr , utils spider = cr . Spider ( "http://wonjaekim.com" , "wonjaekim.com" , "cr.db" ) spider . nstep ( 20 ) utils . combine ( "cr.db" )
资源推荐
资源详情
资源评论
收起资源包目录
CorpusMaker-master.zip (8个子文件)
CorpusMaker-master
utils.py 344B
cr.py 4KB
profit.py 233B
LICENSE 1KB
__init__.py 0B
.gitignore 735B
cleanhtml.py 640B
README.md 619B
共 8 条
- 1
资源评论
Aurora曙光
- 粉丝: 121
- 资源: 4528
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功