没有合适的资源?快使用搜索试试~ 我知道了~
fddc-extraction-release
共15个文件
py:9个
txt:3个
gitignore:1个
需积分: 9 0 下载量 172 浏览量
2021-04-29
13:27:02
上传
评论
收藏 16KB ZIP 举报
温馨提示
FDDC2018金融算法挑战赛02-A股上市公司公告信息抽取 基本信息 config: 目录包含一些配置文件 docparser: 实现对文档的解析,主要是对HTML文件的解析,解析HTML中的文本段落和表格信息 extract: 实现信息抽取器,主要基于docparser解析后的结果进行信息抽取,这里主要实现了增减持项目的抽取器 ner: 封装实现 NER打标签的工具 utils: 实现一些功能性组件 app.py: 主函数,实现对某篇HTML文件或某个目录下HTML文件的信息抽取 requirements.txt: pip 的相关依赖列表 运行方法 运行python环境为: python3.6 NER部分采用 需要下载相关模型文件并在app.py中配置相关模型目录路径 ner_model_dir_path # 安装相关依赖 pip install -r requirements.tx
资源推荐
资源详情
资源评论
收起资源包目录
fddc-extraction-release-master.zip (15个子文件)
fddc-extraction-release-master
docparser
HTMLParser.py 5KB
__init__.py 22B
app.py 3KB
config
ner_com_blacklist.txt 64B
ZengJianChiConfig.json 1KB
result.txt 890B
extract
ZengJianChiExtractor.py 20KB
__init__.py 22B
requirements.txt 72B
.gitignore 1KB
README.md 958B
utils
__init__.py 22B
TextUtils.py 2KB
ner
NERTagger.py 6KB
__init__.py 23B
共 15 条
- 1
资源评论
普通网友
- 粉丝: 24
- 资源: 4570
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功