没有合适的资源?快使用搜索试试~ 我知道了~
corpcrawl-dead:查看美国证券交易委员会 EDGAR 文件以消除公司和子公司关系
共14个文件
py:11个
in:1个
rst:1个
需积分: 10 0 下载量 139 浏览量
2021-06-23
05:44:13
上传
评论
收藏 10KB ZIP 举报
温馨提示
这已经死了,见 rozap/corpcrawl 爬虫 关于 这是美国证券交易委员会 EDGAR 数据库的 Python 抓取工具。 它着眼于要求上市公司向美国证券交易委员会提交的 10k 表格文件。 然后尝试从 10k 展览 21.1 中提取附属关系。 Corpcrawl 是一个与存储无关的抓取工具,因此您需要实现自己的存储方案。 安装 您可以通过 Pip 从 PyPi 获取包。 pip 安装 corpcrawl 从 python 控制台你可以尝试 进口爬虫 如果它有效,那么你可以开始 运行它 首先导入需要的碎片 从 corpcrawl.crawler 导入 CorpCrawl 从 corpcrawl.backend 导入后端 定义主() my_backend = MyBackend() crawler = CorpCrawl(cache_path = '/an/absolute
资源推荐
资源详情
资源评论
收起资源包目录
corpcrawl-dead-master.zip (14个子文件)
corpcrawl-dead-master
MANIFEST.in 74B
README.rst 2KB
requirements.txt 71B
setup.py 494B
corpcrawl
backend.py 873B
models
__init__.py 0B
models.py 454B
parser.py 7KB
__init__.py 0B
util
__init__.py 0B
cleaner.py 487B
words.py 6KB
crawler.py 271B
downloader.py 2KB
共 14 条
- 1
资源评论
信念与梦想
- 粉丝: 44
- 资源: 4659
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功