#EDGAR 解析器
parser.py 获取任何给定 CIK 的第一个可用 13F-HR 文件。 假定给定的 CIK 是有效的。 (虽然有一个验证函数,其电话已被注释掉。因此,如果需要验证才能启用)
在开始之前,我从 SEC 的网站上阅读了。 从那里我了解到全文提交本质上是来自主文档和信息表的 XML 以及一些随附的元数据的组合。 我还注意到有关特定公司持股的数据完全保存在信息表中。
考虑到这些,我设计了一个脚本,它执行以下操作:
获取给定 CIK 的 13F-HR 提交的原子提要。
选择第一个提交并构建一个指向完整 txt 提交的链接。
获取 txt 提交并将其拆分为 xml 用于主文档和信息表
解析 XML 并将数据写入 2 个单独的 csv 文件,分别具有以下字段:
主要文件
报告期
表条目总计
表值总计
信息表
发行人名称
类标题
尖头
价值
ssh程序
sshPrna