CASIE-Corpus--帮助程序代码
说明:此存储库仅使用针对CASIE语料库的spaCy库提供内部,外部,开始(IOB)标记格式和语言注释的帮助程序代码
用于此脚本的编程:使用Jupyter Notebbok(.ipynb)的Python
使用的库:
有关使用spaCy的注释的更多信息:
用法:此帮助程序代码假定数据位于以下目录(/ data / annotation /)中,而输出将位于新目录(/ data / annotation_j /)中。 请手动创建后一个目录。 对于(/ data / annotation /)和(/ data / annotation_j /),脚本应位于同一父目录中。
我在下面引用包含CASIE语料库的论文和GitHub代码:
Github代码与CASIE语料库:
论文:Taneeya Satyapanich,Tim Finin和Francis F