adsabs-pyingest
用于adsabs提取管道的集合或python解析器,验证器和序列化器。 目前,我们所拥有的只是用于将数据提取到ADS Classic中的简单内容,但这意味着随着我们的元数据模型变得越来越复杂,它会适时地增长和变化。
我们现在开始实现可用于直接提取到Solr中的解析器(例如dubcore / arxiv)。 有关此应用程序的示例,请参见存储库ADS_Direct_Import。
使用解析器
解析器有几种不同的类别,可用于不同的内容源(JATS,《科学进展》网站,Zenodo等)。调用解析器的基本语法很简单:创建解析器的实例,并获取解析的输出在所需的输入上使用解析器的“ parse”方法。
例如,APS解析器需要一个指向APS-JATS格式fulltext.xml文件的文件指针(请参见/ proj / ads / fulltext / sources /
评论0
最新资源