WOS 爬虫总结
目的
快速获得文献背景:出版年份,被引频次,作者,DOI,文献类型,引用的参考文献
获得参考文献的下载链接,实现文献的批量化下载
条件
所处机构或者学校购买WOS的数据库,并且将爬虫置于校园网环境中。
如果要实现后期的文献下载需要购买所需文献的数据库。
后期有时间会完善用账号密码校外访问数据库。
使用方法
1. 所需要安装的python3+包
2. 测试例子(没有将程序打包,所以需要将程序下载使用)
导出所有的检索结果
导出所有的参考文献
WOS 检索式参考
pip install requests
pip install lxml
pip install bs4
test = 'TS=LN AND PY=(2018-2020)' # 检索式一定要有两个条件以上
test_start = 1 # 导出起始页码
test_end = 501 # 导出终止页码
file_name='LNOI' # 保存文件的名称,默认为 .txt 文件,如果想要保存其他格式,那是不可能
的!
file_type = 'fieldtagged'
demo = export_paper(search_expression=test, export_start=test_start,
export_end=
test_end,file_name='LNOI',file_type=file_type)
demo.save()
# 运行结束会生成两个txt文件,一个是'file_name.txt'为所选需要的文献,一个
是'no_doi.txt' 用于存储没有DOI的文献信息
aim = 'TS=LNOI AND PY=2020 AND DO=10.1515/nanoph-2020-0013' # 建议用DOI搜索,这
样保证搜索结果的唯一性
file_name = 'LNOI'
aim_paper = get_references(search_expression=aim, file_name=file_name)
aim_paper.get_main() # 接口和上一个有点不一样,两个爬取逻辑有点小差异
# ''' 高级检索参考 :
# 布尔运算符: AND、OR、NOT、SAME、NEAR
# 字段标识:
# TS= 主题
评论0
最新资源