这个项目的主要目的是通过自动化爬虫技术,基于给定的文献名称,从中国知网(CNKI)中批量获取文献信息。项目首先利用Selenium和Python脚本进行网页自动化操作,登录知网并输入文献名称进行检索。然后,系统会遍历检索结果中的所有文献页面,点击每篇文献引用等关键信息并提取出来。为了确保信息的全面性和完整性,爬虫脚本还具备多页抓取功能,能够自动识别并翻页,直至所有相关文献信息抓取完毕。在每页操作完成后,提取到的数据将按照预设的顺序写入到一个txt文件中,以便后续数据分析和整理。该项目旨在简化大规模文献信息的收集过程,为研究人员提供高效、准确的文献数据支持。