没有合适的资源?快使用搜索试试~ 我知道了~
爬虫代码matlab-ScienceDirectWebCrawler:使用Python中的网络爬虫从ScienceDirect数...
共64个文件
py:43个
csv:7个
md:5个
需积分: 50 7 下载量 48 浏览量
2021-06-07
20:57:12
上传
评论 1
收藏 2.06MB ZIP 举报
温馨提示
爬虫代码matlab 使用 Python 调查 ScienceDirect 数据库 这个代码文件夹是由张子涵为他在纽约大学牙科学院的实验室实习而制作的。 目的是使用网络爬虫从数据库中获取信息。 这些代码主要基于 Python,并涉及一些 Matlab 和 SQL。 heatmap_create 部分用于生成不同关键字组合的总找到结果的可视化表示。 download_pdf 部分用于下载与此关键字组合相关的所有 pdf 并将它们存储到不同的文件夹中。 database_create部分用于提取每篇文章相关的重要信息,包括相关关键词、DOI、作者、发表日期等,并存入MySQL数据库。 analysis_pdf 部分用于将 pdf 文件转换为可编辑和可搜索的 JSON 文件,以便用户可以跟踪特定关键字并浏览内容。 请注意,每个文件夹中的代码或多或少彼此相似。 这是为了方便读者将它们视为单独的项目以供将来参考。 我还发布了数据提取团队的临时演示文稿,以更好地介绍我在创伤项目中的角色和贡献。 可以在 中找到最终组织良好的程序。
资源推荐
资源详情
资源评论
收起资源包目录
ScienceDirectWebCrawler-master.zip (64个子文件)
ScienceDirectWebCrawler-master
Progress Presentation [08_07_20].pdf 1.56MB
analyze_pdf
demo_1
demo1.csv 158KB
keywords.txt 76B
analyze_fig.py 2KB
pdfminer_tester.py 6KB
analyze_text.py 3KB
check_keywords.py 1KB
pdfplumber_tester.py 712B
README.md 845B
download_pdf
main.py 2KB
find_count.py 1KB
htm_saver.py 6KB
keywords_combination_list.csv 2.02MB
find_pdf.py 6KB
README.md 2KB
download_pdf.py 8KB
heatmap_create
output_data.xlsx 105KB
find_count.py 2KB
keywords_comb.py 2KB
keywords.csv 6KB
htm_saver.py 4KB
keywords_combination_list.csv 2.02MB
README.md 1KB
heatmap_photos
heatmap1.png 181KB
heatmap2.png 173KB
database_create
oper_sql_temp.py 2KB
find_count.py 1KB
info_coll.py 1KB
htm_saver.py 6KB
keywords_combination_list.csv 2.02MB
sql.txt 2KB
find_pdf.py 5KB
README.md 2KB
download_pdf.py 8KB
download_main.py 3KB
README.md 1KB
package
keyword_searcher.py 4KB
search_result_page.py 5KB
keyword_builder.py 1KB
__init__.pyc 106B
crawler.sh 708B
app_config.py 2KB
keywords.csv 6KB
__main__.py 263B
__init__.py 1B
pdf_exporter.py 2KB
INITIAL_STATE_sample.json 49KB
crawler_db.py 4KB
keyword_task_summary.py 2KB
web_page.py 480B
keywords_combination_list.csv 2.02MB
pdf_downloader.py 9KB
cr_logger.py 2KB
task_runner.py 9KB
keyword_remover.py 2KB
keyword_pdf_summary.py 2KB
keyword_downloader.py 3KB
db_handler_mysql.py 8KB
task_admin.py 3KB
cr_main.py 3KB
search_url_builder.py 2KB
test_pymysql.py 654B
date_time.py 4KB
db_handler.py 8KB
共 64 条
- 1
资源评论
weixin_38717450
- 粉丝: 7
- 资源: 953
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- Jurassic Pack Vol. II Dinosaurs 侏罗纪包卷恐龙二号Unity游戏模型资源unitypackage
- Jurassic Pack Vol. III Dinosaurs 侏罗纪包卷恐龙三号Unity游戏模型资源unitypackag
- Ultimate Seating Controller 终极座椅控制器Unity游戏开发插件资源unitypackage
- 什么是人工智能-关于人工智能的相关介绍说明
- Figma Converter for Unity适用Unity的Figma转换器Unity游戏开发插件unitypackage
- Creepy Animatronic Anims 令人毛骨悚然的电子动画Unity游戏动画插件资源unitypackage
- Rankings & Leaderboards 排名和排行榜Unity游戏开发插件资源unitypackage
- Semantic Color Palette 语义调色板Unity游戏开发插件资源unitypackage
- Low Poly Nature:Lush and Diverse Environments低聚自然郁郁Unity低多边形模型资源
- voc数据集是什么-我们如何使用voc数据集
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功