没有合适的资源?快使用搜索试试~ 我知道了~
webscraping_indexing:通过Lucene索引网络抓取的数据
共45个文件
java:12个
prefs:4个
lst:4个
需积分: 5 0 下载量 30 浏览量
2021-03-18
11:48:03
上传
评论
收藏 149KB ZIP 举报
温馨提示
webscraping_indexing 正在安装 要运行代码,首先需要克隆存储库。 git clone https://github.com/abdelrahim-hentabli/webscraping_indexing.git 编译并运行 要在Linux系统上进行编译,请转到主目录并运行compile.sh文件。您可能需要授予其执行权限, chmod +x compile.sh 您需要导出PATH_TO_LUCENE变量以使编译正确运行 export PATH_TO_LUCNE=<your> 每次重新打开终端时都需要执行此操作,也可以将其放入.bashrc / .zshrc中
资源推荐
资源详情
资源评论
收起资源包目录
webscraping_indexing-main.zip (45个子文件)
webscraping_indexing-main
.gitignore 348B
src
HadoopQuery.java 2KB
ArrayListTextWritable.java 2KB
server
src
main
resources
application.properties 1B
java
com
example
actuatorservice
ActuatorServiceApplication.java 338B
Response.java 440B
TweetController.java 1KB
test
java
com
example
actuatorservice
ActuatorServiceApplicationTests.java 228B
.classpath 2KB
HELP.md 1KB
mvnw 10KB
.settings
org.eclipse.m2e.core.prefs 86B
org.eclipse.jdt.apt.core.prefs 67B
org.eclipse.core.resources.prefs 150B
org.eclipse.jdt.core.prefs 543B
pom.xml 1KB
mvnw.cmd 6KB
README.md 340B
target
classes
application.properties 1B
maven-archiver
pom.properties 71B
surefire-reports
com.example.actuatorservice.ActuatorServiceApplicationTests.txt 366B
TEST-com.example.actuatorservice.ActuatorServiceApplicationTests.xml 18KB
actuator-service-0.0.1-SNAPSHOT.jar.original 4KB
maven-status
maven-compiler-plugin
compile
default-compile
inputFiles.lst 406B
createdFiles.lst 154B
testCompile
default-testCompile
inputFiles.lst 150B
createdFiles.lst 66B
.project 840B
CSVNLineInputFormat.java 5KB
HadoopIndex.java 7KB
LuceneQuery.java 4KB
LuceneIndex.java 3KB
CSVLineRecordReader.java 9KB
Pair.java 142B
Phase1 Project Report.pdf 113KB
README.md 597B
main
hadoop_index.sh 91B
tweepy_scraping
.env 249B
DeployCrawler.ipynb 5KB
crawler_python_code.py 2KB
crawler_python_code_revised.py 3KB
compile.sh 336B
query.sh 260B
lucene_index.sh 245B
index.lucene
write.lock 0B
共 45 条
- 1
资源评论
leeloodeng
- 粉丝: 27
- 资源: 4699
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- IMG_20250105_185959.jpg
- 电力电子技术三级项目大作业,简易手机充电器的设计与仿真 答辩PPT
- 曲面玻璃抛光step全套技术资料100%好用.zip
- Android天气预报期末大作业源码+文档说明(95分以上).zip
- 气流分级机sw18可编辑全套技术资料100%好用.zip
- Android 天气预报期末大作业(95分以上).zip
- IMG_20250105_190606.jpg
- AIMP2 .NET 互操作插件
- matlab里的.M文件转换成.C文件
- Adaptive Intelligence 开源 .NET 框架
- 溶液过滤装置sw18全套技术资料100%好用.zip
- 基于强化学习的车间调度,dqn,ppo
- 基于Faster-RCNN实现道路车辆、行人及交通信号等的目标检测源码+模型+报告+文档说明
- Matlab代码-基于拉格朗日电力系统参数辨识 对电力系统中存在多个不良参数进行辨识,以IEEE14节点系统进行仿真验证 含参考文献
- AirLib - 用于将图片和视频发送到 Apple TV 的 C# 库和客户端应用程序,这是一个基于 Unofficial Airplay 协议规范的 C# 与 Apple TV 连接
- 平抑功率波动,一分钟功率波动和十分钟功率波动 1、1min和10min满足国家并网标准 2、先用滑动平均算法或卡尔曼滤波算法进行平抑 3、求解平抑后是否满足国家并网标准 4、程序注释很详细 有步骤的
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功