没有合适的资源?快使用搜索试试~ 我知道了~
Content-extraction-and-search-using-Apache-Tika:在此作业中,您将参与一项持续的工...
共16个文件
java:5个
jar:3个
txt:3个
需积分: 5 0 下载量 10 浏览量
2021-07-11
07:54:15
上传
评论
收藏 225KB ZIP 举报
温馨提示
内容提取和搜索使用 Apache-Tika 使用来自 DARPA XDATA 的 Apache Tika for Employment 数据集构建了一个内容提取和一个本地搜索引擎。 通过清理和转换数据并开发用于对职位发布进行排名的算法来构建该项目。 使用 Tika 开发了一个爬虫来遍历就业数据集以显示相关的职位发布。
资源推荐
资源详情
资源评论
收起资源包目录
Content-extraction-and-search-using-Apache-Tika-master.zip (16个子文件)
Content-extraction-and-search-using-Apache-Tika-master
TIKA
src
edu
usc
UniqueJob.java 435B
TSVParser.java 5KB
Main.java 2KB
JSONTableContentHandler.java 2KB
NearDeDup.java 2KB
App.properties 93B
run.sh 313B
run.bat 297B
lib
simmetrics_jar_v1_6_2_d07_02_07.jar 130KB
opencsv-3.0.jar 27KB
java-json.jar 83KB
README.txt 624B
README.md 426B
ETL
headers.txt 191B
run_ETL_job.py 4KB
README.txt 570B
共 16 条
- 1
资源评论
居居是居居啦
- 粉丝: 24
- 资源: 4657
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功