没有合适的资源?快使用搜索试试~ 我知道了~
Inverted-Indexing-for-unstructured-data:“针对Data Lake环境的非结构化数据的优化...
共11个文件
java:6个
png:2个
jar:1个
需积分: 5 1 下载量 184 浏览量
2021-05-15
02:37:05
上传
评论
收藏 1.6MB ZIP 举报
温馨提示
非结构化数据的反向索引 “针对Data Lake环境的非结构化数据的优化索引”是一个旨在处理Data Lake环境中的非结构化数据的索引池的项目。 Data Lake是一个存储库,它以其本机形式存储大量数据。 数据湖的想法是拥有一个企业中所有数据的单一仓库,范围从原始数据到转换后的数据,可用于各种目的,包括可视化,机器学习,分析和报告。 该项目首先使用包含本机格式数据的非结构化数据集,然后通过使用哈希的反向索引技术对其进行索引,以便在速度和时间上获得优化的结果。 目的是: 第一阶段: 研究现有的索引算法,并找出其优缺点。 实施现有的索引编制技术,并研究和比较何时使用特定的索引编制方法。 第二阶段: 优化索引编制方法。 第三阶段: 计算时空复杂度因子并找出优化索引方法返回的结果的准确性 现有系统要求 正在开发Minor的现有系统具有以下详细配置: 内存:8GB 系统类型:64位操
资源推荐
资源详情
资源评论
收起资源包目录
Inverted-Indexing-for-unstructured-data-master.zip (11个子文件)
Inverted-Indexing-for-unstructured-data-master
Lucene_Files
lucene-core-3.6.2.jar 1.47MB
LuceneTester.java 2KB
Searcher.java 2KB
TextFileFilter.java 258B
LuceneConstants.java 264B
Indexer.java 2KB
Data.txt 209B
Optimized_Indexing_Approach
InvertedIndex.java 3KB
README.md 2KB
Execution_Result
Lucene_TimeComplexity.png 132KB
Optimized_Approach_TimeComplexity.png 134KB
共 11 条
- 1
资源评论
80seconds
- 粉丝: 44
- 资源: 4568
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功