没有合适的资源?快使用搜索试试~
我知道了~
文库首页
存储
其它
Hadoop的重复数据清理模型研究与实现
Hadoop的重复数据清理模型研究与实现
需积分: 9
22 下载量
128 浏览量
2011-09-30
09:52:24
上传
评论
收藏
1.92MB
KDH
举报
温馨提示
立即下载
Hadoop的重复数据清理模型研究与实现,Hadoop的重复数据清理模型研究与实现
资源推荐
资源评论
一种XML相似重复数据的清理方法研究
浏览:3
5星 · 资源好评率100%
针对半结构化数据XML在数据清理中的重要性,研究了如何清理XML相似重复数据,主要工作有:提出一种有效的XML相似重复数据清理方法,该方法具有较强的适应性,任何XML相似检测算法都适用于此;给出一种基于树编辑距离的相似检测算法,该算法能有效地检测XML相似重复数据;采用树编辑距离的上下限优化基于树编辑距离的相似检测算法,避免了不必要的树编辑距离计算,降低了相似检测计算的复杂度,提高了运算效率. 此
论文研究-基于文件相似性分簇的重复数据消除模型.pdf
浏览:81
为解决现有提高重复数据消除系统吞吐量方法的局部性依赖和多节点依赖问题, 提出了一种基于文件相似性分簇的重复数据消除模型。该模型将传统平面型索引结构拓展为空间结构, 并依据Broder定理仅选择少量最具代表性的索引驻留在内存中; 同时对索引进行横向分片并分布到完全自治的多个节点。实验结果表明, 该方法能有效提高大规模云存储环境下重复数据消除性能和平均吞吐量, 且各节点数据负载量均衡, 故该模型可扩展
大数据环境下基于Hadoop框架的数据挖掘算法的研究与实现
浏览:67
为了提高大数据环境下的数据挖掘速度,对分布式计算构架Hadoop进行分析与研究,提出一种基于Hadoop平台的大数据关联规则挖掘算法MRPrePost。该算法在PrePost算法基础上改进而来,采用Hadoop平台降低分布式编程的难度且易于管理,通过一种自底向上的深度优化策略改进PrePost算法,降低内存开销,同时采用负载均衡的分组策略,来提高并行算法的性能,最终试验表明,该算法运行速度快,适应
基于Hadoop的电信大数据采集方案研究与实现
浏览:75
ETL是数据仓库实施过程中一个非常重要的步骤,设计一个能够对大数据进行有效处理的ETL流程以提高运营平台的采集效率,具有重要的实际意义。首先简单介绍某运营商大数据平台采集的主要数据内容。随后,为提升海量数据采集效率,提出了Hadoop与Oracle混搭架构解决方案。继而,提出一种动态触发式ETL调度流程与算法,与定时启动的ETL流程调度方式相比,可有效缩短部分流程的超长等待时间;有效避免资源抢占拥
基于Hadoop的数据挖掘算法研究与实现
浏览:57
三、基于Hadoop平台,设计并实现了数据挖掘系统,.,系统封装了底层的Hadoop系统接口,提供了本文介绍的几种聚类算法服务。系统自顶向下的逻辑层次分别为用户层、服务引擎层、挖掘引擎层、底层Hadoop驱动层。 四、研究...
基于Hadoop的海量数据处理模型研究和应用
浏览:103
5星 · 资源好评率100%
基于Hadoop的海量数据处理模型研究和应用
论文研究 - Hadoop业务数据的可视化分析模型
浏览:11
5星 · 资源好评率100%
本文针对Hadoop业务数据的可视化分析模型,从可视化平台,数据库和分析模型等方面对业务数据进行了分析。根据分析,将对Hive数据库进行脱机数据分析和数据可视化。大大改进,因此可以为Hadoop业务数据的可视化分析...
大数据环境下基于Hadoop框架的数据挖掘算法的研究与实现.pdf
浏览:103
大数据环境下基于Hadoop框架的数据挖掘算法的研究与实现.pdf
一种XML相似重复数据的清理方法研究 (2004年)
浏览:164
针对半结构化数据XML在数据清理中的重要性,研究了如何清理XML相似重复数据,主要工作有 :提出一种有效的XML相似重复数据清理方法,该方法具有较强的适应性,任何XML相似检测算法都适用于此 ;给出一种基于树编辑距离的相似检测算法,该算法能有效地检测XML相似重复数据 ;采用树编辑距离的上下限优化基于树编辑距离的相似检测算法,避免了不必要的树编辑距离计算,降低了相似检测计算的复杂度,提高了运算效率
基于大数据平台 Hadoop 的协同过 滤算法对处理后的数据进行建模分析,并运用模型设计实现智能推荐 +源代码+文档说明+pdf
浏览:114
基于大数据平台 Hadoop 的协同过 滤算法对处理后的数据进行建模分析,并运用模型设计实现智能推荐 +源代码+文档说明+pdf -------- 不懂运行,下载完可以私聊问,可远程教学 该资源内项目源码是个人的毕设,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! <项目介绍> 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用!
基于云计算的Hadoop大数据平台挖掘算法及实现研究.pdf
浏览:99
基于云计算的Hadoop大数据平台挖掘算法及实现研究.pdf
基于Hadoop的电信大数据采集方案研究与实现.pdf
浏览:9
基于Hadoop的电信大数据采集方案研究与实现.pdf
基于Hadoop的分布式搜索引擎研究与实现
浏览:139
基于Hadoop的分布式搜索引擎研究与实现
大数据环境下基于Hadoop框架的数据挖掘算法的研究与实现 (1).pdf
浏览:88
大数据环境下基于Hadoop框架的数据挖掘算法的研究与实现 (1).pdf
Hadoop平台数据挖掘技术研究.pdf
浏览:35
Hadoop平台数据挖掘技术研究.pdf
基于Hadoop的数据治理系统的设计与实现.docx
浏览:197
基于Hadoop的数据治理系统的设计与实现.docx基于Hadoop的数据治理系统的设计与实现.docx基于Hadoop的数据治理系统的设计与实现.docx基于Hadoop的数据治理系统的设计与实现.docx基于Hadoop的数据治理系统的设计与实现...
基于Hadoop的数据治理系统的设计与实现.pdf
浏览:139
基于Hadoop的数据治理系统的设计与实现.pdf基于Hadoop的数据治理系统的设计与实现.pdf基于Hadoop的数据治理系统的设计与实现.pdf基于Hadoop的数据治理系统的设计与实现.pdf基于Hadoop的数据治理系统的设计与实现.pdf...
大数据-算法-基于语义关联的重复数据清理技术研究.pdf
浏览:58
大数据-算法-基于语义关联的重复数据清理技术研究.pdf
Gender-Recognition-by-Voice-0.97004-Accuracy-:测试了20个人的不同人的声音。 这些特性包括平均频率,标准偏差,峰度,偏斜,模式频率,调制指数,基本频率等。 我的作品包括对男性和女性所展示的许多可能财产的示范。 使用从各种回归图,成对图,散点图等得出的推论,研究语音识别的重要属性及其在每个性别中的专注度。为了更好的性能,数据集在训练之前也经过了标准化或标准化。 尝试了不同的模型。 还绘制了它们的精度曲线以了解参数精度的变化。 使用重复的分段网格搜索来调整参数,以
浏览:157
性别性别识别97.004%准确度(SVM)和100%准确度(神经网络)- 测试了20个人的不同人的声音。 这些特性包括平均频率,标准偏差,峰度,偏斜,模式频率,调制指数,基本频率等。 我的作品包括对女性和男性所展示的极有可能的财产的演示。 使用从各种回归图,成对图,散布图等得出的推论,研究语音识别的重要属性及其在每个性别中的专注度。 为了更好的性能,在训练之前还对数据集进行了标准化或标准化。 尝试
论文研究-基于J2EE的数据重复录入和越界预警功能的研究与实现 .pdf
浏览:87
基于J2EE的数据重复录入和越界预警功能的研究与实现,于敏,杨春金,本文提出了数据录入预警的设想。通过对JSP Servlet JavaBean三层结构和SQL Server 2000数据库触发器和存储过程的研究,实现了数据重复录入和�
基于Hadoop的数据作业管理平台设计与实现.pdf
浏览:12
基于Hadoop的数据作业管理平台设计与实现.pdf基于Hadoop的数据作业管理平台设计与实现.pdf基于Hadoop的数据作业管理平台设计与实现.pdf基于Hadoop的数据作业管理平台设计与实现.pdf基于Hadoop的数据作业管理平台设计...
基于Hadoop的数据仓库引擎的设计与实现_.caj
浏览:4
基于Hadoop的数据仓库引擎的设计与实现_ 数据仓库
基于Hadoop的数据作业管理平台设计与实现 (3).pdf
浏览:164
基于Hadoop的数据作业管理平台设计与实现 (3).pdf基于Hadoop的数据作业管理平台设计与实现 (3).pdf基于Hadoop的数据作业管理平台设计与实现 (3).pdf基于Hadoop的数据作业管理平台设计与实现 (3).pdf基于Hadoop的数据...
基于Hadoop的数据作业管理平台设计与实现 (2).pdf
浏览:40
基于Hadoop的数据作业管理平台设计与实现 (2).pdf基于Hadoop的数据作业管理平台设计与实现 (2).pdf基于Hadoop的数据作业管理平台设计与实现 (2).pdf基于Hadoop的数据作业管理平台设计与实现 (2).pdf基于Hadoop的数据...
基于Hadoop的海量数据处理模型研究和应用.pdf
浏览:118
#资源达人分享计划#
基于Hadoop的校园网盘的设计与实现 (2).pdf
浏览:163
5星 · 资源好评率100%
基于Hadoop的校园网盘的设计与实现 (2).pdf基于Hadoop的校园网盘的设计与实现 (2).pdf基于Hadoop的校园网盘的设计与实现 (2).pdf基于Hadoop的校园网盘的设计与实现 (2).pdf基于Hadoop的校园网盘的设计与实现 (2).pdf...
Hadoop大数据处理技术基础与实践(第2版)(微课版)PPT-课件.rar
浏览:193
5星 · 资源好评率100%
Hadoop大数据处理技术基础与实践(第2版)(微课版)PPT-课件.rar
评论
收藏
内容反馈
立即下载
资源评论
资源反馈
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~
联系上传者
评论
winterlzht2009
粉丝: 0
资源:
16
私信
上传资源 快速赚钱
我的内容管理
展开
我的资源
快来上传第一个资源
我的收益
登录查看自己的收益
我的积分
登录查看自己的积分
我的C币
登录后查看C币余额
我的收藏
我的下载
下载帮助
前往需求广场,查看用户热搜
最新资源
卡尔曼滤波算法-简单讲解
Redis 的持久化机制有哪些??
1.EDA 试验箱 引脚配置文件 2.FPGA 引脚配置 tcl文件,根据文件更新 3.tcl文件 按键
Vmware work station安装Windows7教程
使用Halcon实现的两点之间线性插值算法,支持多点输入
Screenshot_20240426_105353.jpg
钱.dev
2016Java_答案.doc
菱形.dev
Java版CSDN中的x-ca-signature签名算法研究.zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功