img
share 分享

Java自学宝典

作者:黑马程序员

出版社:清华大学出版社

ISBN:9787302475415

VIP会员免费 (仅需0.8元/天) ¥ 83.2

温馨提示: 价值40000元的1000本电子书,VIP会员随意看哦!

电子书推荐

更多资源 展开

基于 JAVA 的 WEKA 数据挖掘平台分析及二次开发 评分:

csdn在weka发面的内容多为入门资料。 这篇是网上收集到的一篇较为深入的报告,希望对大家有帮助。 更希望csdn上能有些更为深入的资料,大家共同学习共同进步。 基于 JAVA 的 WEKA 数据挖掘平台分析及二次开发   共60页   摘 要    数据挖掘是在“信息爆炸,知识缺乏”的背景下提出的新技术。所谓数据挖掘就是从大量的、不完整的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。该技术在银行业、市场业、零售业、保险业及电信业等诸多领域的数据分析中有着广阔的应用前景。    本文首先针对数据挖掘技术作了比较全面的综述,并深入分析聚类方法。其次,针对学术界典型的开放数据挖掘工具 WEKA,进行数据挖掘测试,主要包括预处理、分类、聚类、属性选择、关联规则及可视化等,并对挖掘结果进行统计分析,指出 WEKA 系统存在的缺陷及发展前景。为了弥补 WEKA 系统存在的一些缺陷,本文还在 WEKA 平台下进行二次开发,根据描述的 k-中心点轮换法的算法流程,利用 eclipse 在 WEKA 平台下嵌入该算法,并对其进行优化以提高其聚类效果。    虽然本文研究的 WEKA 数据挖掘工具目前还处于研究阶段,但它却汇集了多样化的机器学习算法,是数据挖掘研究的理想选择。同时,本文所研究的 k-中心点轮换算法改进了传统的 k-中心点算法,避免陷入局部最优,并进行了属性正常化、处理残缺值等优化,聚类效果明显提高了。      关键词:数据挖掘  WEKA 聚类分析 k-中心点轮换算法      目 录    1 前言 7    1.1 课题背景• 7    1.2 本文所做的主要工作• 7    1.3 本文结构 8    2 数据挖掘技术综述 9    2.1 数据挖掘的定义 9    2.2 数据挖掘的基本功能• 9    2.3 数据挖掘的流程 10    2.4 数据挖掘的常用方法和技术• 11    2.5 数据挖掘的应用领域• 12    2.6 国内外数据挖掘工具现状 13    2.7 聚类分析概述 14    2.7.1 聚类概念• 14    2.7.2 主要聚类方法的分类• 14    3 基于 WEKA 平台的数据挖掘测试 16    3.1 WEKA 系统简介 16    3.2 WEKA 系统的特点• 16    3.2.1 WEKA 系统的文件格式• 16    3.2.2 WEKA 系统的界面• 17    3.2.3 WEKA 实现的功能及算法• 19    3.2.4 WEKA 系统的包结构• 22    3.3 WEKA 系统的挖掘测试及结果分析• 24    3.3.1 WEKA 系统的数据挖掘过程 24    3.3.2 WEKA 系统的挖掘实验• 25    3.3.3 WEKA 系统中存在的问题• 34    3.4 WEKA 系统的发展前景 34    4 WEKA 平台下的二次开发 35    4.1 二次开发背景及一般过程 35    4.1.1 二次开发背景 35    4.1.2 二次开发一般过程• 35    4.1.3 系统的开发与运行环境• 35    4.2 K-中心点轮换算法 35    4.3 K-中心点轮换算法的实现 37    4.3.1 K-中心点轮换算法的类模块关系• 37    4.3.2 K-中心点轮换算法的流程图 • 38    4.3.3 K-中心点轮换算法的类说明 39    4.4 K-中心点轮换算法的测试 45    5 总结 49   致谢 50   参考文献 50   附录 51

...展开详情
上传时间:2011-11 大小:733KB
热门图书