没有合适的资源?快使用搜索试试~ 我知道了~
毕业设计论文-数据挖掘系统的设计与实现.doc
0 下载量 135 浏览量
2023-06-30
04:02:41
上传
评论
收藏 1.11MB DOC 举报
温馨提示
试读
47页
毕业设计论文-数据挖掘系统的设计与实现.doc
资源推荐
资源详情
资源评论
数据挖掘系统的设计与实现
Data Mining System
学生姓名
指导教师
I
摘 要
在电信系统中,经常需要根据用户的登入登出进行计时收费,这样我们就需
要根据登录日志来将用户的登入记录和登出记录按照对应关系匹配起来,形成一
条完整的登录记录,登录记录中包含以下信息:用户登录名,登入时刻,登出时
刻,登录时长,登录终端机器 IP 等。在匹配过程中,理论上一条登入记录跟一
条登出记录匹配,但有可能在我们采集数据时用户还没有登出,所以日志文件中
可能出现没有登出记录与之匹配的登入记录,这些登入记录我们将其保存在一个
指定的文件中,在下次采集时再读取。在整个电信系统中,这些记录无疑是非常
巨大的,不是依靠人力手工能够完成的,这时,我们就需要有一个具体的系统来
帮我们自动完成这些功能,这也就是本次课题的选择——数据挖掘系统(Data
Mining System)。在该系统中,将匹配好的用户登录记录通过网络发送到采集系
统服务器,服务器端接收匹配好的用户登录记录数据,然后将接受到的用户登录
记录数据保存到数据库的用户登录记录明细表中,而最终可以实现将用户登录记
录明细表中的数据整合成日报表,月报表和年报表。
关键词: 数据挖掘;客户端;服务器端
II
Abstract
In telecommunications system, often carried out time charges based on user’s
login or logout, so we need to match the user's login and logout records by
correspondence relationship according to the log and form a complete log records, log
record contains the following information: user login name, login time, logout time,
log length, log terminal machine IP and so on. In the process of matching, in theory, a
login record matches with a logout record, but when we collect the data the user may
not logout ,so there maybe no logout record match with the login record in the log file.
We save the login records in a designated file, and read them at the next collection. In
the whole telecommunications system, these records will undoubtedly be very
tremendous, to rely on human hand can not be done, then we need a specific system to
help us finish these functions automatic, it is the choice of this subject - - Data Mining
System. In this system, send the matched user log record to the collection system
server through internet, the server receives the matched user log record data, and then
save the received user log record data to the database user log records list and
ultimately enables the data in the user log records list integrated into daily report,
monthly report and annual report.
Keywords: data mining; client; server
III
目 录
摘 要.....................................................................I
Abstract....................................................................II
第一章 文献综述.............................................................1
1.1 数据挖掘发展简述......................................................1
1.1.1 数据丰富与知识匮乏 ..............................................1
1.1.2 从数据到知识 ....................................................2
1.1.3 数据挖掘产生 ....................................................4
1.2 数据挖掘基本知识......................................................5
1.2.1 数据挖掘深入 ....................................................8
1.3 数据挖掘功能..........................................................9
1.3.1 概念描述:定性与对比 ...........................................10
1.3.2 关联分析 .......................................................10
1.3.3 分类与预测 .....................................................10
1.3.4 聚类分析 .......................................................11
1.3.5 异类分析 .......................................................11
1.3.6 演化分析 .......................................................11
1.4 数据挖掘结果的评估...................................................11
1.5 数据挖掘系统.........................................................13
1.5.1 数据挖掘系统分类 ...............................................13
1.5.2 数据挖掘系统的应用 .............................................14
1.6 数据挖掘研究重点.....................................................17
1.7 数据挖掘课题的选择...................................................20
第二章 设计部分.............................................................21
2.1 环境的选择与搭建.....................................................21
2.2 系统需要实现的功能...................................................22
2.3 系统用例.............................................................23
2.3.1 用例图 .........................................................23
2.3.2 用例描述 .......................................................24
2.4 数据库表设计.........................................................33
2.5 总体类图.............................................................34
2.6 异常考虑.............................................................35
2.7 用例实现 ............................................................37
第三章 结果与讨论...........................................................39
第四章 结论与建议...........................................................42
4.1 结论.................................................................42
4.2 建议.................................................................42
参考文献....................................................................43
致 谢....................................................................44
武汉工程大学本科毕业设计
1
第一章 文献综述
数据挖掘作为一个新兴的多学科交叉应用领域,正在各行各业的决策支持活动扮演着
越来越重要的角色。
1.1 数据挖掘发展简述
1.1.1 数据丰富与知识匮乏
计算机与信息技术经历了半个世纪的发展,给人类社会带来了巨大的变化与影响。在
支配人类社会三大要素(能源、材料和信息)中,信息愈来愈显示出其重要性和支配力,
它将人类社会由工业化时代推向信息化时代。随着人类活动范围的扩展,生活节奏的加快,
以及技术的进步,人们能以更快速更容易更廉价的方式获取和存储数据,这就使得数据及
其信息量以指数方式增长。早在20世纪八十年代,据粗略估算,全球信息量每隔20个月就
增加一倍。而进入九十年代,全世界所拥有的数据库及其所存储的数据规模增长更快。一
个中等规模企业每天要产生100 MB 以上来自各生产经营等多方面的商业数据。美国政府部
门的一个典型大数据库每天要接收约5TB数据量,在15 秒到1分钟时间里,要维持的数据量
达到300 TB,存档数据达15-100 PB。在科研方面,以美国宇航局的数据库为例,每天从卫
星下载的数据量就达3-4 TB之多;而为了研究的需要,这些数据要保存七年之久。九十年
代互联网(Internet)的出现与发展,以及随之而来的企业内部网(Internet)和企业外
部网(Extranet)以及虚拟私有网(VPN:Virtual Private network)的产生和应用,使
整个世界互联形成一个小小的地球村,人们可以跨越时空地在网上交换信息和协同工作。
这样,展现在人们面前的已不是局限于本部门,本单位和本行业的庞大数据库,而是浩瀚
无垠的信息海洋。据统计,1993年全球数据存贮容量约为二千TB,到2000年增加到三百万
TB,面对这极度膨胀的数据信息量,人们受到“信息爆炸”、“混沌信息空间”
(Information Chaotic Space)和“数据过剩”(Data glut)的巨大压力。
然而,人类的各项活动都是基于人类的智慧和知识,即对外部世界的观察和了解,做
出正确的判断和决策以及采取正确的行动,而数据仅仅是人们用各种工具和手段观察外部
世界所得到的原始材料,它本身没有任何意义。从数据到知识到智慧,需要经过分析加工
处理精炼的过程。如图1. 1所示,数据是原材料,它只是描述发生了什么事情,并不能构
成决策或行动的可靠基础。通过对数据进行分析找出其中关系,赋予数据以某种意义和关
联,这就形成所谓信息。信息虽给出了数据中一些有一定意义的东西,但它往往和人们需
剩余46页未读,继续阅读
资源评论
黑色的迷迭香
- 粉丝: 731
- 资源: 4万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功