Data-Mining培训资料.docx
Data-Mining培训资料全文共7页,当前为第1页。Data-Mining Data-Mining培训资料全文共7页,当前为第1页。 目录 数据挖掘在电子商务中的应用 1 与DM有关的主要国际期刊和会议 3 数据挖掘软件调研 5 数据挖掘在电子商务中的应用 数据挖掘在电子商务中主要是对客户信息以及客户在网站上的浏览和查找信息的挖掘,其能够发现客户的共性和个性的知识、必然和偶然的知识等,而其目的是得到对用户的访问模式及浏览行为的分析,从而为市场决策提供有用的信息和服务。电子商务中常用的数据挖掘技术有路径分析、关联规则挖掘、聚类分析和分类分析等。 路径分析技术 路径分析是一种找寻频繁访问路径的方法,它通过对web服务器的日志文件中客户访问站点的访问次数分析,挖掘出频繁访问路径。由此得到客户对那些页面爱好,从而更好的改进设计,为客户服务。从浏览路径中发现潜在的知识的过程称为路径模式挖掘(path pattern mining)。分为三个步骤:第一,用浏览过程中的每个站点组成的序列构成原始路径,其中既包括向前引用,也包括向后引用。 这时,只有前者是有效地信息,因此删除向后引用得到的每个子序列都是从访问起始点开始的最大向前引用。第二,获取最大的引用序列。第三,确定最大引用序列。 Data-Mining培训资料全文共7页,当前为第2页。关联分析技术 Data-Mining培训资料全文共7页,当前为第2页。 关联分析的目的就是为了挖掘出隐藏在数据间的相互关系, 从而找到客户对网站上各种文件之间访 问 的 相 互 联 系 , 即 发 现 其 关 联 规 则。 常 用 的Apriori 算法分为两步,首先找出满足最小支持度阈值的频繁项集; 然后由它们形成满足最小置信度阈值的强关联规则。 可以将 web 挖掘得到的关联规则用于改进电子商务站点的结构, 将相关联的商品放在一起,减轻用户过滤信息的负担,增加交叉销售。 聚类分析技术 聚类分析就是根据数据对象的属性信息或对象间的关系,将数据对象分组成为多个类或簇,划分的原则是在同一个簇中的对象之间具有较高的相似度,而不同簇中的对象差别较大。属于同一个类的对象可以作为一个整体来对待。 在 Web 使用挖掘中,存在两种类型的聚类:用户聚类和网页聚类。用户聚类主要是把所有用户划分为若干组, 具有相似特征(或浏览模式)的用户分在一组,这类知识对电子商务和为用户提供个性化的服务特别有用。 网页聚类可以找出具有相关内容的网页组, 这对网上搜索引擎及提供上网帮助的应用特别有益。 聚类分析时对类的划分主要采用的度量方式是距离, 通过距离来衡量数据间的相似度和相异度,同时数据间的相似系数也是数据分组的重要标准。 典型的聚类算法包括k-means 算法、PAM 算法、因素分析 、机器学习方法及神经网络方法等。 分类分析技术 Data-Mining培训资料全文共7页,当前为第3页。分类分析就是通过分析示例数据库中的数据,为每个类别做出准确的描述或建立分析模型或挖掘出分类规则, 然后用这个分类规则对其他数据库中的数据进行分类。 分类与聚类是容易混淆的两个概念,但二者有显著的区别:分类时建立模型的数据对象的类别是已知的, 而聚类时处理的所有对象的类别都是未知的。 在电子商务中分类是一项非常重要的任务,也是应用最多的技术。通过分类自动推导出定数据的推广描述,从而对未来数据进行预测。可以在 Internet 上找到未来的潜在客户, 获得这些潜在的客户市场, 这样就可以针对这一类客户的特点展开商务活动,提供有针对性的个性化的信息服务。数据分类是基于数据的某些属性的值进行的。 Data-Mining培训资料全文共7页,当前为第3页。 数据抽取技术 与传统商务活动相比,电子商务具有更多的虚拟和不确定的因素:如客户购买的心理、动机、能力、欲望等。数据挖掘要解决的任务就是如何从零散的无规则的数据中找到有用的和有规则的数据。基本方法之一是进行数据抽取,数据抽取的目的是对数据进行浓缩,给出它的紧凑描述。如求和值、平均值、方差值等统计值,或者用直方图、饼状图等图形方式表示。更主要是它从数据泛化的角度来讨论数据总结。数据泛化是一种把最原始、基本的信息数据从低层次抽象到高层次上的过程。可采用多维数据分析方法和面向属性的归纳方法。在电子商务活动中,采用多维数据分析方法进行数据抽取,它针对的是电子商务活动中的客户数据仓库。在数据分析中经常要用到诸如求和、总计、平均、最大、最小等汇集操作,这类操作的计算量特别大。可把汇集操作结果预先计算并存储起来,以便于决策支持系统使用。 Data-Mining培训资料全文共7页,当前为第4页。 Data-Mining培训资料全文共7页,当前为第4页。 与DM有关的主要国际期刊和会议 国际期刊 A类 B类 C类 Dat
- 粉丝: 84
- 资源: 9357
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- JSP-JTBC-CMS(SQLITE).rar
- MC3362和MC145151调频无线接收器的设计.pdf
- MiniRenamer-v100.0一款简单易用的批量文件重命名工具(已注册PRO版本).rar
- 小狐狸Ai系统 小狐狸ai付费创作系统V2.8.0 ChatGPT智能机器人
- 公孙离-内衣-肚兜.zipgsl
- 快慢指针判断链表是否有环-go 语言实现
- 学生成绩管理系统的设计与实现-收藏备用.pdf
- JSP+SQL网站流量统计管理系统(源代码+论文).rar
- IBM-PC-XT微机过程...道中模拟量数据的采集和处理.pdf
- JSP+SQL网上选课系统(源代码+论文+答辩PPT).rar