没有合适的资源?快使用搜索试试~
我知道了~
文库首页
课程资源
讲义
第12章--离群点检测.pdf
第12章--离群点检测.pdf
需积分: 10
1 下载量
139 浏览量
2022-01-07
00:41:58
上传
评论
收藏
1.45MB
PDF
举报
温馨提示
立即下载
第12章--离群点检测.pdf
资源详情
资源评论
资源推荐
Data Mining
离群点检测
2021/12/20
宋云胜
[email protected]
2
目录
1
离群点检测方法
离群点的概
念与类型
2
3
“离群而居者不为野兽即是神明”
引言
◆
随着数
据挖
掘技术
的快
速发展
,人
们在关
注
数据整体
趋势的
同时
,
开始越
来越
关注那
些
明显偏
离数
据整体
趋势
的离群
数据
点
,因为
这些数据点往往蕴含着更加重要的信息。
◆
离群点
挖掘
的目的
是有
效的识
别出
数据集中
的异常数据
,
并且挖
掘出
数据集中
有意
义的
潜在信息
。
亚里士多德
4
离群点
实例
5
什么是
离群点
?
什么是离群点?
➢
假定使用一个给定的统计过程来产生
数据对象集,离群点是一个数据
对象,它
显
著不同
于其他数
据对
象
,好像它是被不同
的机制产生的一样。
离群点的特点
➢
离群点不同于噪声数据
(噪声在数据
分析中不是令
人感兴趣的);
➢
离群点是有趣的,因为
怀疑产生它们
的机制不同于
产生其他数据的机
制;
➢
离群点检测还与演
变数据集上的
新颖性
检测(
novel
ty
detection
)相关;
离群点
剩余28页未读,
继续阅读
评论0
去评论
论文研究-基于粗约简和网格的离群点检测.pdf
浏览:184
为解决现有高维海量数据离群点挖掘在时间与空间效率上的不足,提出了一种基于粗约简和网格的离群点检测算法RRGOD。算法在基于密度的离群点检测算法LOF的基础上,结合粗糙集理论特点,引入属性权值概念,淘汰属性权值低于重要度阈值的属性降低维度,从而减少了进行聚类的计算量。在网格聚类阶段,对传统的网格划分方法进行改进,引入属性维半径向量概念,提出了一种可变网格划分方法,根据数据集特点自适应地划分网格空间。
论文研究-基于分化距离的离群点检测算法.pdf
浏览:94
为了满足大规模数据集快速离群点检测的需要,提出了一种基于分化距离的离群点检测算法,该算法综合考虑了数据对象周围的密度及数据对象间的距离等因素对离群点的影响,通过比较每一对象与其他对象的分化距离来计算其周围的友邻点密度,挖掘出数据集中隐含的离群点。实验表明,该算法能有效地识别离群点,同时能反映出数据对象在数据集中的孤立程度。算法的复杂度较低,适用于大规模数据集快速离群点检测。
论文研究-一种基于多重聚类的离群点检测算法.pdf
浏览:48
在LDOF算法的基础上, 提出一种基于多重聚类的离群点检测算法PMLDOF。该算法针对局部离群度量计算量大的缺点, 采用聚类剪枝技术作为减少计算量的方法; 同时, 为了避免将位于簇边缘的离群点错剪, 算法利用多重聚类的差异性对簇的边缘点进行筛选。在对数据集进行剪枝后, 计算剩余数据的局部离群度LDOF, 并找出符合条件的离群数据点。实验结果表明, 算法在时间复杂度和检测精度上具有更好的优越性。
论文研究-无线传感网离群点检测技术研究综述.pdf
浏览:134
无线传感器网络(wireless sensor network,WSN)受电池能量、计算能力、通信能力和内存空间及传感数据多维特征的限制,传统的离群点检测技术不能直接应用于WSN,因此出现了一系列针对WSN的离群点检测技术。对已有的WSN离群点检测技术进行了概述,根据各离群点检测技术的特征进行了分类和分析,并结合现有技术的缺陷和需求,展望了WSN离群点检测技术的未来研究方向和目标。
论文研究-基于K-means的数据流离群点检测算法.pdf
浏览:82
针对数据流中离群点挖掘问题,在K-means聚类算法基础上,提出了基于距离的准则进行数据间离群点判断的离群点检测DOKM算法。根据数据流概念漂移检测结果来自适应地调整滑动窗口大小,从而实现对数据流的离群点检测,与其他离群点算法的一系列实验验证和对比结果表明,DOKM算法在人工数据集和真实数据集中均可以实现对离群点的有效检测。
基于马尔科夫随机游走的两阶段离群检测算法.pdf
浏览:73
基于马尔科夫随机游走的两阶段离群检测算法.pdf
基于网格划分加权的分布式离群点检测算法.pdf
浏览:152
#资源达人分享计划#
基于自然最近邻的离群检测方法研究.pdf
浏览:90
在实际应用中,近邻技术具有简单、快速、高效的特点,受到研究人员的青睐。近来自然最近邻被提出并应用到离群检测和聚类中,鉴于自然最近邻消除了参数k 设置的特点,本文将自然最近邻的概念应用到逆k 最近邻、互k 最近邻、共享k最近邻中,提出了自然逆最近邻、自然互最近邻和自然共享最近邻。并将提出的3 种算法在离群点检测中进行了实验对比分析。实验结果表明自然逆最近邻和自然互最近邻能够有效发现局部和全局离群点。
数据挖掘中离群点检测的非参数方法研究.pdf
浏览:143
数据挖掘中离群点检测的非参数方法研究.pdf
一种基于密度聚类的分布式离群点检测算法.pdf
浏览:107
#资源达人分享计划#
第5章+挖掘建模之离群点检测.pdf
浏览:70
第5章+挖掘建模之离群点检测.pdf
论文研究-基于K-近邻树的离群检测算法.pdf
浏览:80
5星 · 资源好评率100%
为适应数据集分布形状多样性以及克服数据集密度问题,针对已有算法对离群簇检测效果欠佳的现状,提出了一种基于K-近邻树的离群检测算法KNMOD(outlier detection based on K-nearest neighborhood MST)。...
论文研究-高维数据离群点检测的局部线性嵌入方法.pdf
浏览:183
由于高维空间中数据点比较稀疏,用传统方法来检测高维空间中的离群点不能达到预期效果。提出了一种基于局部线性嵌入的离群点检测方法(OLLE)。在OLLE降维方法中,建立了一种有效的粗糙集模型,使数据集的下近似中的...
基于距离的离群点检测.zip_qundi_剔除 点_剔除离群点_基于距离_基于距离的离群点检测算法
浏览:139
5星 · 资源好评率100%
基于距离的离群点算法,能够剔除不良数据。
基于自然邻居邻域图的无参数离群检测算法.pdf
浏览:28
基于自然邻居邻域图的无参数离群检测算法.pdf
论文研究-基于自适应的高对比性子空间的高维离群点检测.pdf
浏览:133
基于子空间解决高维离群点挖掘的问题已经引起人们的广泛关注, 现有方法存在的主要问题是难以选取合适的子空间且选取计算量大、阈值等参数设置困难等。这些影响了检测精度和检测效率。利用高对比度子空间选取方法解决子空间选取问题, 利用自适应方法解决阈值参数的确定问题, 据此提出自适应的高对比性子空间离群点检测方法(AHiCS)。该方法利用统计检验算法选取高对比性子空间, 在高对比性的子空间里自适应计算离群点
论文研究-基于地统计学的空间离群点检测算法的研究.pdf
浏览:168
针对传统空间离群点检测算法构建邻域时参数选择困难、处理高维数据的时间复杂度较高等问题,提出了一种基于地统计学的空间离群点检测算法。该算法将空间自相关理论引入空间离群检测中,首先利用3σ规则识别全局离群点,然后利用Delaunay三角网构建空间邻域,将邻域节点均值代替全局离群点,最后使用局部Moran’ I作为空间异常的度量方法。仿真结果表明,该方法不需要选择参数,鲁棒性较强、检测率较高、误警率较低
异构分布式环境中的并行离群点检测算法.pdf
浏览:118
#资源达人分享计划#
基于大数据的高效分布式离群点检测算法.pdf
浏览:189
#资源达人分享计划#
论文研究-基于遗传聚类算法的离群点检测.pdf
浏览:123
讨论了基于多尺度主元分析的故障传感器数据重构问题。传统的多尺度主元分析方法没有建立故障传感器数据重构模型,在相关传感器信号的所有尺度上建立主元分析模型进行传感器故障诊断的基础上,将主元分析模型的重构结果组合后进行小波逆变换,设计了能够实现故障传感器数据重构的多尺度主元分析模型,从而实现故障传感器的数据重构。最后,利用试车台液氢供应系统的传感器数据仿真了几种典型传感器故障,并对设计模型实现数据重构的
基于数据挖掘的机电故障数据集离群点检测算法 (1).pdf
浏览:182
基于数据挖掘的机电故障数据集离群点检测算法 (1).pdf
VDOD:一种基于KD树的分布式离群点检测算法.pdf
浏览:38
#资源达人分享计划#
论文研究-基于椭球模型的无线传感器网络的局部离群点检测.pdf
浏览:82
针对现有的无线传感器网络(WSNs)的局部离群点检测算法由于存在未考虑监测环境的异质性而造成邻域划分不准确、检测精度低的问题, 提出适用于异质监测环境的基于椭球模型的无线传感器网络的局部离群点检测算法。...
k-means离群点剔除法matlab代码
浏览:5
4星 · 用户满意度95%
k-means离群点剔除法:主要运用聚类均值方法剔除数据中的离群点,增强模型预测的精度等,本文为matlab代码
论文研究-离群点挖掘研究.pdf
浏览:31
随着人们对欺诈检测、网络入侵、故障诊断等问题的关注,离群点挖掘研究日益受到重视。在充分调研国内外离群点挖掘研究成果的基础上,介绍了数据库领域离群点挖掘的研究进展,并概要地总结和比较了已有的各种离群点...
论文研究-基于离群点检测算法的窃取隐私应用检测方法的研究 .pdf
浏览:189
基于离群点检测算法的窃取隐私应用检测方法的研究,黄梅根,曾云科,根据Apriori算法和最小权限原则分析得出了28个可以获取并传送用户隐私信息的权限组合,本文称之为伪恶意权限组合。把各个伪恶意权限
神经网络技术下多尺度时序数据离群点挖掘.pdf
浏览:67
神经网络技术下多尺度时序数据离群点挖掘.pdf
论文研究-高维空间中针对离群点检测的特征抽取.pdf
浏览:4
2D转3D视频的快速实现算法主要有时分法和位移法。对时分法的原理和缺陷进行了分析,在此基础上提出了一种新的基于场景特征的时分算法,它能更好地3D化平面视频。该算法利用了基于视频帧图像的颜色信息和运动矢量信息对视频进行自动分割的方法,根据视频段场景特征自适应选择左右眼最佳配对帧方法,以及通过视频段运动矢量信息来调整左右眼对应帧和补帧的方法来改进处理和立体化视频。对合成立体视频的立体显示实验分析证明改
无线传感器网络分布式离群数据检测研究.pdf
浏览:46
#资源达人分享计划#
评论
收藏
内容反馈
立即下载
cure_myheart
粉丝: 42
资源:
5
私信
上传资源 快速赚钱
我的内容管理
展开
我的资源
快来上传第一个资源
我的收益
登录查看自己的收益
我的积分
登录查看自己的积分
我的C币
登录后查看C币余额
我的收藏
我的下载
下载帮助
前往需求广场,查看用户热搜
最新资源
MSP430F2619
SpringCloudAlibaba(大集合组件解析)Web版
Screenshot_20240516_131338.jpg
pdf转图片工具 图片合并工具
VMware 安装 CentOS 虚拟机-Bash版参考手册
Screenshot_20240516_131351.jpg
word文档.docx
emlog模板-蓝叶博客模板源码-清新大气模板,适合做博客和资源一体!亲测.zip
pdf转图片工具 图片合并工具
前馈神经网络要点和难点具体应用案例
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0