没有合适的资源?快使用搜索试试~ 我知道了~
聚类马氏距离代码MATLAB-SDCOR:用于大规模数据集中局部离群值检测的可扩展的基于密度的聚类
共78个文件
mat:47个
m:12个
md:8个
需积分: 42 8 下载量 126 浏览量
2021-05-19
21:54:44
上传
评论
收藏 203.7MB ZIP 举报
温馨提示
聚类马氏距离代码MATLAB SDCOR 用于大规模数据集中局部离群值检测的可扩展的基于密度的聚类 作者: Sayyed-Ahmad Naghavi-Nozad,Maryam Amir Haeri和Gianluigi Folino 目录 抽象的: 本文提出了一种基于批量密度的聚类方法,用于大规模数据集中的局部离群值检测。 与众所周知的假定所有数据都驻留在内存中的传统算法不同,我们提出的方法具有可伸缩性,并且可以在有限的内存缓冲区范围内逐块处理输入数据。 在第一阶段建立一个临时的聚类模型; 然后,通过分析点的连续内存负载来逐步更新它。 随后,在可伸缩聚类结束时,获得原始聚类的近似结构。 最后,通过对整个数据集的另一次扫描并使用适当的标准,将偏远评分分配给称为SDCOR(基于可伸缩密度的聚类离群值比率)的每个对象。 对现实生活和综合数据集的评估表明,与需要将所有数据加载到内存中的最著名的传统基于密度的方法相比,该方法具有较低的线性时间复杂度,并且更加有效。 还有一些基于快速距离的方法,这些方法可以对磁盘中驻留的数据执行操作。 框架: 更详细地,所提出的方法包括三个主要阶段。 在第一阶段
资源推荐
资源详情
资源评论
收起资源包目录
SDCOR-master.zip (78个子文件)
SDCOR-master
Readme.md 19KB
images
SoftArch.jpg 189KB
SDCOR_RAMversion.png 147KB
SDCOR_DiskVersion.png 121KB
LICENSE 1KB
videos
SDCOR_RAMversion.wmv 13.76MB
SDCOR_DiskVersion.wmv 9.24MB
codes
SDCOR _ with visualization - read data from RAM
SDCOR.m 29KB
plotOptional.m 13KB
MAIN.m 25KB
MAIN.fig 4.5MB
results
testData
SDCOR(noVisDsk)_result_$testData2_(21867by2_600go)$_ROC=1.000_ROCstd=0.000_PR=0.998_PRstd=0.000_maxRun=1_Time=0.830.mat 218KB
SDCOR(noVisDsk)_result_$testData1_(21467by2_200lo)$_ROC=1.000_ROCstd=0.000_PR=0.995_PRstd=0.000_maxRun=1_Time=0.815.mat 217KB
synthData
Tolerance to a high number of outliers
SDCOR(noVisDsk)_result_$tolrData03_(34000by2_14000o)$_ROC=1.000_ROCstd=0.000_PR=1.000_PRstd=0.000_maxRun=40_Time=8.608.mat 315KB
SDCOR(noVisDsk)_result_$tolrData10_(48000by2_28000o)$_ROC=1.000_ROCstd=0.000_PR=1.000_PRstd=0.000_maxRun=40_Time=35.066.mat 429KB
SDCOR(noVisDsk)_result_$tolrData09_(46000by2_26000o)$_ROC=1.000_ROCstd=0.000_PR=1.000_PRstd=0.000_maxRun=40_Time=29.834.mat 415KB
SDCOR(noVisDsk)_result_$tolrData06_(40000by2_20000o)$_ROC=1.000_ROCstd=0.000_PR=1.000_PRstd=0.000_maxRun=40_Time=18.604.mat 364KB
SDCOR(noVisDsk)_result_$tolrData02_(32000by2_12000o)$_ROC=1.000_ROCstd=0.000_PR=1.000_PRstd=0.000_maxRun=40_Time=6.355.mat 298KB
SDCOR(noVisDsk)_result_$tolrData04_(36000by2_16000o)$_ROC=1.000_ROCstd=0.000_PR=1.000_PRstd=0.000_maxRun=40_Time=11.123.mat 331KB
SDCOR(noVisDsk)_result_$tolrData01_(30000by2_10000o)$_ROC=1.000_ROCstd=0.000_PR=1.000_PRstd=0.000_maxRun=40_Time=4.483.mat 281KB
SDCOR(noVisDsk)_result_$tolrData11_(50000by2_30000o)$_ROC=1.000_ROCstd=0.000_PR=1.000_PRstd=0.000_maxRun=40_Time=40.334.mat 448KB
SDCOR(noVisDsk)_result_$tolrData07_(42000by2_22000o)$_ROC=1.000_ROCstd=0.000_PR=1.000_PRstd=0.000_maxRun=40_Time=21.989.mat 381KB
SDCOR(noVisDsk)_result_$tolrData08_(44000by2_24000o)$_ROC=1.000_ROCstd=0.000_PR=1.000_PRstd=0.000_maxRun=40_Time=25.401.mat 399KB
SDCOR(noVisDsk)_result_$tolrData05_(38000by2_18000o)$_ROC=1.000_ROCstd=0.000_PR=1.000_PRstd=0.000_maxRun=40_Time=14.291.mat 348KB
Scalability test
SDCOR(noVisDsk)_result_$scalData06_(120200by10_200o)$_ROC=1.000_ROCstd=0.000_PR=0.995_PRstd=0.000_maxRun=40_Time=1.303.mat 987KB
SDCOR(noVisDsk)_result_$scalData02_(40200by10_200o)$_ROC=1.000_ROCstd=0.000_PR=0.995_PRstd=0.000_maxRun=40_Time=0.885.mat 348KB
SDCOR(noVisDsk)_result_$scalData10_(200200by10_200o)$_ROC=1.000_ROCstd=0.000_PR=0.995_PRstd=0.000_maxRun=40_Time=1.868.mat 1.59MB
SDCOR(noVisDsk)_result_$scalData07_(140200by10_200o)$_ROC=1.000_ROCstd=0.000_PR=0.995_PRstd=0.000_maxRun=40_Time=1.515.mat 1.12MB
SDCOR(noVisDsk)_result_$scalData03_(60200by10_200o)$_ROC=1.000_ROCstd=0.000_PR=0.995_PRstd=0.000_maxRun=40_Time=1.002.mat 507KB
SDCOR(noVisDsk)_result_$scalData09_(180200by10_200o)$_ROC=1.000_ROCstd=0.000_PR=0.995_PRstd=0.000_maxRun=40_Time=1.749.mat 1.43MB
SDCOR(noVisDsk)_result_$scalData04_(80200by10_200o)$_ROC=1.000_ROCstd=0.000_PR=0.995_PRstd=0.000_maxRun=40_Time=1.100.mat 667KB
SDCOR(noVisDsk)_result_$scalData08_(160200by10_200o)$_ROC=1.000_ROCstd=0.000_PR=0.995_PRstd=0.000_maxRun=40_Time=1.634.mat 1.27MB
SDCOR(noVisDsk)_result_$scalData01_(20200by10_200o)$_ROC=1.000_ROCstd=0.000_PR=0.995_PRstd=0.000_maxRun=40_Time=0.812.mat 190KB
SDCOR(noVisDsk)_result_$scalData05_(100200by10_200o)$_ROC=1.000_ROCstd=0.000_PR=0.995_PRstd=0.000_maxRun=40_Time=1.204.mat 828KB
Accuracy and stability analysis
SDCOR(noVisDsk)_result_$accrData2_(1000000by40_10000o)$_ROC=1.000_ROCstd=0.000_PR=1.000_PRstd=0.000_maxRun=40_Time=41.162.mat 7.83MB
SDCOR(noVisDsk)_result_$accrData1_(500000by30_5000o)$_ROC=1.000_ROCstd=0.000_PR=1.000_PRstd=0.000_maxRun=40_Time=12.863.mat 3.93MB
SDCOR(noVisDsk)_result_$accrData3_(1500000by50_15000o)$_ROC=1.000_ROCstd=0.000_PR=1.000_PRstd=0.000_maxRun=40_Time=89.455.mat 11.72MB
SDCOR(noVisDsk)_result_$accrData4_(2000000by60_20000o)$_ROC=1.000_ROCstd=0.000_PR=1.000_PRstd=0.000_maxRun=40_Time=161.932.mat 15.52MB
realData
SDCOR(noVisDsk)_result_$Mammography_(11183by6_260o)$_ROC=0.820_ROCstd=0.037_PR=0.148_PRstd=0.067_maxRun=40_Time=0.701.mat 92KB
SDCOR(noVisDsk)_result_$Shuttle_(49097by9_3511o)$_ROC=0.969_ROCstd=0.009_PR=0.617_PRstd=0.049_maxRun=40_Time=0.907.mat 400KB
SDCOR(noVisDsk)_result_$Http_(567498by3_2211o)$_ROC=0.999_ROCstd=0.001_PR=0.463_PRstd=0.063_maxRun=40_Time=1.848.mat 2.94MB
SDCOR(noVisDsk)_result_$CreditCardFraud_(284807by29_492o)$_ROC=0.960_ROCstd=0.001_PR=0.708_PRstd=0.003_maxRun=40_Time=7.811.mat 2.08MB
SDCOR(noVisDsk)_result_$Smtp_(95156by3_30o)$_ROC=0.779_ROCstd=0.008_PR=0.245_PRstd=0.083_maxRun=40_Time=0.895.mat 732KB
SDCOR(noVisDsk)_result_$Hepc_(2003171by7_5123o)$_ROC=0.989_ROCstd=0.003_PR=0.426_PRstd=0.070_maxRun=40_Time=17.632.mat 14.68MB
SDCOR(noVisDsk)_result_$ForestCover_(286048by10_2747o)$_ROC=0.935_ROCstd=0.006_PR=0.089_PRstd=0.009_maxRun=40_Time=1.643.mat 2.11MB
SDCOR(noVisDsk)_result_$Skin_(199283by3_5085o)$_ROC=0.882_ROCstd=0.009_PR=0.096_PRstd=0.007_maxRun=40_Time=1.307.mat 1.04MB
SDCOR(noVisDsk)_result_$Adult_(38323by6_1168o)$_ROC=0.590_ROCstd=0.036_PR=0.073_PRstd=0.020_maxRun=40_Time=0.855.mat 335KB
datasets
testData
testData1_(21467by2_200lo).mat 329KB
testData2_(21867by2_600go).mat 337KB
synthData
Readme.md 991B
realData
Shuttle_(49097by9_3511o).mat 539KB
Adult_(38323by6_1168o).mat 503KB
Mammography_(11183by6_260o).mat 225KB
Smtp_(95156by3_30o).mat 745KB
ForestCover_(286048by10_2747o).mat 4.64MB
Http_(567498by3_2211o).mat 2.64MB
CreditCardFraud_(284807by29_492o).mat 59.49MB
Hepc_(2003171by7_5123o).mat 34.2MB
Skin_(199283by3_5085o).mat 1.37MB
_competing methods
LOF & LoOP
Readme.md 3KB
LOF_LoOP.m 9KB
DOLPHIN
Readme.md 8KB
DOLPHIN_dsload.m 518B
DOLPHIN_dssave.m 394B
dolphin.bin 65KB
DolphinParamEstim.m 776B
Experiment_AUCcalc.m 2KB
EnLOF
Readme.md 3KB
EnLOF.m 881B
Sp
Sp.m 468B
Readme.md 3KB
ORCA
Readme.md 6KB
ptime.exe 24KB
X-means
Readme.md 4KB
ptime.exe 24KB
SDCOR _ without visualization - read data from Disk
SDCOR.m 27KB
MAIN.m 20KB
MAIN.fig 3.52MB
共 78 条
- 1
资源评论
weixin_38524246
- 粉丝: 6
- 资源: 920
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功