ISODATA聚类2.rar_whisperedjef_模糊聚类_聚类_聚类数据集_聚类方法_聚类方法资源-CSDN文库

共4个文件

m：3个

xlsx：1个

版权申诉

5星 · 超过95%的资源 111 浏览量 2022-07-14 12:25:06 上传评论收藏 16KB RAR 举报

ISODATA聚类，全称为Iterative Self-Organizing Data Analysis Technique，是一种迭代自组织数据分析技术，常用于无监督学习中的数据分类。该方法结合了K-Means聚类算法和模糊C-均值（Fuzzy C-Means, FCM）聚类算法的特点，既能处理离散型数据，又能处理连续型数据，并且能够自动确定最优的聚类数目。在K-Means算法中，数据被分配到最近的聚类中心，而聚类中心由其所属成员的平均值决定。然而，K-Means对于初始聚类中心的选择敏感，可能导致收敛到局部最优解。ISODATA通过迭代过程解决这一问题，每次迭代时，不仅更新聚类中心，还可能合并或分裂聚类，从而找到更合适的聚类结构。模糊C-均值聚类则引入了隶属度的概念，每个数据点可以同时属于多个聚类，其隶属度根据与各聚类中心的距离确定。这使得模糊聚类对边界数据的处理更加灵活，能更好地反映数据的分布特性。ISODATA在模糊C-均值的基础上增加了数据点的自我组织能力，使其能动态调整聚类数量，适应数据集的变化。 ISODATA的运行步骤大致包括： 1. 初始化：选择一定的聚类中心，通常随机选取数据集中的一部分样本点。 2. 分配数据：计算每个数据点到所有聚类中心的距离，根据隶属度规则将其分配到相应的聚类。 3. 更新聚类中心：重新计算每个聚类的中心，即该聚类所有数据点的加权平均值。 4. 检查聚类合并与分裂：如果某个聚类包含的数据点太少或者太多，就进行合并或分裂操作。 5. 判断停止条件：若满足预设的停止条件（如聚类中心不再显著移动，或者聚类数目不再变化），则停止迭代；否则，返回步骤2继续迭代。 ISODATA聚类方法在实际应用中，适用于各种类型的数据集，特别是在数据复杂性高、类别界限模糊的情况下，能够提供更准确的聚类结果。通过"ISODATA聚类2"这个压缩包文件，我们可以获取到ISODATA聚类的实现代码、示例数据集或相关研究，进一步理解和应用这种聚类方法。在分析和挖掘数据时，ISODATA可以帮助我们发现数据的内在结构，为后续的数据分析、模式识别和决策支持提供有力支持。

资源推荐

资源详情

资源评论

收起资源包目录

package

ISODATA聚类2.rar （4个子文件）

folder

ISODATA聚类2

实验数据.xlsx 17KB

seq2idx.m 171B

ISODATA.m 4KB

Belong2.m 320B

function ISODATA(x,K,theta_N,theta_S,theta_c,L,I) %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %%%%%%%%input parameters%%%%%% % x : data % K : 预期的聚类中心数 % theta_N : 每一聚类中心中最少的样本数，少于此数就不作为一个独立的聚类 % theta_S ：一个聚类中样本距离分布的标准差 % theta_c : 两聚类中心之间的最小距离，如小于此数，两个聚类进行合并 % L : 在一次迭代运算中可以和并的聚类中心的最多对数 % I ：迭代运算的次数序号 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %% step1 A0=xlsread('实验数据.xlsx'); A=[]; x=[A A0]; n = size(x,1); N_c = K; mean = cell(K,1); for i=1:K mean{i} = x(i,:); end ite = 1; while ite<I flag = 1; while flag %% step2 class = cell(size(mean)); for i=1:n num = Belong2(x(i,:),mean); class{num} = [class{num};x(i,:)]; end %% step3 for i=1:N_c size_i = size(class{i},1); if size_i<theta_N class_i = class{i}; mean = DeleteRow(mean,i); class = DeleteRow(class,i); N_c = N_c-1; for j=1:size_i class_ij = class_i(j,:);%the j'th row of class{i} num = Belong2(class_ij,mean); class{num} = [class{num};class_ij]; end end end %% step4 for i=1:N_c if ~isempty(mean{i}) mean{i} = sum(class{i})./size(class{i},1); end end %% step5 Dis = zeros(N_c,1); for i=1:N_c if ~isempty(class{i}) N_i =size(class{i},1); tmp = bsxfun(@minus,class{i},mean{i}); Dis(i) = sum(arrayfun(@(x)norm(tmp(x,:)),1:N_i))/N_i; end end %% step6 D = 0; for i=1:N_c if ~isempty(class{i}) N_i =size(class{i},1); D = D + N_i*Dis(i); end end D = D/n; %% step7 flag = 0; if ite == I theta_c = 0; flag = 0; elseif ~(N_c > K/2) flag = 1; elseif mod(ite,2)==0 || ~(N_c<2*K) flag = 0; end %% 分裂处理 %% step8 if flag flag = 0; delta = cell(N_c,1); for i=1:N_c if ~isempty(class{i}) N_i =size(class{i},1); tmp = bsxfun(@minus,class{i},mean{i}); delta{i} = arrayfun(@(x)norm(tmp(:,x)),1:size(tmp,2))/N_i; end end %% step9 delta_max = cell(N_c,1); for i=1:N_c if ~isempty(class{i}) max_i = max(delta{i}); sub = find(delta{i}==max_i,1); delta_max{i} = [max_i,sub]; end end %% step10 for i=1:N_c if delta_max{i}(1) > theta_S N_i =size(class{i},1); con1 = (Dis(i)>D && N_i>2*(theta_N + 1)); con2 = ~(N_c>K/2); if con1 || con2 %%%%这里分裂%%%%% flag = 1;%一旦发生分裂，那么分裂一次后就返回第二步；若没发生分裂，则直接进入合并处理步 lamda = 0.5; max_sub = delta_max{i}(2); mean{i}(max_sub) = mean{i}(max_sub) + lamda * delta_max{i}(1); addOneMean = mean{i}; addOneMean(max_sub) = addOneMean(max_sub) - lamda * delta_max{i}(1); mean = [mean;addOneMean]; N_c = N_c+1; break; end end end end end %% 合并处理 if L %% step11 Distance = zeros(N_c,N_c); for i=1:N_c-1 for j=i:N_c Distance(i,j) = norm(mean{i}-mean{j}); end end %% step12 index = find(-Distance>theta_c); keepIndex = [Distance(index),index]; [~, index] = sort(keepIndex(:,1)); if size(index,1) > L index = index(1:L,:); end %% step13 if size(index,1) ~= 0 for id=1:size(index,1) [m_i m_j]= seq2idx(index(id),N_c); %%%%%这里合并%%%%% N_mi = size(class{m_i},1); N_mj = size(class{m_j},1); mean{m_i} = (N_mi*mean{m_i} + N_mj*mean{m_j})/(N_mi+N_mj); mean = DeleteRow(mean,m_j); class{m_i} = [class{m_i};class{m_j}]; class = DeleteRow(class,m_j); end end end %% step14 ite=ite+1; end for i=1:N_c fprintf('第%d类聚类中心为\n',i); disp(mean{i}); fprintf('第%d类中元素为\n',i); disp(class{i}); end end %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

内容反馈

版权申诉

m0_73753269

2023-10-02

资源内容详细全面，与描述一致，对我很有用，有一定的使用价值。

JaniceLu

粉丝: 98
资源: 1万+

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈

feedback-tip