jntbtysdestructor.zip_duke_其他资源-CSDN文库

共14个文件

m：14个

版权申诉

29 浏览量 2022-07-15 19:30:34 上传评论收藏 8KB ZIP 举报

标题中的"jntbtysdestructor.zip_duke_其他"可能是一个被压缩的文件包，其中包含了由"duke"创建或与"duke"相关的某个项目或教程的源代码。"EM"在IT领域通常指的是 Expectation-Maximization（期望-最大化）算法，这是一种在概率模型中估计参数的常用方法，特别是当数据存在缺失或者是由多个未观察到的隐变量所驱动的时候。描述中提到的"duke的tutorial on EM的matlab经典源码"表明这个压缩包可能是一个关于期望-最大化算法的MATLAB实现教程。MATLAB是一种强大的数值计算和数据分析环境，常用于科学计算、图像处理和机器学习等领域。这个教程可能包含了一系列的MATLAB脚本文件，帮助学习者理解和应用EM算法。让我们逐一分析压缩包内的文件名，以提取更具体的知识点： 1. `em.m` - 这很可能是EM算法的核心实现代码。在MATLAB中，`.m`文件是函数或脚本文件，所以这个文件可能包含了完整的EM算法流程，包括初始化、期望步骤和最大化步骤。 2. `kmeans.m` - K-Means是另一种聚类算法，它在无监督学习中寻找数据的分组。在这个上下文中，它可能是作为EM算法的一个辅助工具，用于初始化聚类中心或者比较与EM聚类结果的差异。 3. `makeClusters.m` - 这个文件可能用于生成模拟数据集，以便在实际运行EM算法之前进行测试或演示。 4. `RUNME.m` - 这通常是主运行脚本，当你运行这个文件时，它会按照预设顺序执行其他所有相关脚本，展示整个流程。 5. `showClusters.m` - 这个函数可能用于可视化聚类结果，帮助用户直观地理解算法的输出。 6. `emi.m` - EMI可能代表"Expectation-Maximization Iteration"，这是一个迭代过程，用以更新模型的参数直到收敛。 7. `zcheckSizes.m` - 这个函数可能是检查数据矩阵的大小，确保它们适合算法的要求。 8. `initClusters.m` - 另一个与聚类相关的函数，可能用于初始化EM算法中的聚类中心。 9. `gauss.m` - 在EM算法中，高斯分布常被用来建模隐变量的概率分布。这个文件可能是实现高斯分布函数的代码。 10. `rcolstd.m` - 这个函数名不常见，可能是一个内部使用的辅助函数，用于计算列的标准差，可能在标准化数据或调整变量尺度时使用。通过这些文件，我们可以推测这个教程涵盖了从数据生成、预处理、模型训练到结果可视化的一系列步骤。学习者可以借此深入理解EM算法的工作原理，并通过实际操作来提升对算法的应用能力。MATLAB的脚本结构清晰，便于学习和调试，使得这个教程对初学者和有经验的开发者都有很高的价值。

资源推荐

资源详情

资源评论

收起资源包目录

jntbtysdestructor.zip （14个子文件）

em.m 4KB

rcolstd.m 201B

RUNME.m 1006B

xcolmean.m 159B

showClusters.m 953B

1colmin.m 195B

makeClusters.m 2KB

kmeans.m 3KB

rcolmax.m 195B

colsum.m 155B

emi.m 947B

initClusters.m 778B

gauss.m 755B

zcheckSizes.m 832B

% Mixture-of-Gaussian density estimation with the Expectation Maximization algorithm. % % Inputs: % - x: a DxN matrix of N data points in a D-dimensional space % - p: a vector of K initial mixing probabilities, or, if a scalar, the % value of K, the number of desired mixture components. In the latter % - m: a DxK matrix with K initial values for the mixture means % - sigma: a vector of K initial values for the mixture standard deviations % - tol: a tolerance value; if the relative change of p, m, sigma from one iteration % to the next does not exceed tol, convergence is declared % - maxiter: maximum number of iterations % % Note: all parameters other than x and p are optional. Default values: % - m, sigma: initialized by initClusters(x) % - tol: 1.0e-6 times the standard deviation of the input point coordinates % - maxiter: 100 % % Sample input argument lists: % - em(x, K) % - em(x, K, [], sigma, [], maxiter) % - em(x, [], m) % - em(x, p, m, sigma) % - em(x, p, m, sigma, tol, maxiter) % % Outputs: % - p: final mixing probabilites % - m: final mixture means % - sigma: final mixture standard deviations % - pkn: a K x N matrix where pkn(k, n) is the probability that data point n belongs to model k % - niter: number of iterations to convergence. If negative, no convergence occurred % within maxiter iterations. In that case, niter is set to -maxiter. function [p, m, sigma, pkn, niter] = em(x, p, m, sigma, tol, maxiter) if nargin < 2 error('Must provide at least a matrix of data points and a desired number of mixture components') end if nargin < 3 m = []; end if nargin < 4 sigma = []; end if nargin < 5 tol = []; end if nargin < 6 maxiter = []; end if isempty(tol) tol = std(x(:)) * 1.0e-6; end if isempty(maxiter) maxiter = 100; end % Number of mixture components if max(size(p)) == 1 % p is really K K = p; % Initial mixing probabilities p = 1/K * ones(1, K); else K = length(p); end % Provide default initializers as needed if isempty(p) | isempty(m) | isempty(sigma) [m0, sigma0, p0] = initClusters(x, K); if isempty(m) m = m0; end if isempty(sigma) sigma = sigma0; end if isempty(p) p = p0; end end [N, D, K] = checkSizes(x, p, m, sigma); % Vectors useful for packaging oD = ones(D, 1); oN = ones(1, N); niter = 0; while 1 % Remember old values for convergence check oldp = p; oldm = m; oldsigma = sigma; % 'E' step: compute membership probabilities for k = 1:K q(k, :) = p(k) * gauss(x, m(:, k), sigma(k)); end pkn = q ./ (ones(K, 1) * colsum(q)); % 'M' step: compute mixture component parameters s = colsum(pkn'); p = s / sum(s); for k = 1:K m(:, k) = colsum(((oD * pkn(k, :)) .* x / s(k))')'; sigma(k) = sqrt(sum(colsum((x - m(:, k) * oN) .^ 2) .* pkn(k, :)) / s(k) / D); end % Perfect fit. Stop to avoid degeneracies if max(sigma) == 0 break; end % Check for convergence if converged(m, oldm, tol) & converged(sigma, oldsigma, tol) & converged(p, oldp, tol) break; end % Too many iterations? niter = niter + 1; if niter >= maxiter disp(sprintf('Warning: no convergence within %d iterations', maxiter)) niter = -maxiter; break; end end %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% function answer = converged(new, old, tolerance) d = new - old; % Greatest absolute norm change delta = max(sqrt(sum(d .^ 2))); % Mean size s = mean(sqrt(sum(new .^ 2))); % Is the relative change small enough? answer = (delta <= s * tolerance);

评论收藏

内容反馈

版权申诉