k均值约束
K-均值聚类实现,可以为每个聚类指定最小和/或最大大小。
通过将K-means实现公式化为最小成本流(MCF)线性网络优化问题,它可以修改集群分配步骤(EM中的E)。 然后,使用成本缩放推入重新标记算法解决此问题,并使用这是一种快速的C ++实现)。
该软件包的灵感来自 。 Bradley等人提出的原始最低成本流(MCF)网络。 已被修改,因此最大群集大小和最小群集大小也可以指定。
该代码基于并实现了相同的 。
参考:
安装
您可以从PyPI安装k-means-constrained:
pip install k-means-constrained
在Python 3.6及更高版本中受支持。
例子
可以在API文档中找到更多详细信息。
>> > from k_means_constrained import KMeansConstrained
>> > i