针对随机初始化方式对混合条件属性数据对象的适应调整能力非常低,且其任意性的本质特征,会造成聚类质量大幅度下降的缺陷,提出通过分类条件属性对象的熵值与数值条件属性对象的欧氏距离计算结果的对比,确定第一个簇中心元素的定位值;然后以迭代推理的方式评估混合条件属性对象间的距离及关系特性,获得下一个初始簇中心元素并依此类推的初始簇中心定位新算法NCBT(numeric-classification and between the two)。理论分析和实验表明,该算法平均定位准确率较随机初始化方式高出10个百分点,且具有良好的自适应性,能产生优良的聚类结果。