提出一种基于主成分分析及匹配聚类分析的数据表语义压缩方法PCA-Clustering。主成分分析利用属性间相关性,提取主成分以实现纵向压缩;匹配聚类通过对匹配程度的量度决定元组的隶属,用较少的簇集代表元组代替所有元组以实现横向压缩,并充分利用较小的允许误差取得更好的压缩比。仿真实验结果表明,在数据属性间线性相关关系明显的情况下,PCA-Clustering在压缩比方面平均优于Fascicles和ItCompress10%~15%左右;与采用CaRT模型的SPARTAN相比,由于CaRT对于线性相关明显的数