通常期望通过利用未标记的数据可以提高学习性能,尤其是在标记的数据数量有限的情况下。 但是,据报道,在某些情况下,现有的半监督学习方法的效果甚至比仅使用标记数据的监督学习方法还要差。 因此,希望开发出安全的半监督学习方法,当使用未标记的数据时,这种方法不会显着降低学习性能。 本文着重于提高半监督支持向量机(S3VM)的安全性。 首先,提出了S3VM-us方法。 它采用了保守的策略,并且仅使用未标记的实例,这些实例很有可能会有所帮助,同时避免使用高风险的实例。 这种方法可以提高安全性,但是使用未标记的数据来提高性能通常比S3VM小得多。 为了开发一种安全且性能良好的方法,我们检查了S3VM的基本假设,即低密度分离。 基于可以从训练数据中识别出多个好的候选低密度分离器的观察,这里提出了安全的半监督支持向量机(S4VM)。 此方法使用多个低密度分隔符来近似地面真相的决策边界,并最大程度地提高针对任何候选分隔符的感应SVM的性能改进。 在S3VM使用的假设下,此处显示S4VM具有可证明的安全性,并且可以最大程度地提高使用未标记数据的性能改进。 还介绍了S4VM的样本外扩展。 此扩展允许S4VM对