人工数学建模和机器学习的优缺点进行介绍和比较
【导语】本文对传统的人工数学建模和机器学习的优缺点进行了介绍和比较,
并介绍了一种将二者优点相结合的方法——解耦表示学习。之后,作者利用 DeepMind 发
布的基于解耦表示学习的 beta-VAE 模型,对医疗和金融领域的两个数据集进行了探索,
展示了模型效果,并提供了实验代码。
这篇文章会对传统数学建模与机器学习建模之间的联系进行讨论。传统数学建模是我们在
学校里都学过的建模方法,该方法中,数学家们基于专家经验和对现实世界的理解进行建
模。而机器学习建模则是另一种完全不同的建模方式,机器学习算法以一种更加隐蔽的方
式来描述一些客观事实,尽管人类并不能够完全理解模型的描述过程,但在大多数情况下,
机器学习模型要比人类专家构建的数学模型更加精确。当然,在更多应用领域(如医疗、
金融、军事等),机器学习算法,尤其是深度学习模型并不能满足我们需要清晰且易于理
解的决策。
本文会着重讨论传统数学建模和机器学习建模的优缺点,并介绍一个将两者相结合的方法
—— 解耦表示学习 (Disentangled Representation Learning)。
如果想在自己的数据集上尝试使用解耦表示学习的方法,可以参考 Github 上关于解耦学
习的分享,以及 Google Research 提供的关于解耦学习的项目代码。
深度学习存在的问题
由于深度学习技术的发展,我们在许多领域都对神经网络的应用进行了尝试。在一些重要
的领域,使用神经网络确实是合理的,并且获得了较好的应用效果,包括计算机视觉、自
然语言处理、语音分析和信号处理等。在上述应用中,深度学习方法都是利用使用线性和
非线性转换对复杂的数据进行自动特征抽取,并将特征表示为“向量”(vector),这一过
程一般也称为“嵌入”(embedding)。之后,神经网络对这些向量进行运算,并完成相应
的分类或回归任务:
从特征提取和准确度来看,这种 “嵌入”的方法非常有效,但在许多方面也存在不足: