我们将卷积神经网络中的起始模解释为正则卷积和深度可分离卷积运算(深度卷积后的apointwise卷积)之间的中间步骤。在这种情况下,适当的可分离卷积可以理解为具有最大数量的塔的初始模块。这一观察结果使我们提出了一种新的深卷积神经网络结构的灵感来自于Inception,其中Inception模块已被深度可分离卷积所取代。我们发现,这种被称为Exception的架构在ImageNet数据集上略优于Inception V3(Inception V3是为其设计的),在包含3.5亿张图像和1.7万个类的更大图像分类数据集上明显优于Inception V3。由于Exception体系结构与Inception V3具有相同数量的参数,因此性能的提高不是由于容量的增加,而是由于更有效地使用了模型参数。