• 2019-ICCVlearning a Generative Model from a Single Natural Image(原文+代码)

    我们介绍了SinGAN,一个可以从单一自然图像中学习的无条件生成模型。我们的模型经过训练,能够捕捉图像内部patch的分布,然后能够生成与图像具有相同视觉内容的高质量、多样化的样本。SinGAN包含一个完全卷积的GANs金字塔,每个GANs负责学习图像中不同尺度上的patch分布。这允许生成具有显著可变性的任意大小和高宽比的新样本,同时保持训练图像的整体结构和精细纹理。与以往的单一图像GAN方案相比,我们的方法不仅限于纹理图像,而且没有条件(即从噪声中生成样本)。用户研究证实,生成的样本通常被混淆为真实的即时消息。我们说明了SinGAN在图像处理任务中的广泛应用。 ———————————————— 版权声明:本文为CSDN博主「Asure_AI」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。 原文链接:https://blog.csdn.net/Asure_AI/article/details/102869213

    0
    270
    124.07MB
    2019-11-02
    10
  • 2016-26cvpr.pdf

    跨视图识别是计算机视觉中的一个重要问题,它主要是对不同视图之间的样本进行分类。不同的视图之间的巨大差异使得这个问题相当具有挑战性。为了消除复杂的(甚至是高度非线性的)视点差异以获得良好的跨视点识别,我们提出了一个多视点深度网络(multi-view deep network, MvDN),该网络寻求多个视点之间共享的非线性鉴别和视点不变表示。具体来说,我们提出的MvDN网络由两个子网络组成,视图特定的子网络试图消除视图特定的变化,下面的公共子网络试图获得所有视图共享的公共表示。作为MvDN网络的目标,从所有视图的样本中计算Fisher损失,即瑞利商目标,以指导整个网络的学习。因此,来自MvDN网络顶层的表示法对差异具有鲁棒性,并且具有区分性。分别在13和2个视图的3个数据集上进行的跨姿态和跨特征类型的人脸识别实验表明了该方法的优越性,特别是与典型的线性方法相比

    0
    87
    364KB
    2019-10-30
    0
  • Deep Multimodal Subspace Clustering Networks.pdf

    博客锁对应的文档,需要的可以下载。 Abstract 提出了一种基于卷积神经网络的无监督多模态子空间聚类算法。该框架主要由三部分组成:多模态编码器、自表达层和多模态解码器。编码器以多模态数据为输入,将其融合到一个潜在的空间表示中。自表达层负责增强自表达性并获得与数据点对应的亲和矩阵。解码器重建原始输入数据。该网络利用译码器的重构与原始输入之间的距离进行训练。我们研究了早期、晚期和中期的融合技术,并提出了三种不同的用于空间融合的编码器。对于不同的空间融合方法,自表达层和多模态解码器本质上是相同的。除了各种空间融合方法外,还提出了一种基于亲和融合的网络,该网络中不同模式对应的自表达层是相同的。在三个数据集上的大量实验表明,所提出的方法明显优于目前最先进的多模态子空间聚类方法。

    0
    296
    4.47MB
    2019-10-26
    34
  • 分享小兵

    成功上传3个资源即可获取
  • 创作能手

    授予每个自然周发布1篇到3篇原创IT博文的用户
关注 私信
上传资源赚积分or赚钱