[GAN]老照片修复Bringing Old Photos Back to Life论文总结

news/2023/12/9 16:35:59

Title

Title:Bringing Old Photos Back to Life
Source:CVPR2020
论文官网
Code

1.Summary

文章提出并解决了两个问题。

  • 问题一 泛化问题(Generalization):目前的老照片修复算法在合成数据集上学习到的模型在真实数据上泛化能力差。(解决方案一 Latent space translation:假设能将合成数据与真实老照片域编码到同一隐空间,实际操作尽可能缩小域间差异Domain Gap,而后学习隐空间映射)
  • 问题二 混合退化问题(Mixed Degradation):空间均匀的非结构化退化,如噪声、模糊、褪色和低分辨率,以及结构化退化,如孔洞、划痕和斑点。 实际待修复老照片存在混合的复杂退化问题。(解决方案二 Partial Nonlocal Block:普通残差块感受野有限,仅能修复局部特征即非结构化退化,结构化退化依赖于全局图像上下文信息进行修复)

2.Method

2.1 泛化问题(Generalization)的解决

Step1 分别训练 V A E 1 {VAE}_1 VAE1 V A E 2 {VAE}_2 VAE2

在这里插入图片描述

  • 目标是学习R到Y的映射,即给定一个真实老照片r,得到清晰的修复结果。
    在这里插入图片描述
  • 为了解决合成照片与真实照片域间差异导致的泛化性问题,X与R共享同一个VAE1(图中绿色部分domain gap标注有误,应标注在非交集的部分)。其中,VAE比普通自编码器更容易获得密集分布的隐空间表示,这样 Z X Z_X ZX Z R Z_R ZR之间的domain gap会更小。训练一个鉴别器来区分 Z X Z_X ZX Z R Z_R ZR,以进一步缩小domain gap。
    请添加图片描述
    在这里插入图片描述
  • 总目标函数为
    在这里插入图片描述

Step2 固定 V A E 1 {VAE}_1 VAE1 V A E 2 {VAE}_2 VAE2,独立训练隐空间映射T

在这里插入图片描述
在这里插入图片描述
其中,
在这里插入图片描述
在这里插入图片描述

2.2 多种退化模式问题(Mixed Degradation)的解决

在这里插入图片描述

  • non-local等注意力机制的本质是re-weighting
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
  • 最后non-local仅作用于corrupted region(即结构化退化,依赖全局信息的部分)
    在这里插入图片描述

3.Evaluation

3.1 Setup

  • 训练集:1. Pascal VOC+渲染上结构化与非结构化退化。2. 5718张真实老照片
  • 划痕检测:训练了一个U-net+focal loss(正负样本均衡),除了利用Pascal VOC训练以外,还对收集到的783张有划痕的真实老照片进行标注,并使用400张图片进行fine-tune。(目的是在partial non-local处获得mask)
  • 训练细节:优化器Adam solver( β 1 \beta_1 β1为0.5, β 2 \beta_2 β2为0.999);学习率为前100epoch=0.0002,而后线性衰减到0;训练时图片随机裁剪到256x256;公式2、5中的超参数设定为 α = 10 , λ 1 = 60 , λ 2 = 10 \alpha=10,\lambda_1=60,\lambda_2=10 α=10,λ1=60,λ2=10

3.2 Analysis

  • 定量
    在这里插入图片描述
  • 定性
    在这里插入图片描述
  • User-study
    在这里插入图片描述

3.3 Ablation Study

Latent translation with VAEs

  • 目的是为了更容易缩小domain gap。其中从左往右逐渐增加组件。1)Pix2Pix:translation in image-level 2)two VAEs with an additional KL loss to penalize the latent space 3)两阶段训练,VAEs权重不固定 4)完整模型,采用了latent adversarial loss。
    在这里插入图片描述
  • Wassestein距离越小,latent space越compact;BRISQUE越低,修复后的图片质量越高。
    在这里插入图片描述

Partial nonlocal block

在这里插入图片描述

4.Conclusion

Strong conclusions:
We propose a novel triplet domain translation network to restore the mixed degradation in old photos. The domain gap is reduced between old photos and synthetic images, and the translation to clean images is learned in latent space. Our method suffers less from generalization issue compared with prior methods.

  • 三个域之间的图像转换网络
  • 缩小隐空间domain gap,并在隐空间学习到更佳的图像转换结果
  • 泛化性更强

Weak conclusions:
We propose a partial nonlocal block which restores the latent features by leveraging the global context, so the scratches can be inpainted with better structural consistency.

  • partial nonlocal。消融实验仅定性,效果一般,方法简单,创意不足。

仍存在的问题:complex shading artifacts上效果不佳,原因可能是数据集中具有复杂缺陷的老照片不多。
在这里插入图片描述

5.Reference

  • Track五篇对比方法
  1. M. Suganuma, X. Liu, and T. Okatani, “Attention-based adaptive selection of operations for image restoration in the presence of unknown combined distortions,” arXiv preprint arXiv:1812.00733, 2018.
  2. D. Ulyanov, A. Vedaldi, and V. Lempitsky, “Deep image prior,” in Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2018, pp. 9446–9454.
  3. T.-C. Wang, M.-Y. Liu, J.-Y. Zhu, A. Tao, J. Kautz, and B. Catanzaro, “High-resolution image synthesis and semantic manipulation with conditional gans,” in Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2018, pp. 8798–8807.
  4. J.-Y. Zhu, T. Park, P. Isola, and A. A. Efros, “Unpaired image-to-image translation using cycle-consistent adversarial networks,” in Proceedings of the IEEE International Conference on Computer Vision, 2017, pp. 2223–2232.
  5. K. Dabov, A. Foi, V. Katkovnik, and K. Egiazarian, “Bm3d image denoising with shape-adaptive principal component analysis,” 2009.
  6. K. Nazeri, E. Ng, T. Joseph, F. Qureshi, and M. Ebrahimi, “Edgeconnect: Generative image inpainting with adversarial edge learning,” 2019.

Attention-based Adaptive Selection of Operations for Image Restoration in the Presence of Unknown Combined Distortions(CVPR2019)

  • image-to-image translation图像转换
  • Deal with multiple combined distortions with unknown mixture ratios
  • 并行执行多个操作,这些操作由注意力机制加权,根据输入选择适当的操作。
    在这里插入图片描述

在这里插入图片描述

Deep Image Prior(CVPR2018)

  • Standard inverse problems such as denoising, super-resolution, and inpainting。一系列image restoration问题都是Standard inverse problems。

  • image restoration分为learning-based和learning-free。该方法利用一张受损图片,在深度神经网络中直接迭代来进行修复。

在这里插入图片描述

  • 神经网络的躁声阻抗性high noise impedance。神经网络天生具有对自然信号的低阻抗性和对噪声的高阻抗性。

在这里插入图片描述

  • 由于网络学信号学得快,学噪声学得慢,所以要利用这一点控制好迭代次数:不能太少,否则学不到位,输出结果结构模糊;也不能太多,否则学的太好,跟 x 0 x_0 x0过于相似,把噪声也一起学了。其中 x 0 x_0 x0为corrupted image。

High-Resolution Image Synthesis and Semantic Manipulation with Conditional GANs(CVPR2018)

  • image-to-image translation, whose goal is to translate an input image from one domain to another domain given input-output image pairs as training data

  • pix2pix framework

  • coarse-to-fine generator
    在这里插入图片描述

  • multi-scale discriminator architecture, and a robust adversarial learning objective function。判别器有三个,针对不同尺寸图像。三个尺寸分别是原尺寸,二分之一,四分之一。receptive field大小的问题。

6.Arouse for me

口碑好的AI图片修复网站
论文作者网站,老照片修复
发现对图像进行处理(结构化、非结构化缺陷)均隶属于Image Restoration领域。GAN、VAE是经常出现的。


http://www.ppmy.cn/news/556886.html

相关文章

win10怎么更新显卡驱动_Win10五月更新导致严重硬盘驱动器管理问题

IT之家6月15日消息 早前我们曾报道过,微软已经获悉Windows 10版本2004(Win10五月更新)的Fresh Start问题,但好在这并没有造成数据丢失,因此并没有那么严重。 不过,上述问题似乎只是更严重问题的预兆,因为Windows 10 20…

理解redis的多线程和IO多路复用

参考资料 https://blog.csdn.net/TZ845195485/article/details/119745735 Redis单线程和多线程问题的背景 Redis里程碑版本迭代 Redis的单线程 主要是指Redis的网络IO和键值对读写是由一个线程来完成的,Redis在处理客户端的请求时包括获取(socket读&a…

小米手机无法打开WIFI

*因为我之前修改过/data/misc/wifi下的配置文件,导致无法打开WiFi 解决方法 下载RE文件浏览器(或者一切能够通过获取ROOT从而进入系统目录的资源管理器);获取root权限并授权RE文件浏览器;打开/data/misc找到dhcp文件夹,将此文件夹里面的文件…

优麒麟20.10 wifi 开关打不开解决方案

优麒麟20.10 wifi 开关打不开解决方案 项目场景:问题描述:原因分析:解决方案: 项目场景: 优麒麟20.10无限网络配置 问题描述: 今天重新安装电脑操作系统优麒麟,在配置无线网络时发现&#xf…

手机连接wifi后,不能打开微信图片

问题 网站中的视频、图片都可以正常访问,微信、QQ等聊天工具也都正常 1:唯独微信中的图片不能打开,一直处于加载状态。 2:发送微信图片和接收微信图片特别慢 分析 断开wifi,用手机流量上网,一切正常。…

不打开Wifi获取Mac地址

今天遇到一个问题,要求不打开Wifi的前提下获取Mac地址,所以针对Android上Mac地址的获取做了总结。 MAC地址:每个接入网络的设备都有一个专门的序号,这个序号就是MAC。手机里的MAC特指WIFi无线网卡的MAC地址。 手机获取MAC地址的方…

热点登陆打不开网页 服务器已关闭,手机登录路由器管理页面打不开怎么办?...

问:由于我家里没有电脑,因此我想手机来设置我的路由器,但是我在手机上打不开路由器的管理页面,我应该怎么办? 答:手机设置路由器的时候,如果打不开路由器的管理页面,请按照下面的步骤…

移动网络打不开香港服务器网站,移动宽带打不开网站怎么办

自从安装使用了移动宽带,就发现很多网页都打不开,这时可以通过更改DNS的方式解决这个问题,移动宽带打不开网站的解决方法其实很简单,下面由学习啦小编告诉你! 移动宽带打不开网站的解决方法 1桌面左下角找到windows开始并鼠标单击…

win10计算机网络共享打不开,windows10系统打不开WiFi热点如何修复

操作windows10系统时会遇到形形色色的问题,比如打不开WiFi热点的问题。打开WIFI热点我们可以将我们电脑的网络共享给手机,使得我们的手机能够节省一些流量。但遇到windows10系统打不开WiFi热点问题怎么办?接下来我们一起看看修复方法。 什么是…

wifi服务器无响应如何修复,wifi打不开怎么修复?wifi打不开原因是什么

随着生活质量的提高,我们也逐渐的步入信息化时代,手机,电脑成为了我们生活不可缺少的运用工具,而随着科技化的不断发展,手机,电脑,笔记本,一种更加小巧精致而又方便携带的运用工具已经成为了消费者购买的对象,但是,有时我们会在使用过程中出现wifi打不开的情况,这时…

热点能打开网页wifi打不开_热点可以打开,无线WiFi打不开

Wi-Fi是一种能够将个人电脑、手持设备(如Pad、手机)等终端以无线方式互相连接的技术。Wi-Fi是一个无线网路通信技术的品牌,由Wi-Fi联盟(Wi-Fi Alliance)所持有。Wi-Fi上网可以简单的理解为无线上网,几乎所有智能手机、平板电脑和笔记本电脑都支持Wi-Fi上网,是当今使用最广的…

大数据开发类岗位算法编程题准备

2022年跳槽总结,仅供参考 一、算法题考察方式 单独机试面试时在线手撕 写一道写多道(笔者遇到要写5道的公司,累呀) codereview形式(仅一家公司遇到,很新颖,值得推广) 注意: 1、难度基本等同于leetcode mid左右&…

【自然语言处理NLP】Bert预训练模型、Bert上搭建CNN、LSTM模型的输入、输出详解

一、BertModel的输入和输出 from transformers import BertModel bertBertModel.from_pretrained(bert-base-chinese) outbert(context, attention_maskmask)1. 输入 Bert模型的输入context张量需要满足以下要求: 张量形状:context应为二维张量&#x…

m2硬盘写入速度测试软件,实测:M2固态硬盘换个插槽传输速度竟然提升了约1000M!...

最近入手了一块M2接口(nvme协议)的固态硬盘,安装相对简洁,在这提醒各位小伙伴一下,M2固态硬盘默认是不带螺丝的,我自己从笔记本光驱上卸下来个螺丝使用的。不需要硬盘线,也不需要外接电源,对布线来说是非常…

python3安装M2Crypto模块

一、环境说明 1.操作系统:Ubuntu Desktop 18.04; 2.python版本:python3.6; 3.官网地址:https://gitlab.com/m2crypto/m2crypto 二、安装 1、安装依赖,命令如下: sudo apt install libssl-dev s…

传奇服务器 m2自动开启网关,GOM的M2里提示:非法网关连接 添加网关所在机器IP怎么回事?...

今天在服务器上帮一个朋友架设一个GOM引擎的服务端,一切配置好了以后,成功进入游戏,开始测试,但在M2server里面总是提示:非法网关连接(需要在"D\MirServer\Mir200\!Servertable.txt文件里面添加网关所在机器IP&am…

m2增长率曲线_M1 和 M2的走势解读

货币总M2对房地产的中长期有着重要影响。图中可以清晰看出,1997年以来M2经历了一轮完整的上升过程和目前正在进行的下降过程,且此轮M2增速呈现较快的下滑速度,从2012年20%逐级较快的回落至目前2017年底的8.2%,5年左右下降幅度超过…

M2MQTT客户端MqttClient异常问题解决

最近做一个物联网设备模拟器,C#net4.5,采用M2Mqtt.Net.dll开发库,从VS2017工具nuget安装。服务器采用EMQ 2.3.11稳定版。 计划是一个c#winform应用程序,批量模拟多个物联网数据采集器上传数据到服务器。1分钟一个链接发一条指令。…

C# MQTT客户端--M2MQTT

m2mqtt库:https://github.com/eclipse/paho.mqtt.m2mqtt m2mqtt手册:https://m2mqtt.wordpress.com/using-mqttclient/ m2mqtt下载:https://www.nuget.org/packages/M2Mqtt/ 准备 本客户端使用VS2015进行开发,所以需要实现安装VS…

windows下安装 M2Crypto

为了在windows下安装M2Crypto走了许多弯路。特此在此记录下。 安装M2Crypto使用python里的pip安装功能安装即可。 步骤: 1、首先下载安装python 2.7版本 。下载完成后把python的路径加入到环境变量中 2、安装pip 。pip的下载地址为:https://pypi.pyt…
最新文章