谷歌的去模糊人工智能:使您的图片更加清晰
谷歌的去模糊人工智能:使图片更清晰
告别模糊图像。谷歌的新技术发掘了你手机相机的真正潜力。
介绍
在我们不断发展的数字时代,通过摄影捕捉和分享瞬间已经成为我们生活的重要组成部分,因此拍摄出模糊的图像可能让人沮丧。无论是珍贵的家庭照片、令人惊叹的风景,还是特殊场合的快照,模糊的图像都会减弱视觉冲击力,让我们无法获得所期望的清晰度。
但不用担心。谷歌的新方法可以直接从你的手机上拍摄清晰的图像。现在大多数手机都配备了多个摄像头。谷歌利用两个不同摄像头同时拍摄同一场景的图像,并利用可学习的后处理技术对模糊的图像进行重点处理。通过同时使用一个广角(W)摄像头和一个超广角(UW)摄像头拍摄相同场景,该方法旨在将两者结合以获得更清晰的结果。
架构
DFNet模型接收到同一场景的广角和超广角拍摄图像,以及它们的虚化图。输入和目标虚化图表示原始图像和输出图像的模糊程度,其中每个像素值与相应图像像素的模糊程度成比例。
由于超广角和超广角图像具有不同的景深、对称性、焦点和颜色,将这些图像结合起来并不是一项简单的任务。因此,谷歌引入了一种基于学习的方法来拼接这些图像。
该模型将广角图像作为基础图像,超广角图像用作高频细节的参考。模型旨在根据提供的虚化图将两个图像混合在一起,以产生去模糊的图像。
在测试时,可以轻松更改目标虚化图,根据需要去模糊图像的不同部分。
如图所示,要生成完全清晰的图像,可以将虚化图设置为全零。这激励模型去去模糊图像的所有部分。在其他情况下,可以根据测试时提供的虚化图去去模糊图像的特定部分。
结果
在定性和定量分析上,后处理方法的PSNR和SSIM分数分别达到29.78和0.898,优于以前的方法。
结果显示了以前方法和谷歌的DFNet的最新结果,后者在清晰度和细节方面优于以前的方法。
该模型在图像重点处理、景深控制和重新渲染以及去模糊领域具有潜在用途。
限制
需要多个摄像头
该模型使用广角和超广角摄像头提供高频细节的参考。两个图像需要具有不同的景深,对场景的不同部分进行聚焦。从相同摄像头拍摄的图像将无法复制这样的结果。此外,对于单个图像输入,无法进行图像恢复。
数据集生成
很难获得广角和超广角图像的数据集,这些数据集通常很常见。通过给图像添加高斯模糊来合成这样的数据集,以模拟真实世界中的噪声是不可能的。为了减少域差距,作者为这种方法捕获了100个图像堆栈。
对现有方法的依赖
数据预处理部分是生成虚焦图、深度和遮挡掩码的必需品。预处理使用已知生成严重伪影的光流和立体深度算法,导致输出图像的降级。
结论
通过Google在图像恢复方面的最新进展,让模糊的图像不再存在。如果将其纳入手机相机背后的人工智能中,我们每天都能看到一个完美无瑕的世界,直接通过我们的手机。
考虑阅读论文以获得详细了解。
论文:https://defocus-control.github.io/static/dc2_paper.pdf
如果您喜欢这篇文章,并想了解更多关于机器学习和研究社区最新进展的内容,请关注我。