数据要素产业

黑科技？杜克大学新研发AI工具可将低像素图像清晰度提高60倍

12-08 00:00

TAG： 人脸识别计算机视觉生成式对抗网络

杜克大学研究人员于最近研发出一种新的AI工具，可以将模糊到难以辨认的人脸图像转化成电脑生成的图像，其细节呈现将比以往任何技术都更加精细。

对比那些可以将人脸图像缩放到原始分辨率8倍的技术，杜克大学的AI工具可以在像素极低的情况下，创造出一张分辨率比原始图像高64倍的逼真面孔，同时还会为它添加一些原本不存在的细纹、睫毛和胡茬等特征。

研究人员表示，这个系统不能被用于识别身份，因为它无法将监控摄像头下失焦到无法识别的照片变成清晰的真人图像图像。它能做到的是生成不存在但看起来似乎真实的新面孔。

刚刚从杜克大学以数学和计算机科学双学位毕业的Sachit补充道，当研究人员以人脸为对象进行概念验证时，同样的技术在理论上可以将所有物体的低分辨率图像转换成高清的拟真版本，其应用领域包括医学、显微镜学、天文学和卫星图像等等。

传统的技术想要清晰化一幅低分辨率图像，通常会先看看要给它补充哪些额外像素，然后试图让它同电脑以前见过的高分辨率图像中对应的像素平均匹配。由于这种平均，头发和皮肤区域的纹理可能不会完美地从一个像素被复刻到下一个，使成像看起来还是模糊得不行。

杜克大学团队创新出的想法则是，他们不会先拍一张低分辨率的图像，然后慢慢地添加新的细节，而是直接搜索AI生成的高分辨率面孔样本，接着在缩小到相同大小时，尽可能地寻找与原始输入图像相似的面孔。

该团队采用了一种被称为“生成式对抗网络”的机器学习工具，简称GAN，它是针对同一组照片数据构建的两个神经网络。一个网络会以它接收的人脸为标准，搜索出AI创造的版本，而另一个网络则会接收输出的AI图像，并判断它是否真实到找不出一点违和感。随着样本的积累，到最后第一个网络给出的图像会让第二个网络挑不出一点差错。

这项技术被取名为PULSE，从一张模糊的人脸图像中，PULSE可以发展出无限可能性，它可以在几秒钟内将一张16x16像素的人脸图像转换为1024 x1024像素。而通过微妙的细节改变，每一张图都可能是一个不同的人。

即使给出一张眼睛和嘴巴都模糊不堪的像素化照片，研发人员也有自信该种算法仍能做到一些传统技术做不到的事情。在即将于6月14日－19日通过线上召开的计算机视觉和模式识别领域的顶级会议CVPR 2020上，研究人员会对PULSE进行进一步展示。

更多>数据要素产业相关信息

最新发布

点击排行

Select Language

AI社区

今日排行

本月搜索

Dataset Category

数据要素产业

黑科技？杜克大学新研发AI工具可将低像素图像清晰度提高60倍