近日,美國(guó)杜克大學(xué)的研究團(tuán)隊(duì)研發(fā)了一個(gè)AI圖像生成模型PULSE。PULSE可以在5秒鐘內(nèi)將低分辨率的人像轉(zhuǎn)換成清晰、逼真的人像。
據(jù)了解,PULSE所做的工作并不是把輸入的低分辨率人像變成一張高分辨率的人像,而是“一對(duì)多”地輸出許多張面部細(xì)節(jié)各不相同的高分辨率人像。比如,用戶輸入一張16×16分辨率的圖像,PULSE可輸出一組1024×1024分辨率的圖像。
上述研究已在計(jì)算機(jī)視覺(jué)與模式識(shí)別會(huì)議CVPR 2020上發(fā)表,論文標(biāo)題為《PULSE:通過(guò)對(duì)生成模型的潛在空間探索實(shí)現(xiàn)自監(jiān)督照片上采樣》。
研究人員用高分辨人臉數(shù)據(jù)集CelebA HQ評(píng)估PULSE的性能。為了進(jìn)行對(duì)比,研究人員利用CelebA HQ數(shù)據(jù)集訓(xùn)練了監(jiān)督模型BICBIC、FSRNET和FSRGAN。
所有模型均以16×16分辨率的圖像作為輸入,BICBIC、FSRNET和FSRGAN模型以128×128分辨率圖像作為輸出,PULSE模型以128×128分辨率圖像和1024×1024分辨率圖像作為輸出。
評(píng)估結(jié)果顯示,圖像質(zhì)量方面,PULSE模型在生成眼睛、嘴唇等圖像細(xì)節(jié)方面的能力優(yōu)于其他模型。
此外,研究人員還利用平均意見(jiàn)分?jǐn)?shù)(MOS)測(cè)試來(lái)定量評(píng)估模型的分辨率。研究人員邀請(qǐng)40位評(píng)估者對(duì)6個(gè)模型的輸出結(jié)果進(jìn)行打分。結(jié)果顯示,PULSE的MOS分?jǐn)?shù)最高。
研究人員稱,未來(lái),PULSE或可被用于天文學(xué)、醫(yī)學(xué)等領(lǐng)域。比如,一位天文學(xué)研究人員輸入一張模糊的黑洞圖像,就可以獲得許多張可能的天體照片。