設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

字節(jié)跳動(dòng)公開(kāi)深度學(xué)習(xí)新技術(shù):隨意變臉/照片會(huì)動(dòng),算量大幅減少

2021/9/19 15:53:33 來(lái)源:IT之家 作者:信鴿 責(zé)編:信鴿

IT之家 9 月 19 日消息 今日字節(jié)跳動(dòng)技術(shù)團(tuán)隊(duì)在其官方公眾號(hào)發(fā)表文章,介紹了字節(jié)跳動(dòng)的一項(xiàng)深度學(xué)習(xí)新技術(shù)。深度學(xué)習(xí)模型中的生成式對(duì)抗網(wǎng)絡(luò)(GAN),可以用于圖片風(fēng)格遷移、圖像編輯、圖片生成等場(chǎng)景,為畫面以及視頻改變風(fēng)格。

舉例來(lái)看,該技術(shù)可以將一匹棕色的馬變成斑馬,或者將莫奈的風(fēng)景畫變成真實(shí)的照片。依據(jù)一個(gè) 鞋子的輪廓,可以自動(dòng)生成真實(shí)的鞋子圖形。

圖片

圖片

2020 年,麻省理工學(xué)院、Adobe 和上海交通大學(xué)技術(shù)人員提出一種 GAN 壓縮算法,將算力消耗成功減少到 1/21。

最近,字節(jié)跳動(dòng)技術(shù)團(tuán)隊(duì)推出了一項(xiàng)自研 GAN 壓縮算法,名為“在線多粒度蒸餾技術(shù)”,簡(jiǎn)稱 OMGD。這項(xiàng)算法能夠極大降低 CycleGAN 和 Pix2Pix 模型的算力消耗,分別降至原來(lái)的 1/40 和 1/46。不僅參數(shù)和計(jì)算量更少,圖像生成效果也更好。

上圖的結(jié)果顯示,OMGD 消耗的計(jì)算量?jī)H為 1.219G,相比于原始狀態(tài)的 56.8G,計(jì)算量大幅減少,生成效果也更優(yōu)。

IT之家了解到,目前 OMGD 技術(shù)已經(jīng)應(yīng)用在多款抖音智能特效中。比如“三屏人生”,可以將過(guò)去、現(xiàn)在、未來(lái)的自己實(shí)時(shí)展現(xiàn)在屏幕上。

使用動(dòng)態(tài)照片功能,可以讓靜態(tài)畫面動(dòng)起來(lái),表情豐富逼真。

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知