AI 換臉后又來 AI 換字：Facebook 打造了“文字版的 Deepfake”

智東西 2021/6/17 23:06:29 責(zé)編：懶貓

評論：

6 月 17 日消息，據(jù) Facebook 官網(wǎng)顯示，他們剛剛公布了一個新的 AI 項目 —— 文本樣式筆刷（TextStyleBrush）。只需要提交某一個單詞的圖像，文本樣式筆刷就可以復(fù)制照片中文字的字跡，然后將其他文本統(tǒng)一替換成該類文字的樣式。簡單來說，就是可以模仿你的字跡。

同時，文本樣式筆刷技術(shù)運用了一種新的自我監(jiān)督 AI 模型，可以預(yù)先通過字體分類器（font classifier）和文本識別器（text recognizer）訓(xùn)練來識別源樣式（source style samples）和目標(biāo)內(nèi)容。

Facebook 認(rèn)為，文本樣式筆刷將釋放人們的創(chuàng)造性以及自我表達(dá)的潛力，協(xié)助打造個性化的文本和字幕。在 AR 領(lǐng)域，文本樣式筆刷可以提供虛擬和現(xiàn)實之間的文本轉(zhuǎn)換（photo-realistic translation of languages）技術(shù)。

目前，這份研究成果已經(jīng)在 6 月 10 日發(fā)表在 Facebook 官網(wǎng)，報告名稱為《文本樣式筆刷：通過一個簡單的例子來繼承“字形美學(xué)”（TextStyleBrush: Transfer of text aesthetics from a single example）》。

AI 換臉后又來 AI 換字：Facebook 打造了“文字版的 Deepfake”

報告鏈接：

https://ai.facebook.com/research/publications/textstylebrush-transfer-of-text-aesthetics-from-a-single-example

一、文字版 Deepfake，可自主理解“字跡”

文本樣式筆刷類似于文字處理器里的格式刷工具，更像文字版本的 Deepfake（AI 換臉軟件）。

文本樣式筆刷采用了先進(jìn)的 AI 訓(xùn)練方法，可以一次性傳輸所有信息，然后自動分離圖像中的文字信息與字體邊框、紙張背景等，不需要重新輸入新的源樣式示例。

與之前大多數(shù)人工圖像生成技術(shù)不同，文本樣式筆刷并不需要研發(fā)者設(shè)定特定類型或目標(biāo)樣式的參數(shù)。研發(fā)團(tuán)隊試圖構(gòu)建一個足夠靈活的人工智能系統(tǒng)來理解現(xiàn)實生活中不同文本和筆跡之間的細(xì)微差別。

AI 換臉后又來 AI 換字：Facebook 打造了“文字版的 Deepfake”

▲圖源 Facebook

這意味著，該人工智能系統(tǒng)需要自主理解任何字體的呈現(xiàn)形式，不僅是字體、書法、文字風(fēng)格，而且還需要理解字體形式的不同變換，如旋轉(zhuǎn)、彎曲（curved text）、紙筆之間的變形，以及圖片背景干擾（image noise）等。

如果 AI 不能剔除這些干擾信息，就不能從圖片中完整地得到文字本身的相關(guān)信息。同時，研發(fā)團(tuán)隊也很難為整個字母表或者數(shù)字的所有呈現(xiàn)形式都配上注釋。

該項研究證明，人們可以借助 AI，在各類場景中更加靈活和準(zhǔn)確地表達(dá)“字體美學(xué)”。但研究報告也同時提到，目前文本樣式筆刷技術(shù)仍有不足，還難以識別金屬材質(zhì)或不同顏色的文本。

二、多場景普遍使用，直接合成逼真照片

經(jīng)驗表明，文本樣式筆刷可以模仿垃圾桶、路牌、飲料瓶、店面裝飾等多場景下字體的文本樣式。

文本樣式筆刷技術(shù)對合成圖片的要求同樣很高。

AI 換臉后又來 AI 換字：Facebook 打造了“文字版的 Deepfake”

▲圖源 Facebook 研究報告

TextStyleBrush 模型是基于 StyleGAN2 設(shè)計，能夠形成非常逼真的圖片。

文本樣式筆刷技術(shù)不但可以將印刷體都轉(zhuǎn)換成手寫體，同時可以識別其他樣式的文字，將它自動合成手寫體樣式。

AI 換臉后又來 AI 換字：Facebook 打造了“文字版的 Deepfake”

同時，F(xiàn)acebook 還通過結(jié)合文字樣式分類、文本識別（OCR）和 GAN 這三種模型來保留文字輸出的樣式，再用通過字體分類器和文本識別器來“判斷”圖像的文字內(nèi)容是否合格。

三、你的字跡會被盜用？別擔(dān)心，該技術(shù)暫時不會落地現(xiàn)實

在期待新技術(shù)的應(yīng)用時，F(xiàn)acebook 也在報告中提到對技術(shù)濫用的擔(dān)憂。

他們擔(dān)心該項技術(shù)可能會如 Deepfake 一樣遭到濫用，甚至成為不法分子的作案工具，因此該項技術(shù)暫時不會落地現(xiàn)實。

Facebook 表示，他們希望通過公開這項 AI 研究結(jié)果，鼓勵業(yè)內(nèi)更多人士對虛擬文本的研究，以避免受到深度偽造文本攻擊（deepfake text attacks）。

他們認(rèn)為，如果人工智能研究人員能夠在構(gòu)建仿真文本方面技術(shù)領(lǐng)先，就可以更好地建立識別虛假文本的技術(shù)體系。

目前這項技術(shù)僅存在研究，但 Facebook 表示它可以在未來應(yīng)用廣泛，比如將圖像文本翻譯成不同的語言，創(chuàng)建個性化的文本信息和標(biāo)題，甚至協(xié)助在 AR 世界里翻譯現(xiàn)實文本。

結(jié)語：真假難辨，AI 呈現(xiàn)雙刃劍

2017 年，Deepfake 首次在美國社交新聞網(wǎng)站 Reddit 亮相，成功互換兩部電影女主角的臉。但很快，就被全球封禁。這期間，有一些人因為利益利用 Deepfake 偽造總統(tǒng)致辭，散布不實傳聞等，人們在真與假中惶惶不安。

圖片上的 PS 技術(shù)，視頻領(lǐng)域的 Deepfake 換臉技術(shù)，文字領(lǐng)域的文本樣式筆刷技術(shù)都會讓人難以分別真假，從而引發(fā)一系列辨別真假的鬧劇。

在期待技術(shù)給人們帶來更多便捷的時候，我們也要不忘對新的技術(shù)抱有謹(jǐn)慎的態(tài)度。

廣告聲明：文內(nèi)含有的對外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

AI 換臉后又來 AI 換字：Facebook 打造了“文字版的 Deepfake”

一、文字版 Deepfake，可自主理解“字跡”

二、多場景普遍使用，直接合成逼真照片

三、你的字跡會被盜用？別擔(dān)心，該技術(shù)暫時不會落地現(xiàn)實

結(jié)語：真假難辨，AI 呈現(xiàn)雙刃劍

相關(guān)文章

一、文字版 Deepfake，可自主理解“字跡”

二、多場景普遍使用，直接合成逼真照片

三、你的字跡會被盜用？別擔(dān)心，該技術(shù)暫時不會落地現(xiàn)實

結(jié)語：真假難辨，AI 呈現(xiàn)雙刃劍