如果一個人只看網(wǎng)文,那會寫出來怎樣的文字?看了 100G 網(wǎng)文后,這個 AI 模型幫你試了一下。
先來一段自由創(chuàng)作:
乍眼看去很有內(nèi)味,而且基本是一秒十字甚至更快的生成速度,非常的 amazing。
那再放一段經(jīng)典網(wǎng)文故事高潮前的內(nèi)容,讓 AI 作家?guī)兔m(xù)一下?
呃…… 不是“三十年河?xùn)|,三十年河西,莫欺少年窮”,沒內(nèi)味兒?。?/p>
這就是開發(fā)者親切地稱之為“人工智障寫作”,由 GPT 魔改而成的模型 AI-Writer:
一秒十字,無限續(xù)寫
這一模型擁有 100M 參數(shù)量,基于 100G 網(wǎng)絡(luò)小說訓(xùn)練,沒有采用任何其他素材。
因此,AI-Writer 相當(dāng)于是一位“只看網(wǎng)絡(luò)小說”的創(chuàng)作者,不具備任何網(wǎng)文以外的常識,行文風(fēng)格自然也就比較小白。
但好在閱書無數(shù),一句同樣的開頭:
就能生成風(fēng)格迥異,走向不同的多個片段:
也可以自定義每次的生成字?jǐn)?shù),像上面就是每次生成 200 字。
理論上可以無限生成文字,但時間長了也會陷入“不斷重復(fù)某字或某片段”的循環(huán)之中。
生成文字速度受加速方式的影響,目前支持 N 卡、A 卡、I 卡、GPU 加速,可以選擇最適合自己設(shè)備的方式:
像開頭展示的那段動圖,生成速度甚至不止一秒十字,就是通過 GPU 加速的效果。
如果你覺得 AI 寫的有點太過放飛自我,也可以設(shè)置生成文字的隨機程度。
要解釋這里的文字生成隨機性,就要說到 AI-Writer 所采用的一種特殊的采樣方法:
對于段落開頭
將 Top-P 設(shè)置為 0.995,幾乎完全按照輸出的概率分布采樣,增強行文變化
對于其他位置
先找到最高概率的字的概率 P,然后移除所有概率小于 0.02×P2 的字
這樣,模型生成的每一個字都是一個概率分布,因此,上面的文字生成的隨機程度,也就是文字生成時忽略小概率字的程度。
可以對比一下該值分別為 0.01,0.1,0.9 時的生成效果:
當(dāng)然,由于這是個只有 100M 參數(shù)的小模型,所以邏輯和閱讀理解能力是較低的。
用開發(fā)者的話來說,就是“它是個純智障,純屬娛樂”。
模型可直接試玩
不過,就算本著娛樂的目的,我們也來看看怎么做才讓這個 AI 作者動筆。
在環(huán)境配置上,開發(fā)者表示,如果采用他通過 C+AVX2 寫的純 CPU 版本,就不需要 Python 和 Pytorch,只要是 2014 年以后的 CPU 都能成功運行。
(作者已將這一版本上傳至交流群)
而上述演示的動圖則是在 Python3.8 和 Pytorch1.10 的環(huán)境配置下的 Demo。
在環(huán)境配置完畢后,下載模型和 Release 文件,在模型文件中新建一個 model 文件夾,并將 release 文件解壓放在 model 目錄下。
這時你就可以運行 python run.py,在終端快速生成文字:
(這里可以先安裝一下 DeepLearning 環(huán)境)
文字可以一直自由生成下去,可以通過 Ctrl+C 來停止。
當(dāng)然,由于這里是在 2.3 GHz 雙核 Intel Core i5 的 Mac 本上跑的,所以并沒有達(dá)到 10 字/秒的生成速度。
也可以在網(wǎng)頁中進(jìn)行試玩,運行 python server.py,并打開下載模型 web-client 文件夾中的 index.html。
然后就可以打開網(wǎng)頁,直接在對話框中輸入開頭,點擊按鈕進(jìn)行續(xù)寫了:
現(xiàn)在這個網(wǎng)頁版已經(jīng)初具模型,開發(fā)者希望能有更多的人參與進(jìn)來,一起將現(xiàn)階段的這個“人工智障”改進(jìn)成對于創(chuàng)作者而言的實用工具,以及對于讀者而言的娛樂方式。
下載鏈接:
https://github.com/BlinkDL/AI-Writer/releases
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。