相同時(shí)間內(nèi),名為Sketch-a-Net的電腦程序識(shí)別草圖的正確率為74.9%,略高于人類的73.1%。
隨著觸摸屏越來(lái)越普及,人們?cè)絹?lái)越頻繁地直接用手繪制草圖,因此這項(xiàng)發(fā)展成果有望為人類和計(jì)算機(jī)的新式互動(dòng)奠定基礎(chǔ)。
使用這項(xiàng)程序,當(dāng)你想要找一個(gè)特定圖像的時(shí)候,用手指把它畫出來(lái),觸摸屏就能感知到你正在畫什么并進(jìn)行檢索。當(dāng)你想找家具或時(shí)尚配飾的時(shí)候,圖像檢索可比用關(guān)鍵字方便多了。而當(dāng)警方鑒證人員將畫家根據(jù)描述繪制的罪犯畫像與照片或監(jiān)控?cái)?shù)據(jù)進(jìn)行匹配的時(shí)候,這項(xiàng)程序也能派上用場(chǎng)。
有關(guān)該程序的論文已經(jīng)被英國(guó)機(jī)器視覺會(huì)議(the British Machine Vision Conference,BMVC)接收。這項(xiàng)研究也顯示出此程序善于識(shí)別草圖中的細(xì)節(jié)。比如,它能夠以42.5%的正確率辨別海鷗、飛鳥、站立的鳥和鴿子等特殊的鳥,而人類的正確率只有24.8%。
對(duì)人類來(lái)說(shuō),草圖是種直觀的表達(dá)方式。無(wú)數(shù)年來(lái),它都被用作交流工具。但因?yàn)殡S手畫的草圖很抽象,顏色也十分單一,辨認(rèn)草圖頗具挑戰(zhàn)性。解決草圖辨認(rèn)問題將會(huì)能幫助我們更好地認(rèn)識(shí)人類的視覺感知。
Sketch-a-Net是一套“深度神經(jīng)網(wǎng)絡(luò)(deep neural network)”,這是一種模擬人類大腦的計(jì)算機(jī)程序。Sketch-a-Net善于分析利用草圖所獨(dú)有的特征,諸如筆畫的筆順等,從而獲得了更大的成功。這些信息對(duì)辨識(shí)觸摸屏上的圖畫十分重要,但一直以來(lái)被人們所忽視。
這項(xiàng)研究作者之一,倫敦大學(xué)瑪麗女王學(xué)院電子工程和計(jì)算機(jī)科學(xué)的講師Timothy Hospedales說(shuō):“這項(xiàng)電腦程序能夠比人類更好地解決問題,我們對(duì)此十分激動(dòng)。草圖是一個(gè)有趣的研究領(lǐng)域,因?yàn)樗鼜氖非皶r(shí)代到現(xiàn)在一直被用作交流工具。而隨著草圖在觸摸屏上越來(lái)越頻繁的使用,它又將重新變成了一種常用的交流工具。這項(xiàng)程序能在警方取證、觸摸屏的使用和圖像檢索方面產(chǎn)生巨大的影響,最終,它還會(huì)幫助我們從根源上認(rèn)識(shí)視覺、理解視覺?!?/p>
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。