設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

阿里達(dá)摩院發(fā)布古籍?dāng)?shù)字化平臺(tái),AI 識別古籍準(zhǔn)確率 97.5%

2021/5/18 16:52:19 來源:網(wǎng)易科技 作者:- 責(zé)編:姜戈

5 月 18 日,“漢典重光”海外古籍?dāng)?shù)字化回歸發(fā)布會(huì)在中國科技館舉行。“漢典重光”項(xiàng)目由阿里巴巴公益基金會(huì)、四川大學(xué)、美國加州大學(xué)伯克利分校、中國國家圖書館、浙江圖書館合作開展,旨在尋覓流散海外的中國古籍并將其數(shù)字化、公共化。

據(jù)介紹,借助阿里達(dá)摩院的技術(shù),首批 20 萬頁古籍已完成數(shù)字化,并沉淀為覆蓋 3 萬多字的古籍字典,公眾可通過漢典重光平臺(tái)翻閱、檢索古籍。據(jù)悉,達(dá)摩院 AI 對 20 萬頁古籍的識別準(zhǔn)確率達(dá)到 97.5%。

據(jù)悉,伯克利提供古籍的掃描圖片和編目數(shù)據(jù),達(dá)摩院將其全部文字化。此外,達(dá)摩院技術(shù)團(tuán)隊(duì)還與四川大學(xué)專家聯(lián)手研發(fā)了一套全新的古籍識別系統(tǒng)。利用單字檢測、無監(jiān)督單字聚類、小樣本學(xué)習(xí)、主動(dòng)學(xué)習(xí)等機(jī)器學(xué)習(xí)方法,構(gòu)造了一套邊識別古籍、邊訓(xùn)練模型的系統(tǒng)。

▲ 文瀾閣版《宋百家詩存》(卷七)

阿里巴巴達(dá)摩院院長張建鋒表示,守護(hù)中華傳世典籍,是科技工作者和文化工作者共同的使命。阿里計(jì)劃將這套技術(shù)工具連同古籍?dāng)?shù)字化平臺(tái)一并捐贈(zèng),交由權(quán)威公共機(jī)構(gòu)長期運(yùn)營

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:古籍,阿里達(dá)摩院,阿里巴巴

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知