設置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

超越 OCR,谷歌 AI 技術 InkSight 可精準識別手寫文字

2024/11/5 18:13:58 來源:IT之家 作者:遠洋 責編:遠洋

IT之家 11 月 5 日消息,Google Research 展示了一種使用人工智能讀取手寫內(nèi)容的新方法,名為 InkSight 的系統(tǒng)能夠直接從手寫文字的圖片中提取出數(shù)字文本,無需任何中間設備。

傳統(tǒng)的手寫文字識別技術主要依賴于光學字符識別 (OCR),但這種方法在處理復雜背景、模糊不清或低光照條件下的手寫文字時往往表現(xiàn)不佳。InkSight 則采用了不同的思路,通過模仿人類學習閱讀的過程,即通過不斷地重寫文本,來學習整個單詞的外觀和含義。這需要研究人員訓練 AI 模型,使其能夠識別和模仿人類的手寫風格。

InkSight 在處理復雜場景時表現(xiàn)更為出色,例如當照片光線昏暗、文本部分遮擋或背景干擾時,InkSight 能夠更準確地識別手寫文字。研究人員發(fā)現(xiàn),人類能夠閱讀 InkSight 生成的文本描摹的準確率高達 87%,其中三分之二的描摹結果與真實手寫幾乎無法區(qū)分。

對于喜歡手寫的人來說,InkSight 具有巨大的潛力。想象一下,只需將手寫筆記拍攝照片,即可立即將其轉換為可搜索的數(shù)字文本。對于那些字跡潦草的人來說,InkSight 可以將難以辨認的手寫內(nèi)容轉化為清晰、準確的打印文本。

從更廣闊的視角來看,這項技術對于破譯和和將幾個世紀以來的手寫文本轉換為數(shù)字形式具有重要意義。即使對于那些數(shù)字化程度較低的語言,InkSight 也能幫助保護手寫遺產(chǎn),并為這些語言的數(shù)字化訓練提供更多資源。

IT之家注意到,谷歌并不是唯一一家致力于開發(fā)手寫識別 AI 工具的公司。亞馬遜的 Kindle Scribe 電子閱讀器也具備將手寫筆記轉換為可讀文本的功能。此外,Goodnotes 等數(shù)字筆記應用也推出了手寫識別和編輯功能,可以將手寫文字轉換為可編輯的數(shù)字文本。

廣告聲明:文內(nèi)含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。

相關文章

關鍵詞:谷歌,AI,人工智能

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應用 魔方 最會買 要知