設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

有道云筆記上線OCR功能:輕松識(shí)別圖片/PDF中文字(支持漢字)

2017/5/17 17:31:28 來(lái)源:IT之家 作者:遠(yuǎn)洋 責(zé)編:遠(yuǎn)洋

IT之家5月17日消息,繼上線語(yǔ)音速記功能后,網(wǎng)易旗下產(chǎn)品有道云筆記又上線了另一實(shí)用的功能——文檔OCR(即文字識(shí)別)。據(jù)悉,新上線的OCR功能在原有的掃描功能進(jìn)行了升級(jí),能夠幫助用戶輕松識(shí)別圖片、PDF等掃描文檔中的文字,并將其轉(zhuǎn)化成可編輯的文檔。

如果你還不了解新功能OCR究竟能為你做什么,那你一定遇到過(guò)以下這些情況,而OCR功能就是對(duì)這些“癥結(jié)”的那款“靈丹妙藥”:

· 工作或者科研學(xué)習(xí)中,要應(yīng)對(duì)大量的紙質(zhì)文件、書(shū)刊雜志、PDF格式的電子資料,很難對(duì)這些格式的資料進(jìn)行編輯和整理

· 讀書(shū)時(shí),看到不錯(cuò)的文章段落想要做書(shū)摘筆記,但又懶得去打字或是手抄整理

· 在微信、微博等內(nèi)容平臺(tái)看到有價(jià)值的圖片內(nèi)容會(huì)隨手保存mark,或是用截屏把手機(jī)頁(yè)面內(nèi)容保存到相冊(cè),但這些圖片信息散亂在手機(jī)各處,很難進(jìn)行歸納、整理和檢索

以上難題,只需要5秒就能搞定!

那么,如何用OCR識(shí)別功能將紙質(zhì)資料、圖片和PDF文件,轉(zhuǎn)換為可以自由編輯的文本格式呢?

「紙質(zhì)文檔」OCR識(shí)別

把紙書(shū)、合同等紙質(zhì)文件、甚至墻體海報(bào),轉(zhuǎn)換成可編輯的文本格式,只需三步:

step1:智能掃描

將有道云筆記升級(jí)為最新版后,點(diǎn)擊加號(hào)按鈕,新建一篇“文檔掃描”。

接下來(lái)就是見(jiàn)證實(shí)力的時(shí)刻,掃描過(guò)程中無(wú)需任何人工操作,軟件可以自動(dòng)、精準(zhǔn)識(shí)別掃描圖像的邊框,去除掃描區(qū)域以外的多余背景,并且矯正偏斜,穩(wěn)!準(zhǔn)!狠!地將資料掃描進(jìn)來(lái)。

如果對(duì)自動(dòng)掃描結(jié)果不夠滿意,還可以選擇手動(dòng)調(diào)節(jié)模式進(jìn)行微調(diào)。

在掃描過(guò)程中,請(qǐng)盡量將文字?jǐn)[正,盡量剔除圖片中無(wú)關(guān)的部分,這樣可以大大提高文字識(shí)別的準(zhǔn)確度啊~

step2:掃描圖片濾鏡美化

掃描后的圖片會(huì)自動(dòng)調(diào)節(jié)亮度和對(duì)比度,可以便捷的設(shè)置為增強(qiáng)或黑白模式,讓圖片更清晰。

step3:OCR識(shí)別,提取圖片內(nèi)文字

在進(jìn)行OCR之前,請(qǐng)先將掃描文檔進(jìn)行同步保存。選擇需要進(jìn)行文字識(shí)別的圖片后,點(diǎn)擊底部的“識(shí)別”按鈕,就能將這張掃描圖片內(nèi)的文字識(shí)別出來(lái)并轉(zhuǎn)換成一篇文字筆記。

識(shí)別出的文本會(huì)直接保存到有道云筆記內(nèi),多平臺(tái)同步,你可以在手機(jī)版、PC端、網(wǎng)頁(yè)端等任意平臺(tái)的有道云筆記內(nèi)進(jìn)行修改、編輯、整理。

在掃描圖片足夠清晰的情況下,文本識(shí)別的準(zhǔn)確率可以達(dá)到95%以上。

原圖片

識(shí)別文字

「圖片」OCR識(shí)別

如何將那些“鎖在”圖片里的文字提取出來(lái)?我們用一張hin長(zhǎng)(包含了2000多字內(nèi)容)的微博長(zhǎng)圖來(lái)為大家演示圖片OCR的用法和文字識(shí)別效果。

首先,進(jìn)入有道云筆記,選擇“上傳圖片”,將要識(shí)別處理的圖片同步保存到有道云筆記。

然后,在頁(yè)面底部找到“更多”按鈕,點(diǎn)擊“文本識(shí)別OCR”,就可以看到長(zhǎng)圖內(nèi)的文字被完美識(shí)別出來(lái)了!

雖然網(wǎng)絡(luò)圖片的分辨率不是很高,并且單張圖片文字內(nèi)容較多,但是文字識(shí)別效果一點(diǎn)不含糊。

圖片 ←→ 識(shí)別文本

「PDF文檔」OCR識(shí)別

除掃描文檔、圖片外,有道云筆記(限會(huì)員)還可以PDF文本識(shí)別服務(wù),PDF輕松轉(zhuǎn)Word!

將PDF文檔上傳到有道云筆記,并完成同步后,點(diǎn)擊底部的“OCR”按鈕,經(jīng)過(guò)幾秒的等待后(視PDF文檔大小而定),就可以看到PDF內(nèi)的文字被識(shí)別出來(lái),輕松轉(zhuǎn)化為可以自由編輯的筆記格式。

PDF文檔

識(shí)別文本

目前雙欄布局PDF文檔的文本識(shí)別支持度較差,暫時(shí)建議選擇一欄布局的PDF文檔進(jìn)行OCR識(shí)別。

另外,你還可以通過(guò)有道云筆記微信公眾號(hào)使用圖片OCR功能!只要在微信對(duì)話框內(nèi)把圖片發(fā)給云筆記,就能為你將圖片識(shí)別成文字。就像這樣↓

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知