公告版位

很多人都會很好奇,什麽叫做OCR?

OCR,全名為Optical Character Recognition,中文名為光學認字技術。它可以把文章圖片内的文字直接掃描出來,減少人手輸入的麻煩。

最近Google Docs就傳來佳音了,因爲Google Docs加入了OCR認字功能,只要用戶上傳含有文字的圖片檔,Google就會自動掃描出文字來。特別要注意哦,OCR認字功能只能辨認出含有英文字母的文字而已!

如何利用?

image

Step 1: 首先準備一份英文報紙,並掃描進電腦進行測試。

image

Step 2: 前往Google Docs選擇[Upload Files],並勾選下方的[Convert text from PDF or image files to Google Docs documents]。

image

Step 3: 上傳之後就回到Google DOcs列表查看文件結果。

測試結果

image image

只有標題和較大的文字是準礭地掃描出來罷了,圖片檔裡細小的文字並無法掃描出來。

image image

因此我將細小的文字的地方剪裁了出來並放大再上傳,結果依舊無法掃描出那些文字,圖片下方的文字甚至還出錯。最後,我認爲Google DOcs的OCR功能並不實用。

werner高泉志 發表在 痞客邦 PIXNET 留言(2) 人氣()


留言列表 (2)

發表留言
  • timwing
  • 小弟認為還是有實用的地方
    報紙文字品質不佳,加上掃描時檔案容易模糊
    若是用「電子版」或PDF版的檔案,則可以有很高的認字率
    對有需要把「被加密過不能複製文件內文的檔案」擷取出來
    有很大的實用度