很多人都會很好奇,什麽叫做OCR?
OCR,全名為Optical Character Recognition,中文名為光學認字技術。它可以把文章圖片内的文字直接掃描出來,減少人手輸入的麻煩。
最近Google Docs就傳來佳音了,因爲Google Docs加入了OCR認字功能,只要用戶上傳含有文字的圖片檔,Google就會自動掃描出文字來。特別要注意哦,OCR認字功能只能辨認出含有英文字母的文字而已!
如何利用?
Step 1: 首先準備一份英文報紙,並掃描進電腦進行測試。
Step 2: 前往Google Docs選擇[Upload Files],並勾選下方的[Convert text from PDF or image files to Google Docs documents]。
Step 3: 上傳之後就回到Google DOcs列表查看文件結果。
測試結果
只有標題和較大的文字是準礭地掃描出來罷了,圖片檔裡細小的文字並無法掃描出來。
因此我將細小的文字的地方剪裁了出來並放大再上傳,結果依舊無法掃描出那些文字,圖片下方的文字甚至還出錯。最後,我認爲Google DOcs的OCR功能並不實用。
文章標籤
全站熱搜

小弟認為還是有實用的地方 報紙文字品質不佳,加上掃描時檔案容易模糊 若是用「電子版」或PDF版的檔案,則可以有很高的認字率 對有需要把「被加密過不能複製文件內文的檔案」擷取出來 有很大的實用度
中文唔得~