2008-08-29

「親愛的」OCR光學字元識別之趕鴨子上架篇﹙下﹚

現在就來說明怎麼用Adobe Acrobat 9 Pro來處理OCR,他有兩個方式可以用,一種是直接用Acrobat內建的掃瞄功能,另一種是以匯入圖檔的方式來處理。




  • 以下用匯入以掃瞄過的圖檔來做演示。
  1. 按合併→合併檔案為一個PDF。


  2. 新增檔案→新增資料夾。

    • 我是把檔案放在同個資料夾,直接匯入一個資料夾比較方便,你也可以用新增檔案→新增檔案一個一個選擇檔案。



  3. 合併檔案。


  4. 確定。由於掃瞄進去是圖檔,所以會出現這個警告,你也可以把不在顯示警告給打勾,下次就不會再警告了。


  5. 在來按Ctrl+A全選所有頁面→確定,這樣就不用一頁一頁轉換囉。


  6. 他在轉換成文字,時間視你的電腦等級跟所要處理圖檔數量而定,要稍為等一下。


  7. 轉換好了之後,按



    在去圈選文字,沒轉換之前是圖片,不能選取文字,轉換完成後就可以囉。


  8. 檔案另存新檔你可以直接把這份轉換完成的PDF檔,直接另存新檔。


  9. 存檔類型右邊有個三角型的下拉選單,在來看你要存成word的doc檔、txt純文字檔或者其它格式,選則好之後按儲存


  10. 我存成doc檔,下面是用word開啟的畫面。

  11. 你也可以用編輯全選複製→開word或者其它文字編輯軟體→貼上


  12. 為何我不用直接用另存新檔功能,而要用複製在貼上,這樣不是比較麻煩嗎?



    其實直接另存新檔,對doc檔來講會有一定的缺陷,當你選則文字後,可以看到一個文字框,每段文字都是文字框,這樣雖然保有原來文字格式,但缺少了重新排版的自由性,每段文字都一個框,想想真另人頭大。




    像用複製在貼上,就不會有文字框了,編輯排版上來講會容易了許多。


  • 當然你也可以直接用Acrobat直接掃瞄,不用另外用掃瞄軟體掃進去,在用OCR功能這樣比較麻煩。
  1. 檔案建立PDF→從掃瞄器黑白文件。我是選黑白文件我只要文字沒必要掃成彩色。

  2. 你只有要掃瞄一頁的話就按定,不然可以選掃瞄更多頁面掃瞄反面功能