什麼是OCR?
OCR(光學字元識別)是一種將圖像中的文字自動轉換為數位文本資料的技術。當您拍攝收據照片時,它可以自動讀取並提取日期、金額、商家名稱等資訊。
傳統OCR在精度上有局限性,但近年來AI技術的進步使得手寫文字和複雜佈局的收據也能被高精度識別。
使用OCR的優勢
大幅節省時間
手動資料輸入每張收據需要1-2分鐘。使用OCR只需幾秒鐘。100張收據可以節省2小時以上。
減少輸入錯誤
手動輸入容易出現錯誤,尤其是數字。OCR大大減少了人為錯誤。
即時記錄
收到收據後立即拍照,資料輸入就完成了。不再需要「以後再整理」。
自動分類
AI-OCR可以根據讀取的內容自動確定費用類別,使記帳更加輕鬆。
傳統OCR vs AI-OCR
| 傳統OCR | AI-OCR | |
|---|---|---|
| 字元識別 | 僅印刷文字精度高 | 可處理手寫和模糊文字 |
| 佈局處理 | 僅限固定格式 | 可處理各種佈局 |
| 語義理解 | 僅讀取文字 | 識別金額、日期、商家 |
| 自動分類 | 不可 | 自動確定費用類別 |
| 學習和改進 | 固定規則 | 使用越多精度越高 |
AI-OCR工作原理
AI-OCR使用經過大量收據圖像訓練的神經網路。它不僅僅是讀取文字,而是理解收據結構並識別特定資訊的位置。
AI-OCR處理步驟
- 1
圖像預處理
通過傾斜校正、雜訊去除和對比度調整提高精度
- 2
文字區域檢測
識別收據中包含文字的區域
- 3
字元識別
深度學習高精度識別字元
- 4
資訊結構化
自動將日期、金額、商家、商品分類為結構化資料
- 5
類別估算
根據內容自動估算適當的費用類別
Denpyo AI-OCR可提取的資訊
日期
購買/交易日期
金額
含稅/不含稅金額
商家
店鋪/公司名稱
商品
購買的商品/服務
類別
自動估算
稅款
稅率和金額
提高OCR精度的技巧
在光線充足的地方拍攝
陰影和昏暗的光線會降低精度。將收據平放在光線充足的地方拍攝。
拍攝完整收據
邊緣被切掉意味著資訊遺失。確保整張收據都在畫面內。
從正上方拍攝
傾斜拍攝會導致變形。讓手機與收據垂直。
儘早拍攝
熱感應收據的文字會隨時間褪色。收到後立即拍攝。