掃描文檔 (PDF) 或基於圖像的 (JPEG/PNG) 時,計算機將讀取內容作為點和像素。要使計算機將其內容識別為字符,您需要使用 OCR 工具將其轉換為機器可讀文件。
1.上傳您的文件
您可以放心,您的文件是通過加密連接安全上傳的。文件處理後將永久刪除。
- 要從計算機上傳文件,請單擊「上傳 PDF 文件」,然後選擇要編輯的文件,或將文件拖放到頁面。
- 要從 Dropbox、Google 雲端硬盤或文件所在的網站上傳文件,請展開下拉列表並選擇您的文件。
- 您可以一次上傳 1 個文件以獲得免費帳户,而已升級的帳户有權上傳10 個文件 在一個時間。
2.PDF 文檔語言選擇
選擇文檔的語言,因為 OCR 轉換是指定的最佳選項。根據語言來解決所有不明確的詞語也會比較容易。
3.選擇輸出格式並保存
將提供轉換您的文件的選項-可搜索的 PDF 或普通文本文件 ,它將提取 .txt 文件上的數據。 A 可搜索的 PDF is still a PDF file that contains content that can be recognized as characters.
選擇首選選項,然後單擊「識別所有頁面上的文本」 以啟動該過程。
完成此過程後,單擊「下載」 或者您也可以在 Google 雲端硬盤或 Dropbox 帳户中上傳文檔。
OCR 過程精度
在運行 OCR 進程之前,建議不要壓縮文檔。更高分辨率的文檔通常會提供更好的結果。
不幸的是,無法保證所識別文本的 100% 準確性,但這是最好的方法。
注意:如果瀏覽器的緩存被清除,工具效果最佳