🔎 PDF OCR
從掃描 PDF 擷取文字 — 支援 100+ 種語言,於瀏覽器執行
🔒 你的影像永遠不會離開你的裝置。 所有處理都使用 tesseract.js(WASM)+ pdf-lib 在你的瀏覽器中進行。不上傳、不經伺服器、不追蹤。
功能特色
- 100+ 種語言 — 以 Tesseract 辨識英文、中文、西班牙文、阿拉伯文、日文等多種語言的文字。
- 可搜尋 PDF 輸出 — 加入不可見的文字層,讓掃描外觀完全不變,但內容可以搜尋與複製。
- 純文字匯出 — 可選擇將擷取的文字匯出為 .txt 檔以供後續處理。
- 100% 私密 — OCR 以 WASM 版 Tesseract 於瀏覽器內執行 — 掃描檔絕不離開您的裝置。
運作方式
- 上傳掃描 PDF — 將掃描文件拖放到頁面上。
- 選擇語言 — 選擇文件的主要語言以取得最佳辨識準確度。
- 執行 OCR — 點擊「執行 OCR」— 每頁約需 1–10 秒。
- 下載 — 儲存可搜尋 PDF 或擷取出的 .txt 檔。
使用情境
- 讓舊掃描合約變成可搜尋
- 從收據擷取文字以製作費用報告
- 將掃描的書頁轉為可編輯文字
- 將封存紙本數位化以便關鍵字搜尋
常見問題
OCR 的準確度如何?
在乾淨且高對比的掃描檔上非常高。對手寫、模糊影像或極小字體,準確度會下降。
需要多久?
視裝置與影像複雜度,通常每頁 1–10 秒。
我的 PDF 會被上傳嗎?
不會。Tesseract 以 WebAssembly 於您的瀏覽器執行 — 沒有任何上傳。
可以同時辨識多種語言嗎?
可以。請選取所有相關語言 — Tesseract 會嘗試全部比對。
可搜尋 PDF 與純文字輸出有何差別?
可搜尋 PDF 會保留原始掃描外觀,並疊加不可見文字層,使搜尋/複製可行;純文字則僅匯出辨識出的文字。
相關工具
- 📝 PDF 轉 Word — 將 PDF 轉成 Word 文件 — 保留版面、字型與影像
- 🗜️ PDF 壓縮 — 三檔壓縮品質,大幅縮小 PDF 檔案——100% 在瀏覽器中完成
- 🔐 為 PDF 加上密碼保護 — 以 AES 加密 PDF — 封鎖開啟、列印或編輯
- 📄 擷取 PDF 頁面 — 將所選頁面另存為新 PDF — 免費、瀏覽器內執行、無需上傳