🔤 圖片轉文字 (OCR)

照片、截圖、掃描件、手寫文字 OCR 識別 — 不上傳、無需註冊

✓ 永久免費 · ✓ 無需註冊 · ✓ 檔案不上傳 · ✓ 離線可用

🔒 你的影像永遠不會離開你的裝置。 所有處理都使用 Tesseract.js（基於 LSTM 的 OCR，在瀏覽器中執行）在你的瀏覽器中進行。不上傳、不經伺服器、不追蹤。

功能特色

零上傳 — 圖片從不離開你的裝置。OCR 透過 WebAssembly 在你的 CPU 上完成 — 可在 DevTools 網路面板中驗證。
12+ 種語言 — 英文、中文（簡繁）、日文、韓文、西班牙文、法文、德文、俄文、阿拉伯文、葡萄牙文、義大利文，以及多語言混合模式。
複製前可編輯 — OCR 不完美 — 在複製或下載前直接在結果文字框裡修正錯字。
永久快取 — 語言資料一次下載（~10-20 MB），快取在瀏覽器裡。同語言後續 OCR 瞬時。

運作方式

拖入圖片 — PNG、JPG、WebP、BMP、GIF — 照片、截圖、掃描件、手寫。最大 50 MB。
選擇語言 — 匹配圖片裡文字的語言。多語種截圖用 "English + 繁體中文" 這種混合模式。
等待 OCR 完成 — 每種語言首次約 10-20 MB 下載。之後識別需要 2-10 秒，取決於圖片大小和文字密度。
複製或下載 — 如果有 OCR 錯誤就先修，然後點 Copy 或下載 .txt。

使用情境

從無法選中的截圖裡提取文字（圖片檢視器、簡報、被當圖片處理的 PDF）
數位化印刷文件、名片、收據、菜譜
從 YouTube 教學、Stack Overflow 截圖、Discord 螢幕共享中複製程式碼或命令
從書的照片裡提取引用，用於論文或筆記
搜尋掃描文件內容 — 先轉成文字，再 grep

常見問題

圖片會上傳到你們的伺服器嗎？

不會。圖片留在你瀏覽器的記憶體裡。唯一的網路流量是 Tesseract OCR 引擎（約 3 MB）和你選的語言資料（約 10-20 MB）首次使用時從 CDN 載入 — 之後都快取。圖片位元組不會傳到任何地方。打開 DevTools → 網路面板驗證。

OCR 準確度怎麼樣？

Tesseract 是開源標準。乾淨的印刷文字：95-99% 準確度。光線好的印刷文字照片：85-95%。手寫和藝術字體：50-80%。依賴輸出前一定先校對。

中文、日文、阿拉伯文支援嗎？

支援。選 chi_sim（簡體中文）、chi_tra（繁體）、jpn、kor 或 ara。從右到左的文字（阿拉伯文）能識別，但可能需要手工調整行序。

多語言文件怎麼辦？

用混合模式 — "English + 繁體中文" 或 "English + 日本語"。Tesseract 會同時嘗試。注意：每加一種語言識別速度慢約 50%。

為什麼有些文字沒被識別？

常見原因：對比度低、源圖模糊、文字過小、裝飾字體、複雜背景上的文字。試試裁剪到文字區域、提高圖片解析度、先增強對比度。

為什麼第一次跑很慢？

首次使用某種語言時 Tesseract 下載約 10-20 MB 的語言模型資料。同語言後續 OCR 從 IndexedDB 快取載入，瞬時啟動。

相關教學

📖 2026 年 OCR 實測對比 — Tesseract、Google Vision、ChatGPT、Apple Live Text（真實準確率資料） — 我在 100 張真實圖片上測試了 4 款 OCR 工具 — 收據、截圖、手寫、多語言、低光照片。這是真實的字元準確率資料，不是營銷說辭。

相關工具

🔎 PDF OCR — 從掃描 PDF 擷取文字 — 支援 100+ 種語言，於瀏覽器執行
📃 PDF 轉文字 — 將 PDF 內全部文字擷取成純文字 .txt 檔
🔢 字數統計 — 實時統計文字各項指標——閱讀時間、朗讀時間一目瞭然

💬 Bug、點子，或者就想打個招呼？告訴 Milo 🐨 · [email protected]