🔎 OCR de PDF

Extrae texto de PDFs escaneados. Más de 100 idiomas, todo en el navegador

🔒 Tu imagen nunca sale de tu dispositivo. Todo el procesamiento ocurre localmente en tu navegador usando tesseract.js (WASM) + pdf-lib. Sin subidas, sin servidor, sin rastreo.

Características

  • Más de 100 idiomas — Reconoce texto en inglés, chino, español, árabe, japonés y muchos más; impulsado por Tesseract.
  • Salida en PDF buscable — Añade una capa de texto invisible para que el escaneo se vea igual pero sea buscable y copiable.
  • Exportación a texto plano — Opcionalmente exporta el texto extraído como archivo .txt para seguir procesándolo.
  • 100 % privado — El OCR corre en tu navegador con Tesseract en WASM; tu escaneo nunca sale de tu dispositivo.

Cómo Funciona

  1. Sube el PDF escaneado — Arrastra tu documento escaneado a la página.
  2. Elige idioma — Selecciona el idioma principal del documento para mejor precisión.
  3. Ejecutar OCR — Haz clic en Ejecutar OCR: el procesamiento tarda de 1 a 10 segundos por página.
  4. Descargar — Guarda el PDF buscable o el archivo .txt con el texto extraído.

Casos de Uso

  • Hacer buscables contratos antiguos escaneados
  • Extraer texto de recibos para informes de gastos
  • Convertir páginas de libros escaneadas en texto editable
  • Digitalizar archivos en papel para búsquedas por palabra clave

Preguntas Frecuentes

¿Qué tan preciso es el OCR?

Muy alto en escaneos limpios y de alto contraste. La precisión baja con escritura a mano, imágenes borrosas o fuentes muy pequeñas.

¿Cuánto tarda?

Normalmente entre 1 y 10 segundos por página, según el dispositivo y la complejidad de la imagen.

¿Se sube mi PDF?

No. Tesseract corre en tu navegador mediante WebAssembly: nada se sube.

¿Puedo hacer OCR en varios idiomas a la vez?

Sí. Selecciona todos los idiomas relevantes y Tesseract intentará reconocerlos todos.

¿Qué diferencia hay entre el PDF buscable y la salida de texto plano?

El PDF buscable mantiene el escaneo original a la vista y añade una capa de texto invisible para buscar y copiar. El texto plano exporta únicamente las palabras reconocidas.

Herramientas Relacionadas