Cuando tenemos un PDF que ha sido producto de un escaneo de un libro, sobre todo si este es muy viejo, veremos el fondo con un color sepia.

Esto es un problema cuando requerimos imprimirlo o bien leerlo en un dispositivo de tintia electrónica como el Kindle.

Para ello, debemos seguir una serie de pasos con los que podremos extraer cada página del PDF y convertirla a imagen, después convertirlas a texto negro sobre fondo blanco y por último volverlos a reunir en un nuevo PDF.

Paso 1: Extraer a imagen

Para ello necesitamos instalar pdftoppm

sudo apt install pdftoppm

Y después ejecutamos el comando:

pdftoppm PDF.pdf NAME -tiff

Donde PDF.pdf es el nombre de nuestro archivo.

Nota: Cada página será extraída a un archivo de imagen por lo que si el PDF tiene muchas páginas, lo mejor es colocarlo dentro de una carpeta para que todas las imágenes estén separadas de nuestros demás archivos.

Ejemplo de archivos resultantes

Paso 2: Convertir las imágenes a blanco y negro

Para hacer la conversión de todas las imágenes extraídas del PDF debemos utilizar Scan Tailor.

Para ello lo instalamos usando el siguiente comando (vía flatpak):

flatpak install org.scantailor.ScanTailor

Ahora bien, podemos abrirlo desde el menú de aplicaciones como cualquier aplicación instalada o bien, ejecutándolo desde consola.

flatpak run org.scantailor.ScanTailor
Scan Tailor
Scan tailor

Damos clic en “New Project” y nos mostrará la siguiente pantalla.

Elegir ruta de scan tailor

Aqui debemos elegir la carpeta origen y automáticamente nos sugerirá la carpeta donde exportará las imágenes convertidas que es en la carpeta “out”.

Podemos, además, seleccionar las imágenes que queremos que convierta. Por default son todas.

Al dar clic en “OK”, cargará todas las imágenes seleccionadas, en la aplicación.

scan tailor

En la barra izquierda podemos realizar las siguientes acciones:

  • Corregir orientación
  • Dividir páginas
  • Desviación de página
  • Seleccionar contenido
  • Márgenes
  • Realizar cambios

Todo esto se puede hacer página por página o bien si se le da clic al ícono de play que está en la parte derecha de la opción elegir, realiza la acción a todas las páginas.

Si queremos saltarnos todo eso y solo convertir las imágenes, no podemos ya que nos muestra el siguiente mensaje.

Output is not yet posiible, as the final size of pages is not yet known

Por lo que, si no vamos a realizarle cambios específicos que nos ofrece esta aplicación que fueron listados más arriba, entonces podemos ir a la opción “Select contect”.

Dejamos seleccionada la opción “Auto” y damos clic a “Apply to…”.

Y seleccionamos “All pages”.

scan tailor all pages

Y damos clic en “OK” y seguido damos clic en el ícono de play para ejecutar la acción.

scan tailor select content

Con ello va a ejecutar el proceso y podemos ver página por página cómo se va aplicando.

scan tailor convertir

Podemos indicar si queremos que utilice menos recursos de sistema para la conversión así como que emita un sonido cuando termine el proceso.

Con esto, ya podemos dirigirnos de nuevo a la opción “Output” y verificar que el modo esté seleccionado en “Black and White”.

scan tailor black and white

Acto seguido podemos dar clic en el icono de “play” para que realice la conversión a blanco y negro en todas las hojas.

La conversión es algo lenta, por lo que tu documento tiene muchas páginas entonces habrá que esperar algún tiempo a que termine.

tailor convertir blano y negro

Una vez terminada la conversión podrás ver en la carpeta de salida las imágenes ya convertidas a blanco y negro.

scan tailor dolphin

Por lo que solo nos queda reunir todas las imágenes a un PDF.

Paso 3: Crear PDF resultante

Para poder reunir todas las imágenes recién convertidas a un PDF, debemos instalar lo siguiente:

sudo apt install img2pdf

Y entonces, entramos a la carpeta donde se colocaron las imágenes de salida y corremos el siguiente comando:

img2pdf *.tif -o pdfconvertido.pdf

Donde pdfconvertido.pdf será el nombre con el que queremos se llame a nuestro nuevo archivo.

Y finalmente tenemos el PDF convertido a blanco y negro listo para imprimir o para leer en un dispositivo con tinta digital.

scan tailor archivo vonertido

angelinux

Desarrollador de páginas web desde el año 2000 y con experiencia en programación de sistemas para empresas desde el 2008; cofundador de CONSoluciones; autor del blog de software libre “Angelinux-slack”; docente en maestría en UPAV y fundador de la distribución Linux Falco que está en desarrollo para la Universidad Veracruzana. Además, ponente, organizador de congreso, laborista social, impartidor de cursos de programación y servidores Linux, webmaster, y ex invitado en programa de televisión.

0 Comentarios

Deja un comentario