Cuando tenemos un PDF que ha sido producto de un escaneo de un libro, sobre todo si este es muy viejo, veremos el fondo con un color sepia.
Esto es un problema cuando requerimos imprimirlo o bien leerlo en un dispositivo de tintia electrónica como el Kindle.
Para ello, debemos seguir una serie de pasos con los que podremos extraer cada página del PDF y convertirla a imagen, después convertirlas a texto negro sobre fondo blanco y por último volverlos a reunir en un nuevo PDF.
Paso 1: Extraer a imagen
Para ello necesitamos instalar pdftoppm
sudo apt install pdftoppm
Y después ejecutamos el comando:
pdftoppm PDF.pdf NAME -tiff
Donde PDF.pdf es el nombre de nuestro archivo.
Nota: Cada página será extraída a un archivo de imagen por lo que si el PDF tiene muchas páginas, lo mejor es colocarlo dentro de una carpeta para que todas las imágenes estén separadas de nuestros demás archivos.
Paso 2: Convertir las imágenes a blanco y negro
Para hacer la conversión de todas las imágenes extraídas del PDF debemos utilizar Scan Tailor.
Para ello lo instalamos usando el siguiente comando (vía flatpak):
flatpak install org.scantailor.ScanTailor
Ahora bien, podemos abrirlo desde el menú de aplicaciones como cualquier aplicación instalada o bien, ejecutándolo desde consola.
flatpak run org.scantailor.ScanTailor
Damos clic en “New Project” y nos mostrará la siguiente pantalla.
Aqui debemos elegir la carpeta origen y automáticamente nos sugerirá la carpeta donde exportará las imágenes convertidas que es en la carpeta “out”.
Podemos, además, seleccionar las imágenes que queremos que convierta. Por default son todas.
Al dar clic en “OK”, cargará todas las imágenes seleccionadas, en la aplicación.
En la barra izquierda podemos realizar las siguientes acciones:
- Corregir orientación
- Dividir páginas
- Desviación de página
- Seleccionar contenido
- Márgenes
- Realizar cambios
Todo esto se puede hacer página por página o bien si se le da clic al ícono de play que está en la parte derecha de la opción elegir, realiza la acción a todas las páginas.
Si queremos saltarnos todo eso y solo convertir las imágenes, no podemos ya que nos muestra el siguiente mensaje.
Por lo que, si no vamos a realizarle cambios específicos que nos ofrece esta aplicación que fueron listados más arriba, entonces podemos ir a la opción “Select contect”.
Dejamos seleccionada la opción “Auto” y damos clic a “Apply to…”.
Y seleccionamos “All pages”.
Y damos clic en “OK” y seguido damos clic en el ícono de play para ejecutar la acción.
Con ello va a ejecutar el proceso y podemos ver página por página cómo se va aplicando.
Podemos indicar si queremos que utilice menos recursos de sistema para la conversión así como que emita un sonido cuando termine el proceso.
Con esto, ya podemos dirigirnos de nuevo a la opción “Output” y verificar que el modo esté seleccionado en “Black and White”.

Acto seguido podemos dar clic en el icono de “play” para que realice la conversión a blanco y negro en todas las hojas.
La conversión es algo lenta, por lo que tu documento tiene muchas páginas entonces habrá que esperar algún tiempo a que termine.
Una vez terminada la conversión podrás ver en la carpeta de salida las imágenes ya convertidas a blanco y negro.

Por lo que solo nos queda reunir todas las imágenes a un PDF.
Paso 3: Crear PDF resultante
Para poder reunir todas las imágenes recién convertidas a un PDF, debemos instalar lo siguiente:
sudo apt install img2pdf
Y entonces, entramos a la carpeta donde se colocaron las imágenes de salida y corremos el siguiente comando:
img2pdf *.tif -o pdfconvertido.pdf
Donde pdfconvertido.pdf será el nombre con el que queremos se llame a nuestro nuevo archivo.
Y finalmente tenemos el PDF convertido a blanco y negro listo para imprimir o para leer en un dispositivo con tinta digital.

0 Comentarios