Formato de archivo PDF

El formato PDF, aunque muy útil por su capacidad de ser leído en casi cualquier dispositivo, tiene limitaciones serias.

Doxillion intentará convertir el contenido del texto, pero hay casos en que el contenido no se puede convertir con exactitud debido a limitaciones que pueden variar de documento a documento.

Algunos ejemplos

Muchos generadores de PDF no mantienen espacios, tabuladores, saltos de línea ni columnas. En su lugar, almacenan palabras, o a veces letras, individualmente, junto con el lugar en la página donde la letra o palabra se supone que debe ir.

La mayoría de formatos de documentos almacenan una tabla como un conjunto de celdas, cada una conteniendo texto. En vez, PDF almacena tablas como texto delante de una imagen de las líneas que hacen la tabla.

Algunos PDFs almacenan texto, no como texto actual, sino como imágenes del texto. (Doxillion no es un producto de reconocimiento óptico de caracteres, así que debe dejar éstas como imágenes.)