Le PDF « image »

Un PDF « image » est un fichier PDF qui, quand on l’ouvre, montre du texte qu’il est impossible de sélectionner avec le pointeur de la souris, donc de copier. Pour vérifier si votre fichier PDF est un PDF « image » ouvrez le fichier, faites un clic droit et choisissez « sélection » ou « outil de sélection » et s'il s'agit d'un PDF « image »  vous ne pourrez pas sélectionner les lignes du texte.

Il s’agit en fait d’une photo d’un document transformée en fichier PDF et la seule solution pour convertir le texte de cette photo en texte réutilisable est d’utiliser un outil de reconnaissance de caractères (OCR). Une fois cette opération réalisée, pour autant que l’OCR ne confonde pas certaines lettres (d’où l’utilité de la vérification), l’on obtient un texte en format TXT, RTF, DOC ou DOCX qu’il est possible de modifier ou d’intégrer à un autre document.

Concernant le fichier PDF  que vous allez transmettre vérifiez bien que celui-ci n’est pas protégé par mot de passe à l’ouverture ou pour les permissions (modification et extraction). Si tel est le cas merci d’enlever cette protection.

Si votre document PDF contient quelques images merci de préciser dans le formulaire que vous recevrez si, si cela est possible, vous souhaitez les voir apparaitre dans le document DOCX final (les cadres trop nombreux avec de multiples photos étant par contre exclus).