Impossible de copier du texte à partir d'un fichier PDF?

L’autre jour, j’ai rencontré un problème lorsque je devais copier du texte d’un fichier PDF et le coller dans une présentation que je faisais. Le problème était que je ne pouvais pas copier le texte! Hmm, pensais-je, il doit y avoir quelque chose de stupide que je suis en train de faire car je suis presque sûr d'avoir déjà copié du texte à partir d'un fichier PDF.

Heureusement, je n'étais pas si stupide, car le fichier PDF contenait plusieurs pages qui étaient des fichiers bitmap numérisés qui avaient été insérés dans le fichier PDF. Donc, ce n'était pas le texte réel en premier lieu. Deuxièmement, là où il y avait du texte qui pouvait normalement être copié, ce PDF avait une sorte d'autorisations de sécurité définies pour que la copie de contenu ne soit pas autorisée! Grrrr!

J'avais toujours besoin de ce texte et j'allais trouver un moyen de l'obtenir. Dans cet article, je vais décrire le moyen simple de copier un texte qui fonctionne si le document n'est pas protégé et que le texte n'est pas une image numérisée. J'examinerai également ce qu'il faut faire dans le scénario le plus compliqué, dans lequel vous n'êtes pas autorisé à copier le texte. Ce n'est pas une solution idéale, mais c'est mieux que rien, surtout si vous devez copier beaucoup de texte. Même si vous pouvez éviter de taper 80% manuellement, c'est génial!

Sélection de texte dans un PDF

Dans Adobe Reader, si le texte peut être copié, tout ce que vous avez à faire est de le sélectionner, de cliquer avec le bouton droit de la souris et de choisir Copie.

Dans d’autres programmes de visualisation PDF tels que Foxit, vous devez cliquer sur Outils et alors Sélectionnez le texte.

Évidemment, si vous pouviez le faire, vous ne liriez pas ce post! Mais juste au cas où, c'est comme ça que vous sélectionnez le texte. Passons maintenant au problème plus difficile de la copie de texte à partir d’images ou de fichiers PDF sécurisés.

Utiliser OCR pour copier du texte PDF

Vous pouvez vérifier rapidement si un fichier PDF est sécurisé dans Adobe Reader en cherchant dans la barre de titre et en cherchant le mot Sécurisé.

Vous pouvez voir des permissions spécifiques en cliquant sur modifier puis en cliquant sur protection et alors Propriétés de sécurité.

Dans les nouvelles versions d'Adobe Reader et Acrobat, vous devez cliquer sur Protéger dans le volet de droite pour afficher les options de protection.

Ensuite, cliquez sur Plus d'options et vous verrez les propriétés de sécurité.

Comme vous pouvez le voir ci-dessous, la copie de contenu n'est pas autorisée et la sécurité est protégée par un mot de passe. Si vous connaissez le mot de passe, vous pouvez alors supprimer la sécurité et copier tout ce que vous voulez.

Sauf si vous êtes un pirate informatique, briser le mot de passe n'est pas une option. La seule autre chose que vous puissiez faire est donc de prendre une capture d'écran du texte, puis de l'exécuter via un programme OCR. Cela semble trop de travail, mais ce n’est vraiment pas le cas. Vous pouvez prendre une capture d'écran sur un Mac ou un PC sans logiciel supplémentaire.

Mac - Appuyez simplement sur Commande + Maj + 4 sur le clavier

les fenêtres - Utilisez simplement l'outil Windows Snipping

De plus, si vous possédez Adobe Acrobat, vous pouvez l'utiliser pour convertir automatiquement le texte d'une image en texte modifiable. Tout ce que vous avez à faire est d'ouvrir le fichier PDF et de cliquer sur l'outil Editer PDF dans le volet de droite. Il numérise automatiquement l'intégralité du document à l'aide de l'OCR et le convertit en un document entièrement éditable.

Si vous avez une image avec du texte, copiez-la dans le presse-papiers, puis ouvrez Adobe Acrobat et choisissez Fichier - Créer - PDF à partir du Presse-papiers.

Il vous suffit de cliquer sur Modifier le PDF dans le volet de droite pour convertir l’image en texte modifiable.

Voici une capture d'écran d'un texte que je ne pouvais pas copier à partir d'un fichier PDF sécurisé:

Notez que lorsque vous prenez la capture d'écran, assurez-vous que le zoom du document est défini sur 100% afin que le texte soit net et clair. Une fois la capture d’écran obtenue, téléchargez un programme gratuit d’OCR. Il existe de nombreuses options et les résultats varieront énormément d'un programme à l'autre. Vous devrez donc en essayer quelques-uns. Voici deux que j'ai utilisé dans le passé:

http://download.cnet.com/FreeOCR/3000-10743_4-10717191.html

https://www.simpleocr.com/OCR-Freeware

Notez que vous pouvez également utiliser Microsoft OneNote car il possède une fonctionnalité OCR intégrée. Évidemment, si vous avez déjà un logiciel OCR, utilisez simplement ce programme à la place.

Le programme FreeOCR fonctionne bien, vous devez simplement vous assurer, lors de son installation, que vous n’acceptez aucune des «offres» logicielles, qui n’installe que des malbouffes sur votre ordinateur. Mais tant que vous faites cela, le logiciel ne contient aucun logiciel espion ou autre. CNET a également testé cette possibilité.

Quoi qu’il en soit, une fois le programme installé, cliquez sur le grand Ouvrir bouton et choisissez votre image.

Il vous montrera un aperçu de l'image dans le volet de gauche. Puis cliquez sur OCR et Démarrer le processus d'OCR.

C'est tout! Le texte apparaîtra maintenant sur le côté droit et vous pourrez le copier dans le presse-papiers ou l'exporter vers Microsoft Word.

Dans l’ensemble, le programme a fait un très bon travail avec quelques erreurs mineures ici et là. Cela m'a fait gagner beaucoup de temps sans avoir à saisir manuellement tout ce texte. J'espère que cela vous aidera à copier le texte dont vous avez besoin à partir d'un document PDF. Postez vos commentaires ou questions et je répondrai. Prendre plaisir!