luni, 28 decembrie 2015

Convertirea unui fisier PDF intr-un fisier text folosind linia de comanda in Linux



Exista diferite motive de ce ai dori sa convertesti un fisier PDF intr-un fisier text editabil. Pentru conversia fisierelor PDF intr-un fisier editabil exista si aplicatii online, dar in Linux aceasta operatie este destul de usoara si la indemana oricui.


Conversia fisierelor PDF intr-un fisier text editabil se realizeaza in linia de comanda cu un instrument numit pdftotext care face parte din pachetul poppler-utils. In general acest instrument este deja instalat odata cu distributia Linux. Pentru a verifica daca utilitarul pdftotext este instalat pe sistem urmati instructiunile:
- deschide un terminal
- tastati urmatoarea comanda:
***pentru Debian/Ubuntu/Linux Mint si distributiile derivate
$ dpkg -s poppler-utils
***pentru Red Hat/Fedora/SUSE Linux/CentOS/PCLinuxOS si distributiile cu pachete RPM
$ rpm -qa | grep poppler
- dati Enter

In cazul in care utilitarul pdftotext nu este instalat, cautati pachetul poppler-utils sau poppler in managerul de programe si il instalati.

Pentru a converti un fisier PDF intr-un fisier text urmati pasii:
- deschideti terminalul
- introduceti comanda
$ pdftotext /home/user/Documents/exemplu.pdf /home/user/Documents/exemplu.txt
- dati Enter si in cateva clipe este creat fisierul text

Puteti pastra aspectul documentului (anteturi, subsoluri, paginare, etc.) de la fisierul original PDF in fisierul text convertit folosind optiunea "-layout".
Comanda:
$ pdftotext -layout /home/user/Documents/exemplu.pdf /home/user/Documents/exemplu.txt

Pentru a converti un fisier PDF care este protejat cu o parola, utilizati optiunea "-opw".
$ pdftotext -opw 'parola_fisier' /home/user/Documents/exemplu.pdf /home/user/Documents/exemplu.txt

NOTA: Daca nu specificai un nume de fisier pentru fisierul text, pdftotext utilizeaza automat baza fisierului PDF si adauga extensia txt.

Pentru mai multe informatii despre utilitarul pdftotext, introduceti in terminal urmatoarea comanda:
$ man page pdftotext


Niciun comentariu: