Kako pretvoriti PDF datoteku u uređivi tekst pomoću naredbenog retka u Linuxu
Postoje različiti razlozi zašto biste htjeli pretvoriti PDF datoteku u tekst za uređivanje. Možda trebate revidirati stari dokument i sve što imate je njegova PDF verzija. Pretvaranje PDF datoteka u Windows je jednostavno, ali što ako koristite Linux?
Bez brige. Pokazat ćemo vam kako lako pretvoriti PDF datoteke u tekst koji je moguće uređivati pomoću alata naredbenog retka pod nazivom pdftotext, koji je dio paketa “poppler-utils”. Ovaj je alat možda već instaliran. Da biste provjerili je li pdftotext instaliran na vašem sustavu, pritisnite “Ctrl + Alt + T” da biste otvorili prozor terminala. U naredbu upišite sljedeću naredbu i pritisnite "Enter".
dpkg -s poppler-utils
NAPOMENA: kada kažemo da u ovaj članak upišete nešto i postoje citati oko teksta, NE upisujte navodnike, osim ako drugačije ne navedemo.
Ako pdftotext nije instaliran, upišite sljedeću naredbu na upit i pritisnite "Enter".
sudo apt-get instalirajte poppler-utils
Upišite zaporku i pritisnite "Enter".
Postoji nekoliko alata dostupnih u paketu poppler-utils za pretvaranje PDF-a u različite formate, manipuliranje PDF datotekama i vađenje informacija iz datoteka.
Slijedi osnovna naredba za pretvaranje PDF datoteke u tekstualnu datoteku koja se može uređivati. Pritisnite “Ctrl + Alt + T” da biste otvorili prozor Terminala, upišite naredbu i pritisnite “Enter”.
pdftotext /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt
Promijenite putanju do svake datoteke kako bi odgovarala mjestu i nazivu izvorne PDF datoteke i gdje želite spremiti dobivenu tekstualnu datoteku. Također, promijenite nazive datoteka tako da odgovaraju imenima vaših datoteka.
Tekstualna datoteka je stvorena i može se otvoriti baš kao što biste otvorili bilo koju drugu tekstualnu datoteku u Linuxu.
Pretvoreni tekst možda ima prijelom redaka na mjestima koja ne želite. Prelomi redaka umetnuti su nakon svakog retka teksta u PDF datoteci.
Možete sačuvati izgled dokumenta (zaglavlja, podnožja, stranične itd.) Iz izvorne PDF datoteke u konvertiranoj tekstualnoj datoteci pomoću zastavice "-layout".
pdftotext -layout /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt
Ako želite pretvoriti raspon stranica u PDF datoteku, upotrijebite zastavice "-f" i "-l" (mala slova L) da biste odredili prvu i posljednju stranicu u rasponu koji želite pretvoriti.
pdftotext -f 5 -l 9 /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt
Da biste pretvorili PDF datoteku koja je zaštićena i šifrirana pomoću vlasničke lozinke, upotrijebite oznaku "-opw" (prvi znak u zastavi je malo slovo “O”, a ne nula).
pdftotext -pw 'password' /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt
Promijenite "zaporku" u onu koja se koristi za zaštitu izvorne PDF datoteke koja se pretvara. Provjerite postoje li pojedinačni navodnici, a ne dvostruki, oko "zaporke".
Ako je PDF datoteka zaštićena i šifrirana korisničkom lozinkom, koristite zastavicu "-upw" umjesto zastavice "-opw". Ostatak naredbe je isti.
Također možete odrediti vrstu znaka kraja retka koji se primjenjuje na konvertirani tekst. To je osobito korisno ako planirate pristupiti datoteci na drugom operativnom sustavu kao što je Windows ili Mac. Da biste to učinili, upotrijebite oznaku "-eol" (srednji znak u zastavi je malo slovo "O", a ne nula), a iza njega slijedi razmak i tip znaka kraja retka koji želite koristiti (" unix ”,“ dos ”ili“ mac ”).
NAPOMENA: Ako ne navedete ime datoteke za tekstualnu datoteku, pdftotext automatski koristi bazu PDF datoteke i dodaje ekstenziju “.txt”. Na primjer, "file.pdf" će se pretvoriti u "file.txt". Ako je tekstualna datoteka navedena kao "-", konvertirani tekst se šalje stdoutu, što znači da je tekst prikazan u prozoru Terminal i nije spremljen u datoteku.
Da biste zatvorili prozor Terminala, kliknite gumb "X" u gornjem lijevom kutu.
Za više informacija o pdftotext naredbi upišite "man page pdftotext" na prompt u prozoru Terminal.