Zašto su PDF datoteke koje generira Microsoft Word tako velike?
Kada su vaši dokumenti uglavnom samo tekstualnog karaktera, čini se da bi veličine datoteka za .docx i .pdf verzije trebale biti prilično slične kada se spremaju, ali to nije uvijek slučaj. Današnja postova s pitanjima o odgovorima korisnika imaju odgovor na pitanja znatiželjnog čitatelja o velikoj razlici u veličini datoteka.
Današnja sesija pitanja i odgovora dolazi nam ljubaznošću SuperUser-a, podjele Stack Exchangea, grupiranja web-lokacija za pitanja i odgovore u zajednici.
Boksačke rukavice su dopuštene Clker.com.
Pitanje
Čitač SuperUser Borek želi znati zašto su PDF datoteke koje generira Microsoft Word toliko velike:
Napravio sam jednostavan Microsoft Wordov dokument koji sadrži samo ovu rečenicu, ništa drugo:
- Ovo je mali dokument.
Zatim sam spremio dokument kao .docx i .pdf datoteke. Ovdje su veličine datoteka:
- .docx: 12 kB
- .pdf: 89 kB
Razlika između ove dvije datoteke je ogromna (tehnički) i doista me smeta kad su dokumenti koji su uglavnom tekstualne prirode samo desetak kB u .docx formatu, ali su veličine stotine kB pri konverziji u PDF datoteke. Što je toliko neučinkovito u PDF formatu? Je li to samo Microsoft Word koristeći neki strašan izlazni algoritam?
Usput, postavke izlaza PDF-a u mojoj instalaciji sustava Microsoft Office postavljene su za stvaranje najmanjih mogućih datoteka:
Zašto su PDF datoteke koje generira Microsoft Word tako velike?
Odgovor
Odgovorni suradnik SuperUser ima odgovor za nas:
Ako otvorite PDF datoteku u Notepad + +, naći ćete:
I taj se objekt ovdje navodi na kraju u naredbi / FontFile2:
Fontovi koje koristi Microsoft Word dokument ugrađuju se u PDF datoteke tako da su samostalni. Taj sam slajd deck koristio od tvrtke Adobe da bih dešifrirao PDF upute.
Ako želite spriječiti ugrađivanje fontova u PDF datoteku, provjerite koriste li se u dokumentima programa Microsoft Word jedan od 14 standardnih slova dostupnih u PDF preglednicima (Izvor: Wikipedia).
- Times New Roman> Vremena (v3) (u običnom, kurzivu, podebljano i podebljano kurzivom)
- Kurirska nova> Kurirska služba (u uobičajenom, kosom, podebljano i podebljano)
- Arial> Helvetica (v3) (u uobičajenom, kosom, podebljano i podebljano)
- Simbol> Simbol
- Wingdings> Zapf Dingbats
Imate li što dodati objašnjenju? Zvuk isključen u komentarima. Želite li pročitati više odgovora od drugih tehničkih korisnika Stack Exchangea? Pogledajte cjelokupnu temu za raspravu ovdje.