Image

Komprimácia a archivácia

V PC_Space 07/2006 vám prinášame článok Lis na údaje pojednávajúci o komprimácií súborov. Tento doplňujúci článok vám však prezradí ešte o niečo viac, napr. o menej známych komprimačných formátoch.

Pozreli sme sa na komprimáciu a následnú archiváciu najrôznejších typov súborov. Existuje široké množstvo archivačno-komprimačných formátov, z ktorých sa najväčšmi ujali formáty ZIP a RAR. Len málokto však využíva aj iné druhy kompresia ako napríklad 7z, ACE, GZIP alebo BZIP2. My v redakcii sme spravili menšie porovnanie najznámejších typov kompresie, pričom sme použili rôzne archivačné programy. Balík celkovej veľkosti 57,9 MB obsahoval rôzne druhy súborov – boli v ňom zastúpené obrázky, textové a PDF dokumenty, audio a video záznamy, dátové súbory, databázy – celkovo 37 súborov. Kvalitu kompresie sme volili vždy maximálnu, v prípade, že formát podporuje slovníkovú kompresiu zvolili sme veľkosť slovníku 4MB, formáty, ktoré podporujú tvorbu pevných (solid) archívov mali túto featuru zapnutú. Výsledky vám ponúkame v tabuľke (Tab.), v ktorej je zaznamenaná výsledná veľkosť balíka, doba jeho kompresie a dekompresie a nastavenie kompresie.

Image

Tab.:Testovane na zostave s procesorom AMD AthlonXP 2000+ a 256 MB RAM, inštalovaný bol OS Windows XP Professional s aktualizáciami

Ako vyplýva z tabuľky najlepšie zvládol redukciu veľkosti formát UHA, ešte vždy neznámy formát, ktorý nie je podporovaný takmer žiadnymi známi archivačnými programami. Nevýhodou formátu je veľmi dlhá doba kompresie a dekompresie. Neznámy je taktiež poľský formát KGB, ktorý síce v teste dosiahol pekný výsledok, avšak daňou zaň bola veľmi dlhá doba kompresie. Úroveň kompresie sme zvolili Normal, pri vyššej sa doba kompresii neúmerne zvyšuje aj na niekoľko hodín a vyťaženie pamäti je veľmi vysoké. Navyše formát je podobne ako UHA podporovaný len minimom softvéru. Tretí v poradí, formát 7z je už známejší a podporovanejší zo strany softvérových výrobcov. Doba kompresie nie je už taká vysoká ako v prípade predchádzajúcich dvoch formátov avšak aj tak ešte vždy relatívne dlhá . Štvrté miesto v našom redakčnom mini-teste obsadil dobre známy a využívaný formát RAR. Nie až tak neznámy je formát ACE, ktorý podobne ako predchádzajúce formáty dovoľuje tvorbu slovníku a pevných archívov. Aj z toho pramení dobrá veľkosť, avšak pomalší čas kompresie. Staručký formát ZIP v súčasnosti už na svojich mladších kolegov nemá, aj napriek tomu patrí ešte aj dnes k najpopulárnejším archívom medzi počítačovou verejnosťou. Aj keď nedosahuje práve najlepšie výsledky čo sa týka redukcie veľkosti (aj vďaka tomu, že nepodporuje pevný archív) obľubu si získava svižnou dobou kompresie a dekompresie. O niečo lepšie výsledky dosahuje v programe 7-Zip, žiaľ za cenu mnohonásobne vyššej doby kompresie. GZIP a BZIP2 sú novšími druhmi kompresie známymi predovšetkým u používateľov operačného systému UNIX, kde sa radia medzi najpoužívanejšie. Jedná sa však len o komprimačné formáty, preto ak chceme súbory zároveň archivovať musíme využiť služieb archivačného formátu TAR. Mnohé programy TAR v spojení s GZIP či BZIP2 podporujú takže nemusíte sa obávať žiadaného zložitého postupu. Výsledný archív bude ma príponu *.tar.gzip/bzip2.

Aký formát si teda zvoliť pre kompresiu a archiváciu súborov? V porovnaní veľkosť/doba kompresie/podpora zo strany výrobcov programov sa nám ako najlepší javí formát RAR, svojich fanúšikov si však postupne nachádza aj 7z, taktiež u výrobcov archivačných programov, takže voľba z našej strany padá aj naň.


Aké súbory sa oplatí komprimovať?

Výhodou archivačných formátov je, že dokážu do jedného balíka vložiť množstvo súborov čo je výhoda, ktorú určite oceníme napríklad pri mailovaní. Ak však archivujeme súbory len za účelom zníženia ich veľkosti je dobre si uvedomiť, že komprimovať sa oplatí len súbory, na ktorých ešte nie je aplikovaná žiadna kompresia. Aj preto majú napríklad obrázky vo formáte TIFF alebo BMP po pridaní do archívu veľmi malú veľkosť, zatiaľ čo obrázky v JPEG nezmenšíme takmer vôbec. To isté platí aj o hudobných súboroch. Veľmi efektívne je komprimovať textové dokumenty, databázy, súbory s poštou, objemné savy z hier, jednoducho súbory kde je predpoklad výskytu redundancie.


{moscomment}