Archivace a komprese - který formát je pro vás nejlepší?
Napsal ElCondor   
Pátek, 25 leden 2008

 

 

  

  • Archivace a komprese

                  který formát je pro vás nejlepší? 

   Zběžný pohled na problematiku archivace a komprese uživatelských dat.  Podíváme se na nejrozšířenější dostupné kompresní a archivační formáty a pokusíme se vybrat ten nejvhodnější.

     Archivační a kompresní programy jsou zde s námi již od počátku počítačů. Přestože požadavky na tyto programy se v průběhu let trochu měnily, jejich principy a fungování jsou v podstatě pořád stejné. Základními sledovanými parametry byla kvalita komprese (poměr mezi zkomprimovanými a nezkomprimovanými daty) a rychlost komprese. Vzhledem k pomalým procesorům a malým kapacitám datových nosičů bylo v počátcích počítačů třeba nalézt ideální poměr mezi kvalitou komprese a její výpočetní náročností. Lepší komprese sice vedla k úspoře místa na disku, ale znamenala na tehdejších CPU třeba také mnohem delší čas komprimování. Dnes, dovolím si tvrdit, je vzhledem k výkonu dnešních procesorů výpočetní náročnost a tedy i doba komprese pro běžného uživatele bezvýznamný parametr. Kapacity nosičů sice také raketově zvýšily a není proto třeba šetřit každým MB místa, ale s velkým rozmachem internetu nabývá kvalita komprese na novém významu. Pro přenos dat skrze internet je nepochybně lepší co nejmenší velikost přenášených dat. Proto se dnes nebudeme zabývat rychlostí komprese, ale zaměříme se pouze na její kvalitu.

winrar

Protože valná část uživatel zaměňuje pojmy "archivace" a "komprese" případně považuje obě činnosti za totéž, a nerozumí ani dalším pojmům, pojďme si, alespoň pro potřeby tohoto článku, nadefinovat, co všechny ty pojmy kolem archivace a komprese znamenají:

archivace - znamená umístění souboru/souborů, případně nějaké části adresářové struktury včetně uživatelských práv a dalších informací do jediného archivu(souboru). Takovýto archiv není komprimován. To znamená, že má větší velikost, než původně archivovaná data, protože k samotným datům je třeba připočítat nějakou režii archivu.

komprese - aplikace kompresního algoritmu na daný archiv (soubor), za účelem zmenšení jeho velikosti. Podotýkám, že se bavíme o kompresi bezztrátové (na rozdíl třeba od .mp3). Nikomu by se asi nelíbilo, kdyby si svůj důležitý dokument zkomprimoval a následně zjistil, že někdo přeházel písmenka, či umazal slova :-) Velká část dnes používaných programů provádí archivaci a následnou kompresi najednou a uživatel o tom ani neví.

kompresní algoritmus - tzv. Matematická transformace, v našem případě obousměrná a zcela jednoznačná. Musí být zaručeno, že transformací tam a zpět dosáhneme 100% původní data, bez jakékoli změny. V tomto ohledu je komprese dat a šifrování příbuzná činnost.

kompresní poměr - celou dobu tady hovořím o kvalitě komprese. Kvalitou komprese jsem nemyslel nic jiného než právě kompresní poměr. Stanovuje se jako poměr velikosti původních dat a zkomprimovaných dat. Pokud například 8MB zkomprimujeme na 2MB, pak kompresní poměr je právě 4. To znamená, že zkomprimovaný archiv zabírá 1/4 (25%) původní velikosti.

souborový formát pro kompresi a archivaci dat - to je v podstatě výsledek předchozích činností. Data se archivují, pomocí nějakého algoritmu zkomprimují a výsledkem je pak soubor s příponou .zip, .rar, .gz atd.... Hovoříme tak o formátu RAR, ZIP....atd

Dnes se tedy podíváme na archivaci a kompresi do jednotlivých souborových formátů a pokusíme se vybrat ten nejlepší. Do hodnocení zahrneme nejen kvalitu komprese, nebo chcete-li kompresní poměr, ale také dostupnost a licenční podmínky.

 
 
 
 
 
  • Nejpoužívanější formáty a algoritmy:

TAR - asi vůbec nejstarší dnes používaný formát. Zkratka TAR znamená "tape archiver" a vznikl již v raných dobách unixu právě pro zálohování na magnetickou pásku. TAR je archivační program. To znamená výsledný .tar archiv je větší, než původní data. Stručně řečeno, TAR jen sloučí několik souborů/adresářů do jednoho. Přesto se dnes hojně využívá, jak si řekneme za chvíli.

BZip2 - svobodný komprimační algoritmus a program vyvinutý Julianem Sewardem. První verzi (0.15) vydal v červenci 1996. Stabilita a popularita programu od té doby značně vzrostla. Verze 1.0 byla vydána na konci roku 2000. Bzip2 používá Burrows-Wheelerovu transformaci, která konvertuje často se opakující znakové sekvence do řetězců ze stejných písmen a poté použije move-to-front transformaci a nakonec Huffmanovo kódování. Původně používal předek bzip2 - bzip - aritmetické kódování, které má lepší kompresní poměr. To ale muselo být vyměněno za méně výkonné Huffmanovo kódování, protože aritmetické kódování je patentováno.

Bzip2 neumí pracovat s více soubory, zkomprimovat dokáže pouze jeden soubor. Tento princip vychází z principů fungování unixu, kdy na každou činnost existuje samostatný program. Programy jako TAR tedy spojí více souborů dohromady a bzip2 tento soubor pak zkomprimuje. V praxi se tedy setkáte se souborem s příponou tar.bz2 což znamená Bzipovaný tar archiv. Neznamená to ovšem, že by uživatel musel dělat archivaci a kompresi zvlášť. Většina programů pro kompresi a archivaci vám rovnou nabídne formát tar.bz.

Gzip - Gzip je zkratka pro GNU zip; program je free software náhradou za kompresní program používaný již v raném Unixovém systému, určený pro projekt GNU. Gzip je založený na algoritmu DEFLATE, který je kombinací LZ77 a Huffmanova kódování. Podobně jako Bzip2 i gzip je normálně používán ke kompresi jednotlivých souborů. V praxi se tedy opět soubory archivují programem Tar a následně zkomprimují pomocí Gzip. Výsledné soubory nesou příponu tar.gz nebo .tgz a bývají nazývány jako "tarball"

RAR - je populární proprietární souborový formát pro kompresi dat a archivaci vyvinutý ruským programátorem Jevgenijem Rošalem (odtud pojmenování RAR: Roshal ARchive). Autor WinRARu dal k dispozici zdrojové kódy dekomprimačního programu, díky tomu je možné RAR dekomprimovat i v jiných programech na různých platformách. RAR na rozdíl od předchozích formátů je šířen jako shareware. To znamená, že po uplynutí zkušební lhůty musíte program buď zaplatit a nebo odinstalovat.

ZIP - je populární, nicméně už několik let překonaný souborový formát pro kompresi a archivaci dat. Jeho největší výhodou je právě jeho rozšířenost.

7Zip - je komprimační program určený pro různé operační systémy. 7-Zip je svobodný software, vyvíjený Igorem Pavlovem a distribuován pod licencí GNU LGPL. 7-zip používá přednostně kompresní algoritmus LZMA, nabízí však také kompresní algoritmy PPMD, bzip2, Deflate, a „store“, tedy uloženi souborů bez komprese.

 

  • Praktické testy:

Za účelem testu jsem vybral různé skupiny běžných dat, které se mi za posledních pár let hromadí na disku. Předvedeme si archivaci dokumentů a textových souborů, videí, hudby a obrázků v některých běžných kombinacích. Ukážeme si, kdy komprimace smysl má, a kdy nikoli.

Test 1: MIDI – 3254 souborů /195 složek / 132,6 MB

test1 

MIDI soubory z velké části podobné jednoduchým .txt souborům. Z tohoto důvodu jsou data velmi dobře komprimovatelná, jak ukazuje graf. Jako nejlepší se ukazuje formát 7zip, s odstupem následovaný čtveřicí Rar, Tar.gz, Zip, Tar.bz2. Přestože se tyto programy liší metodou komprese, výsledky jsou v podstatě porovnatelné. Jak je vidět, velikost Tar archivu je stejná jako velikost původních dat.

Test 2: Směs multimédií – 105 souborů / 10 složek / 173,5 MB

směs souborů .avi, .mpg, .swf, .wma, .mp3, .pps, .gif, .exe, .bmp, .jpg, Nyní zkusíme komprimovat složku s velmi různorodou směsicí souborů videa, obrázků, hudby a prezentací:

test2

Všechny tyto soubory jsou již v komprimovaném formátu. Jak je vidět dodatečnou kompresí téměř nic nezískáme. Nejlepší je opět formát 7zip. Ovšem jeho náskok je v tomto případě minimální. Rozdíly mezi ostatní čtveřicí je plně zanedbatelný.

Test 3: Směs videa – 29s souborů / 341,8 MB

Následující graf snad ani nepotřebuje komentář. Video je samo o sobě komprimovaný formát, nehledě na to, že klasické komprimační nástroje se na něj nehodí.

test3

Test 4: Směs dokumentů – 1375 souborů / 264 složek/ 388,5MB

soubory formátů: .doc, .xls, .pdf, .tif, .jpg, .txt

test4

Moderní kancelářské balíky ve svých formátech dokumentů již nějakou kompresi používají. Soubory .jpg, .tiff, a pdf jsou pak rovněž komprimované. Přesto se velikost těchto dat nezanedbatelně zmenšila. Exceluje opět formát 7zip následovaný opět vyrovnanou čtveřicí .rar, .zip, .tar.gz a .tar.bz2.

Test 5: Dokumenty s obrázky – 65 souborů / 5 složek / 164,8MB

dokumenty typu .doc a .ppt s vloženými obrázky .jpg a .tif

test5

Opět je vidět, že kancelářské formáty jsou již částečně komprimované a velkého snížení se už nedočkáme. Je to také způsobenou vloženými obrázky, které jsou takřka nekomprimovatelné. V tomto případě jsou výsledky vyrovnané, nepatrně opět vede 7zip

Test 6: Složka Mp3 – 41 souborů 188,3MB:

Mp3 je naprosto nejrozšířenější (nikoli však nejlepší) ztrátový kompresní formát pro hudbu. Data jsou již tedy komprimována. Jak to vypadá, pokud takovouto složku zkomprimujeme si můžete domyslet.

test6

  •  Zhodnocení:

Naše hodnocení je třeba rozdělit do dvou kategorií:

V případě dokumentů, .txt souborů a souborů MIDI je nejlepším formátem 7zip. Naproti tomu, ostatní kompresní formáty Rar, Zip, Gzip a Bzip2 podávají velmi podobné výsledky. Nejhůře proto hodnotím formát Rar protože ačkoliv je placený, nepřináší uživateli v podstatě nic navíc oproti svým volně šiřitelným konkurentům. V absolutním hodnocení kompresního poměru formátu by se sice umístil na druhém místě s velkým odstupem za 7z, ale rozdíly mezi 2 a 5 místem jsou naprosto minimální a jeho konkurenti jsou distriubováni pod vstřícnější licencí. 

V případě audio-video souborů bych označil za nejvhodnějšího kandidáta archivní formát Tar. Jak je vidět z testů, jakákoli komprese v tomto případě nemá smysl a výsledky se vůbec neliší. Je proto zhola zbytečné audio-video takto komprimovat neboť se stejným výsledkem lze za zlomek času a výkonu procesoru vytvořit podobně veliký Tar archív. Zcela absurdně v rozporu s tímto zjištěním však valná část videí a hudby je na internetu publikována v .rar a .zip archivech, přestože to nemá vůbec žádný smysl (rapidshare.com, uschovna.cz). Autor zbytečně data komprimuje a adresát zbytečně data dekomprimuje. Přitom pouhá archivace, v našem testu zastoupena programem Tar, vytvoří lehce přenositelný jediný soubor podobné velikosti, ale bez nároků na kompresi.

Nejlepším kompresním formátem v testu byl nezpochyby 7zip. Je šířen zdrama pod licencí GNU GPL. Domovské stránky projektu naleznete na stránkách: http://www.7-zip.org/cs/ Program je multiplatformní a je dostupný pro Windows, Mac i Linux.  

 

EDIT: 26. 1. 2008.

- Všechny komprese byly provedeny na základním nástavení, pouze příkazem zkomprimovat - tedy tak, jak to dělá největší část uživatel.

- Doba komprese nepřesáhla 30s v žádném z případů. Subjektivně vůbec nejpomalejší byl RAR. Nejrychhlejší TAR (bez komprese) následovaný Tar.gz a Zip (s kompresí). 

- podrobné srovnání lze nalézt zde:  http://en.wikipedia.org/wiki/Comparison_of_file_archivers

Starší články


Komentáře
Přidat Nový
Centurion1973 [Zobrazit profil] [Poslat zprávu] 2008-01-25 23:56:41
avatar
7zip pouzivam uz dlouho a jsem s nim narosto spokojeny
ThomasBlue [Zobrazit profil] [Poslat zprávu] 2008-01-26 00:24:17

7zip je samozrejme jasny vitez, ale mozna by nebylo od veci uvest konkretni pouzite nastaveni programu, tj. uroven komprese, velikost slovniku, atd. protoze jinak je jaksi vypovidaci hodnota grafu nulova.

Take jsem nejak nepochopil tu narazku na format mp3. Rekl bych, ze to, ze neni nejlepsi je dost subjektivni tvrzeni a to v serioznim clanku nema co delat.
Solitary [Zobrazit profil] [Poslat zprávu] 2008-01-26 02:00:44
avatar
Jakypak subjektivni tvrzeni... dyt to je fakt

Jinak k clanku, prijemne pocteni... ale mrzi me ze je rychlost brana jako zanedbatelna, prijde mi to spis opomenute z lenosti nez z praktickeho hlediska, ona je ta rychlost porad docela osemetna. Sam sem ted provedl test 7zip proti RARu, vzal sem jednu slozku o velikosti 126MB, obsah ciste nahodny co zrovna ve slozce bylo, par dokumentu, exe instalatory a dokonce jeden uz zabaleny zip... a zabalil sem ji, jednou do .7z a jednou do .rar, v obou pripadech sem pouzil default nastaveni (zkratka sem to ve woknech zabalil jen pres nabidkove menu) RAR to balil o 40s dele! To je myslim nezanedbatelna vec, a o 1procento hur nez 7zip(96procent proti 95 = ze 126MB vyslo 121MB v obou pripadech, lisilo se to jen ve stovkach kB), coz je zas naopak silne zanedbatelne, ale porad v pomeru cas/komprimacni pomer je to pro RAR mizerne. Na druhou stranu, 7zip se rozbaloval 20s a rar pouze 8s.
ThomasBlue [Zobrazit profil] [Poslat zprávu] 2008-01-26 11:51:00

Ne, kdyz ty reknes, ze je lepsi a ja ze ne, tak co je fakt? Fakt je neco co je podlozeno nejakym objektivnim merenim. Jinak je to jen subjektivni nazor a ty by si mel nechat seriozni novinar pro sebe. Az se tu objevi odkaz na objektivni studii, tak tu ta poznamka klidne muze zustat.

Podobne poznamky delaji z ddworldu bohuzel tu nejvetsi brecku ceskeho internetu. Panove Stach, ElCondor a dalsi by si meli uvedomit, ze podobne ustepacne poznamky at uz na jednu nebo na druhou stranu do seriozniho clanku NEPATRI. ElCondor ma rad opensource, budiz, DD ma rad AMD-ATI, budiz, do toho nikomu nic neni, ale jejich neustala snaha podsouvat "nenapadnymi" narazkami v textu ctenari svuj vlastni nazor je k zbliti.
Anonymní  2008-01-26 12:52:35

když řeknu, že WMA je lepší než MP3, kde v tom vidíte opensource?
ThomasBlue [Zobrazit profil] [Poslat zprávu] 2008-01-27 16:24:36

Mate neobycejnou schopnost uhybat od prave podstaty dotazu. Myslim, ze by z vas byl dobry politik.
Anonymní  2008-01-27 16:36:04

Já teď ale skutečně nevím, na jsem vám neodpověděl?
Zkusím to tedy bodově:

1) Chcete studii o tom, že .mp3 j horší? To se na mě nezlobte, ale tohle je už mnoho let známý fakt a váš požadavek mi přijde stejně tak absurdní, jako kdyby jste se tu dožadoval "seriózního článku dokazujícího, že země je kulatá". To je snadno dohledatelná informace, a nebudu ji hledat za vás, protože jen vy sám si dokážete stanovit, který test je podle vás důvěrohodný. Je jich požehaně, tak se snažte

2) Mp3 je naprosto nejrozšířenější (nikoli však nejlepší) ztrátový kompresní formát pro hudbu

Chcete mi tady tvrdit, že mp3 není nejrozšířenější? Nebo mi snad chcete tvrdit, že mp3 je nejlepší existující ztrátový formát úplně ze všech? Pokud ne, pak je toto mé tvrzení naprosto trefné!

3)Jste snad hloupý čtenář, který si od zlého ElCondora nebo DD nechá něco nakukat? Ne? Tak si hodnocení jako "na zblití" nechte pro sebe. Nerozumím, proč trávíte svůj volný čas řtením něčeho, co vám způsobuje zdravotní komplikace

4) Můžete zkusit napsat trefný článek a poslat ho DD. Pokud bude stát za to, DD vám ho vydá. A to i v případě, že budet skrytými narážkami preferovat nVidii a Intel
GOS007 [Zobrazit profil] [Poslat zprávu] 2008-01-27 20:47:34
avatar
No. A já tvrdím, že optimální je OGG (Vorbis). Kvalitnější než MP3, v porovnání s WMA kvalita nevím, ale proti WMA je myslím free a taky už v přehrávačích hojně podporovaný. I když nejlepší je asi aac+, teda mezi ztrátovými enkodery. Jenom nevím jak je to s jeho licencí, ale mě se zdá, že taky free. Ale méně rozšířený.
Solitary [Zobrazit profil] [Poslat zprávu] 2008-01-26 15:24:04
avatar
K zbliti si ty, vzdycky se tu najde par mamlasu, co si mysli, ze sezrali vsechen rozum na svete... a vidi tady uplne jasne nadrzovani jedne strany. Kdyz tomu prd rozumis a potrebujes studie, aby ses dozvedel ze mp3 nejsou to nejkvalitnejsi, budiz(ikdyz by me moc zajimalo, podle jakych fakt zastavas svuj nazor, na to bych byl moc zvedavej)... spousta zkusenych lidi, ale vi, ze to tak neni, pokud jim neveris, zjisti si to sam. Pokud tento web povazujes za brecku, jdi si cist Hulana.
ThomasBlue [Zobrazit profil] [Poslat zprávu] 2008-01-27 16:22:51

Pekna reakce, leccos o tobe vypovidajici. Opravdu nemam potrebu si tady honit triko a dokazovat ti, ze tomu rozumim mnohem vic nez ty. Popravde co si mysli nula jako ty je mi uprimne jedno. Toto byl jen drobny apel na vyse zminene pany. Snad si z toho vezmou aspon neco. Brecka mozna byl trochu silny vyraz, ale v neobjektivite clanku rozhodne ddworld vede na plne care, prave se zminenym hulanem. Ja si nastesti umim udelat svuj vlastni nazor.
aDDmin [Zobrazit profil] [Poslat zprávu] 2008-01-27 16:33:50
avatar
no nevim jestli zrovna vy si můžete dovolit hodnotit objektivitu ....
Solitary [Zobrazit profil] [Poslat zprávu] 2008-01-27 21:01:48
avatar
Jaka otazka, taka reakce ;) bobane
Mescalamba [Zobrazit profil] [Poslat zprávu] 2008-01-26 02:49:07
avatar
Slyšels někdy o FLAC, OGG, AAC? MP3 je z hlediska kvality zvuku děs.. A dle mých zkušeností je OGG o dost lepší, při zachování stejné nebo podobné velikosti.. Takže MP3 fakt neni nejlepší, maximálně nejprofláklejší a nejvyužívanější formát.
ThomasBlue [Zobrazit profil] [Poslat zprávu] 2008-01-26 11:40:51

A slysel ty nekdy o tom, ze FLAC je bezztratova komprese, takze je blbost ho porovnavat s mp3? Rozdil mezi OGG nebo AAC a MP3 ve vyssich bitratech normalni clovek nepozna pokud nema usi jako netopyr a aparaturu se za 100 000. Tohle je proste jen vykrik do tmy, ktery neni nicim podlozeny. Mp3 je v kvalite naprosto dostatecny a navic ho prehrajete vsude.
Anonymní  2008-01-26 12:18:22

Ano .mp3 při vysokých bitrate je přibližně porovnatelný jako třeba Ogg. Jenže je placený, licenčně svázaný a ještě k tomu nepatrně horší.

To je jako kdyby jste tu říkal, že Mercedes je na cestu do Kauflandu srovnatelný s Octávií kombi, a proto vám stačí Mercedes (který je 10x dražší) A to nemluvím otom, že v tomto případě jetše méně kvalitní.

A s těmi normálními .mp3. Ano, na diskmenu to nepoznáte. Ale jednu dobu jsem si přivydělával i jako DJ, a můžu vám říct, že na lepší aparatuře je .mp3 děs běs!
GOS007 [Zobrazit profil] [Poslat zprávu] 2008-01-27 21:42:56
avatar
No. Když už tvořit MP3, tak aspoň za pomoci enkoderu L.A.M.E, tam jde sakra slyšet rozdíl v kvalitě oproti jiným MP3 enkoderum. Ale jinak OGG. Mé přehrávače to podporují, tak buď si vychutnám kvalitu a nebo si užiji více času s hudbou, ale spíš preferuji tu kvalitu.
Anonymní  2008-01-26 08:29:39

.mp3 je skutečně možná nejhorší ztrátový formát, ktery se dnes významně používá. WMA a OGG jsou bezpochyby lepší.

A to nemluvím o bezztrátovém FLAC.
ThomasBlue [Zobrazit profil] [Poslat zprávu] 2008-01-26 11:43:10

Bezpochyby? Nejaky dukaz by nebyl? A prvni cast otazky se vam nehodila do kramu, tak jste ji preskocil?
Anonymní  2008-01-26 11:58:20

Co se týče .mp3, najděte si jeden z hromady testů na internetu

A k nastavení komprese, to se mi do krámu samozřejmě hodilo, za upozornění vám děkuji a v článku jsem to upřesnil. Jedná se o základní nastavení všech kompresních nástrojů. Můžeme sice laborovat s nastavením, ale nevím, zda je to souměřitelné. Nejaktuálněší informace k RARu, kterou se mi povedlo dohledat hovoří o maximání velikosti slovníku 4MB. 7Zip naproti tomu umožňuje až 256MB. Jak toto chcete porovnávat? Není obtížné napsat odborný článek, pokud tomu autor rozumí. Je těžké napsat článek tak, aby to pochopil obyčejný uživatel, a těch je většina. Pak je to buď a nebo. Obyčejný uživatel s komprimačním programem laborovat nebude.
ThomasBlue [Zobrazit profil] [Poslat zprávu] 2008-01-27 16:41:44

Testy znam. Pokud je pouzity rozumny bitrate, tedy min 192 kbps, tak tvrdim, ze rozdil k valite je neslysitelny. Analyza frekvencnich spekter na zaklade Fourierovy transformace a podobne hratky jsou vec pekna, ale bohuzel vubec nic nerikaji o vlastnim pocitu z poslechu. A navic i v techto testech je pri rozumnem bitrate rozdil mezi mp3 a napr. ogg naprosto zanedbatelny. A pro mp3 hovori x nasobne vetsi rozsirenost, proto ja osobne neznam lepsi format.
Anonymní  2008-01-27 16:58:06

Průser je, že toto je ukázka vašeho 100% subjektivního názoru. V akustice je spousta veličin nadefinována ve snaze, nějak to napasovat na lidské vnímání. Problém je, že každý člověk má ten sluch jiný. Takže sice můžete říct, že vy něco neslyšíte, ale nemůžete to aplikovat na všechny.

Jediná objektivní metoda měření kvaity je právě metoda frevenční analýzy. Ona Fourierova transformace vám dá perfektní odhad o obsažených fekvencích. žádné jiné objektivní měřítko nenajdete.

Zajímavé by taky bylo sledovat bitrate. Jsou formáty, které jsou mohou využít proměnlivý bitrate. Jsou formáty, které mají subjektivně stejnou kvalitu, při nižším bitrate v porovnání s mp3. A to nemluvím o tom, že závisí na typu zvuku, který posloucháte.

Jediné s čím s vámi souhlasím je fakt, že .mp3 je nerozšířenější. Rozšířenost formátu by ovšem, alespoň pro mě neměl být důvod například k degradaci kvality mé hudební sbírky. Výběr zařízení schopných přehrát třeba WMA je dnes obrovský. OGG již dnes také není neřešitelný problém.
Squad_leader [Zobrazit profil] [Poslat zprávu] - Co je nejpodstatnější 2008-01-26 00:47:44
avatar
Co je nejpodstatnější alespoň podle mě není velikost výsledného archivu, ale možnosti.
Například jak je, který algoritmus schopen obnovovat data na základě částečné ztráty (poškrábané medium CD/DVD) a jak je dostupný.

Extrémně populární je algoritmus ZIP, protože je dostupný pro libovolné programovací platformy ve formě přídavných knihoven.

Ať už jde o PHP nebo C, všechny tyto jazyky obsahují knihovny pro obsluhu a práci s archivy v tomto formátu. (Což se nedá o 7z nebo dokonce RARu vůbec řici! - Pomineme-li nekoncepční brutality typu: spoléhání na volání nějakého externího exáče s parametry o jehož výsledcích můžeme téměř spekulovat).

Všechny algoritmy obsahují spousty voleb a to není jen obecný stupeň komprese (který má nejpodstatnější vliv na čas), ale například mají volbu specifikace baleného obsahu (RAR určitě).
Čili z tohoto hlediska grafy nevypovidají vůbec o ničem.


Moje zkušenost je taková, že když zabalíme několika-gigabajtový obsah tak rozdíly se potom pohybují většinou v jednotkách MB, takže ta výsledná velikost je relativně irelevantní.
1742 [Zobrazit profil] [Poslat zprávu] 2008-01-26 01:11:43

Myslím, že tento článek nebyl určen pro programátory, ale normální usery, kteří třeba ani nevěděli o 7z. Jinak musím říct, že pro mě je archivování do rarů a těchhle věciček zbytečné, jsou DVDčka, kam se mi vejde vše a až pokud je jeden soubor moc velký, dá se obyčejným rarem rozdělit na části po pár MB/GB... Jednoduché a účelné, jinak abych snižoval velikost jednoho souboru, v dobách TB HDD, to je směšné
Centurion1973 [Zobrazit profil] [Poslat zprávu] 2008-01-26 01:55:35
avatar
No je to uzitecne pokud posilas velky objem dat prez net protoze vetsina lidi v tehle republice ma naprosto smesnej upload.
Squad_leader [Zobrazit profil] [Poslat zprávu] 2008-01-26 02:23:12
avatar
Balení dat není nesmysl. To, že jej ty nevyužíváš u konkrétní aplikace je věc vytržená z kontextu. Třeba u her a programů lze v rámci instalátoru zabalit obsah z 8GB na 3GB atd.... což už šetří i celé media. Navíc výpočet pro extrahované (původní) data procesorem je rychlejší než samotná kopie 1:1, protože z instalačního media čteme zabalený, zlomkový obsah, který už dopočítává procesor, takže lze prohlásit, že díky tomuto je aplikace i nesrovnatelně rychleji nainstalována.

Pochopitelně jestli se bavíš o obsahu multimediálním, tak ten nemá smysl balit, protože takový obsah už jednoduše zabalený je.
Bavit se o multimediálních algoritmech je pro nás, jako uživatele bezpředmětné a působilo by laciným hospodským dojmem (za jejich návrhem stojí skupina specialistů).
Anonymní  2008-01-26 08:38:47

Grafy vypovídají zejména o tom, že lidi komprimují naprosto neuvěřitelné věci jako je hudba nebo video. Zkus něco najít a stáhnout z internetu. V 50% případů to bude v RARu. To je naprosto absurdní.

Chci-li nejaký obsah prostě jen archivovat do souboru, nepůjdu na to s komprimátorem, ale pouze archivátorem (v našem případě TAR). Vyhnu se potenciálním chybám při kompresi či dekompresi, a ušetřím si procesorový čas. K čemu mií bude, když ty 4 videa stahuju v RARu s 99% velikostí, místo abych je stáhnul v Taru se 100% velikostí.

Z článku si člověk nemusí nutně odnést, který komprimátor je nejlepší, ale třeba zjištění, že valná část věcí pristě nemá smysl komprimovat (a přesto se tak denodenně děje). Přesně to demonstruje mé tvrzení, že lidi si pletou komprimátor s archivátorem
ThomasBlue [Zobrazit profil] [Poslat zprávu] 2008-01-26 11:55:22

Ne, neni to az tak absurdni. RAR se pouziva jednak protoze je treba jednoduse rozdelit velke soubory do mensich casti (rapidshare) a pak take protoze samotne rozbaleni implicitne zahrnuje kontrolu integrity. Coz nevim jestli zrovna tar obsahuje aspon CRC nebo neco podobneho.
aPk [Zobrazit profil] [Poslat zprávu] 2008-01-26 12:11:38

Ano souhlasim a taky se vetsinou RAR na rapidsharu pouziva pro volbu hesla a sifrovani souboru, tak aby se jim v tom nikdo "nepovolanej" nehrabal ;)
Anonymní  2008-01-26 12:46:38

nelegální činnost mě nezajímá Warez není argument
Ravenhorn [Zobrazit profil] [Poslat zprávu] - :-) 2008-01-26 15:37:57
avatar
Všechno je argument. TAR jsem ještě neviděl, že ho někdo používal.
Anonymní  2008-01-26 16:53:42

Tar má původ v unixu. Takže ho používají všechny unixové operační systémy. A to sakra hodně. Tarbally tvoří určitě více než 90% všech archivů u unixoých uživatel.

Jinak drtivá většina archivačních/komprimačních formátů je multiplatformních. napříkld takový WinRAR umí s Tar bez problémů pracovat.

Rozhodně vidím jako logičtější možnost, když uživatel Windows použije například Tar.gz místo toho, aby ukradl RAR. Jinak je to jen o zvyku.
aPk [Zobrazit profil] [Poslat zprávu] 2008-01-26 18:13:46

Ja sem nerikal, ze to musi bejt nutne nelegalni cinnosti... treba tam mas zalohovany rodinny video, na ktery nechces aby nekdo cumel...
A ani nerikam ze je to nejlepsi zpusob, jen rikam ze se tam pouziva RAR prave k temto ucelum..
Anonymní  2008-01-26 19:01:25

já jsem pár videí také stahoval. Všechny byly komprimované. Ale i kdyby. Nemám nic proti použití RARu. Jistě je to vynikající nástroj. Jenže je placený, a tady začíná v čské končině problém. Neznám nikoho, kdo by ho po konci zkušební lhůty zkutečně zaplatil.
MartensPh [Zobrazit profil] [Poslat zprávu] 2008-01-26 20:05:31

A ja je znam, pro firmu tech par stovek za zip nebo rar je pakatel.
ThomasBlue [Zobrazit profil] [Poslat zprávu] 2008-01-27 16:27:25

Rapidshare byl jen priklad a navic rapidshare nerovna se warez. Ptam se jeste jednou, obsahuje tar nejakou inherentni kontrolu integrity?
Anonymní  2008-01-27 18:38:49

Přečtěte si znovu článek, tam najdete odpověď. Ale i tak se vám pokusím odpovědět. Filozofie unixu je, že každý rogram dělá svou činnost. Proto TAR archivuje, Bzip/Gzip komprimuje a GPG (GnuPG) provádí integrity check. To je extrémně výhodné v tom, že můžete kombinovat komponenty, které vám vyhovují. A to platí zcela obecně. Každé All-in-one řešení vás z tohoto pohledu značně omezuje.

Jinak článek je o formátech, nikoli o konkrétních programech. TAR, Bzip, Gzip a GPG jsou programy do CLI, takže s nimi běžný user nepracuje, protože by musel dělat všechno postupně sám. Buď máte nějakou grafickou nástavbu, která ty činnosti udělá za vás a nebo jste zručný a uděláte si skript. Proto nemůžete srovnávat Tar s RARem. Tar je jednostranně zaměřený nástroj. Vaše otázka by měla znít úpkně jinak:

Existuje pro platformu Windows nějaká program, který kombinuje tyto jednotlivé činnosti dohromady?

Moje odpověď zní: NEVÍM
lBakYl [Zobrazit profil] [Poslat zprávu] - Diky 2008-01-26 01:08:01
avatar
Dekuji autorovi za velice zajimavy a poucny clanek. Vetsina mych predpokladu se naplnila, presto ocenuji, ze jste si s tim dal takovou praci. Diky moc
Mescalamba [Zobrazit profil] [Poslat zprávu] 2008-01-26 02:52:07
avatar
Hezkej článek, jen bych ocenil možná trošku víc informací o nastavení programů a rychlosti jakou to komprimuje a taky jak jsou na tom s kompatibilitou.
Anonymní  2008-01-26 08:54:36

Nrozumím ... jakou kompatibilitu máš konkrétně na mysli?
eXistenZ [Zobrazit profil] [Poslat zprávu] 2008-01-26 09:07:26
avatar
jaksi mi tu chýba WinACE... ten používam ja...
MartensPh [Zobrazit profil] [Poslat zprávu] - Dalsi moznost vyuziti komprima 2008-01-26 11:21:56

Autor zapomnel zminit jeste jedno vyuziti komprimace, kterou ja osobne pouzival do doby, nez zacaly byt procesory elektricky setrive. A pro mne zacalo byt setreni elektriky dulezitejsi.

Vyuziti vychazi z premisi, ze cteni z disku je radove pomalejsi (jak kazdy vi) nez dekomprimace v pameti. Jednoduse, v XP v nouzovem rezimu se zabalili internim XPckovym komprimatorem nejvetsi adresare v Program Files. XPcka pak pri spusteni programu jej rychleji natahnou do pameti a dekomprimuji a spusti. Vysledny cas byl mensi nez jen natazeni do pameti a spusteni bez dekomprimace.

Racte vyzkouset, funguje to, ale jaxem napsal, chce to vypnout setrive rezimy procesoru, tam si nejsem jisty, zda to pomuze. A take to chce vybrane adresare otestovat, zda to pomuze. Kdyz tak lze komprimovat jen zvolene podadresare, kde jsou velke exe soubory a tak.
petrsuchy [Zobrazit profil] [Poslat zprávu] 2008-01-26 11:38:29
avatar
Ja teda pouzivam RAR ale vzdycky bez komprese. Proste to jenom zabalim a nekdy to rozdelim po x MB nebo treba pridam heslo. Takova otazka, da se i v jinych komprimacnich formatech soubor rozdelit po urcitych castech ?
Anonymní  2008-01-26 12:13:11

No, pokud vím, tak rozdělení archivu na více částí umožňují:

7Zip, Rar, Tar

Takže možnosti jsou tyto: .7z, .rar, .tar.gz, tar.bz2
cch [Zobrazit profil] [Poslat zprávu] 2008-01-27 21:33:56
avatar
nedavno jsem se setal i děleným zipem, ale nic s čím by si winrar nepodadil
bigjohn [Zobrazit profil] [Poslat zprávu] - oprava 2008-01-26 20:14:29

Alexander Roshal a nie Jevgenij...
RiMr [Zobrazit profil] [Poslat zprávu] - Tiff a komprese 2008-01-27 02:34:05
avatar
Jenom malá poznámka, tiff není sám o sobě přirozeně komprimovaný, pouze když se k tomu příslušná aplikace *.tif vytvářející ponouká. Nejčastější je LZW komprese, dnes např. Photoshopu CS3 i další alg. Zajímavé je srovnání času komprimování i dekomprimování mezi MacOSX a PC i na stejných procesorech. Mac je několika násobně pomalejší. Ale to jen na okraj. Já např. často používám kompresi "bez komprese" s heslem na rychlé a multiplatformě snadno kompatibilní a blbuvzdorné vytváření primitivně chráněných archivů obsahujících data, která by neměla být na první pohled očumovatelná.
Díky za pro mnohé bezpochyby přínosný článek.
Sina [Zobrazit profil] [Poslat zprávu] - RAR a placeny? 2008-01-27 14:42:26
avatar
No ja pouzivam uz hodne dlouho WinRAR, ani nevim proc, asi uz sem si na nej zvyknul... Ale nikdy sem teda nic neplatil - po mesici program pri spusteni zada o zakoupeni, ale staci kliknout na zavrit a v pohode funguje dal uplne normalne. Jeden klik navic me pri spusteni nezabije a ke koupi rozhodne nedonuti
sonoluca [Zobrazit profil] [Poslat zprávu] 2008-01-27 15:07:12
avatar
Nás co použiváme 7zip žádný přiblblý okna na zavírání neotravují
Anonymní  2008-01-27 15:24:12

Rar je šířen jako shareware. A to není to samé co freeware!
V případě RARu to konkrétně znamená, že máte 30 dní na vyzkoušení. Pak musíte RAR smazat, nebo zaplatit za licenci. Pokud nezaplatíte, po 30 dnech se stáváte nelegálním uživatelem Přečtěte si licenci!
GOS007 [Zobrazit profil] [Poslat zprávu] - 7Zip 2008-01-27 20:34:55
avatar
7Zip už používám nejméně 3 roky jak ve Windows tak v Linuxu a spokojenost. Sice pomalejší, ale není to tak hrozné.
jack.t [Zobrazit profil] [Poslat zprávu] - ZIP 2008-01-27 21:49:59

Dle mého osobního názoru se zde můžeme jednoduše dohadovat o kvalitách komprese, o tom, jaký archivátor či jaká komprese je nejlepší.

Avšak vše musíme vzít také z pohledu uživatele laika (a nebo například z pohledu firmy).

Z tohoto hlediska (a díky rozšíření Windows (je-li to dobře či nikoliv a nebo jejich legální původu se nebudeme teď dohadovat) je nejvýhodnějším formátem stále a dokola ZIP. Díky své integraci v OS je pro veškeré uživatele nejpříhodnější.

Nedokáži si představit mnoho uživatelů, jak někde na internetu zrovna teď hledají něco, co jim rozbalí RAR, 7ZIP, TAR apod. Chtějí prostě a jednoduše kliknout a získat data. Že je daný soubor komprimovaným archívem, to je nikdy nezajímá.

A nakonec zaskočme k přátelům ve firemní sféře. Zde většinou naleznete OS bez možnosti jakýchkoliv instalací. A myslíte, že většina IT"profesionálů" v IT odděleních se zajímá o to, že některá sekretářka neotevře nějaký archiv. Akoráte ji zašlou pamflet o tom, jak má upozornit odesílatele, že daný soubor má zaslat ve formátu ZIP, jinak s ním ona komunikovat nemůže .

Takže ať se domlouváme jak chceme a mezi námi děvčaty ... tedy pardon více IT nakaženějšími uživateli ... je oblíben jeden či druhý formát, tak díky své integraci pořád ZIP vede a (ač jej sám moc nevyužívám) bude vést dokud se MS nerozhodne pro něco dalšího...
Hrochy [Zobrazit profil] [Poslat zprávu] - co treba graf casu? 2008-01-28 18:37:27

a graf delky komprese jednotlivych formatu nebude? pokud ne, pak je to dalsi clanek o bezhlavem prosazovani open-source a neco mi rika, ze 7zip neni zrovna rychly
Anonymní  2008-01-28 18:39:24

7zip rychlý není. Ovšem oproti RARu je to pořád ještě rychlík
liborius [Zobrazit profil] [Poslat zprávu] - další formáty a nastavení 2008-10-01 19:45:39
avatar
Díky za zajímavý článek. Na můj vkus sice trošku povrchní, ale aspoň si vždycky uvědomím, že se v tom každý nevrtá tak jako já Jako základní přehled to je určitě dostatečné.

Jen pro doplnění:
MS svého času hojně využíval .CAB archivy, zvláště pro instalční soubory. BTW CABy měly svého času lepší kompresní poměr, než např. ZIPy.

Když už zacházíte do historických formátů, ještě z dob hlubokého DOSu, tak tehdy existovala celá řada dnes už skoro zapomenutých kompresních formátů, za všechny budu jmenovat svého času populární ARJ.

Taky jste se mohli zmínit o speciálních komprimačních nástrojích typu UPX nebo ASPack, které dokáží bezztrátově komprimovat .exe a .dll soubory. Ale to už jsme daleko...

Jistě ne každý ocení pokročilá nastavení, ale pro mě bývala třeba možnost komprese do solid archivu docela významným plus pro WinRAR.
nutak [Zobrazit profil] [Poslat zprávu] 2009-05-07 14:28:01

Je mi to jedno , ale i rar nebo zip dyt co je celkem jedno ne
Pouze registrovaní uživatelé mohou přidat komentář!