Firmy i jednotlivce čeká datový kolaps – zbytečně skladovaných dat přibývá
Napsal Jan "DD" Stach   
Pondělí, 02 listopad 2009
altZajímá, ale nikoliv prvně prezentovaná data, která ovšem rozhodně jsou varováním.

 

 

Nejdříve vám sem dáme zprávu ve zkráceném znění, jak nám dorazila do pošty:

Ročně se rozroste množství dat na firemních discích až o 60 procent. Příští rok se bude celosvětový objem elektronicky uchovávaných informací rovnat sloupci knih, který dosáhne od Slunce na Pluto a zpět. Až 90 procent záložních dat ukládají firmy zbytečně. Pokud bobtnající data nedostanou pod kontrolu, mohou o cenné informace přijít. Řešením je takzvaná deduplikace dat, která umí „zhustit data“ tak, že se žádná informace na disku zbytečně neopakuje.

PRAHA, 2. listopadu 2009 – Tuzemské firmy se začínají utápět ve velkém množství elektronických dat, vyplývá z analýzy technologických společností EMC a S&T CZ. Nejen velké firmy, ale i ty menší se začínají pomalu ztrácet v datech, která za léta provozu nashromáždily. „Průměrná firma o 50 zaměstnancích ročně vyprodukuje 2 TB dat, což představuje zhruba 40 GB dat na uživatele,“ řekl Petr Diviš, technologický expert společnosti S&T CZ, která patří mezi přední systémové integrátory. Podle analytiků společnosti IDC se objem ukládaných digitálních informací každé čtyři roky zpětinásobí. Stále častější otázkou proto je: Kam všechna ta data ukládat a jak je efektivně zálohovat?

„Ročně ve firemním sektoru vzroste množství dat o 40 až 60 procent,“ potvrdil Vladimír Kyša, odborník na zálohování dat ze společnosti EMC, která patří mezí lídry v technologiích pro uchovávání a správu dat. Nejvíce prostoru na discích zabírá obrazová dokumentace a audiovizuální data, kterých přibývá kvůli postupné digitalizaci veškerých dat – od smluv až například po nahrávky telefonních hovorů se zákazníky. Další digitalizace tempo růstu objemu dat ještě urychlí.

Klíčové informace se mohou v záplavě dat ztratit

Pokud firmy nezačnou ukládání a zálohování dat systematicky řešit, dnes uložená data nemusí být za několik let, či dokonce měsíců dostupná. Případně firmy budou muset vynakládat desítky tisíc korun na stále nová zejména zálohovací média. Rizika ztráty dat se přitom nezbaví, spíše naopak. „Čím více zálohovacích médií firma spravuje, tím větší je riziko jejich selhání, poškození nebo ztráty. Během let se navíc může shromáždit tolik dokumentů, že najít ten potřebný bude v záplavě záložních disků zhola nemožné,“ varoval Petr Diviš ze společnosti S&T CZ.

Až 90 procent záložních dat ukládají firmy zbytečně

Lékem na záplavu dat je odstranění duplicitních, tedy nadbytečných kopií dat – provést takzvanou deduplikaci dat. Běžně jde o soubory či části souborů uložené na disku vícekrát – například kvůli chaosu ve firemní síti či nevhodnému způsobu zálohování dat. „V takových firmách i při dodržování běžných pravidel je duplicita zálohovaných dat více než 90procentní,“ upozornil na značné rezervy v zálohování dat Vladimír Kyša.

Avšak ani ti, kdo zálohují data pokročilými metodami (například uchovávají jen změněné soubory), se nechovají dostatečně úsporně. „Duplicita zálohovaných dat i při úsporném a pravidelném zálohování bývá více než 40procentní,“ řekl Vladimír Kyša. V deduplikaci dat je proto možné jít ještě o jednu úroveň výše a zbavit se kopií dokonce na úrovni částí jednotlivých souborů.

Data totiž zbytečně „nafukují“ nikoli nadbytečné kopie souborů, ale kopie jednotlivých částí souborů – číslicových bloků –, které se v souborech opakují. „Překvapivě třeba textový soubor, fotografie nebo video obsahují na základní úrovni spoustu společných datových bloků. Nové technologie umějí soubory rozkouskovat na miniaturní částečky a ty pak porovnávat mezi sebou. Pokud se některé části opakují, zbytečně je na disk neukládají,“ vysvětlil Vladimír Kyša princip fungování nejnovějších technologií společnosti EMC.

 

Zajímavá jsou i další data:

 

INFO BOX: OBJEM DAT DRAMATICKY ROSTE KAŽDÝ ROK

Nároky na uložení velkého množství dat stoupají každým rokem. V roce 2006 činilo podle studie IDC množství ve světě vytvořených a replikovaných informací 161 exabytů (161 miliard gigabytů).

To je třikrát více než všechny knihy, které byly kdy napsány. Ještě lépe si lze toto množství informací představit jako dvanáct komínků knih dosahujících ze Země na Slunce.

Do roku 2010 bude toto množství šestinásobné. Při použití analogie s knihami by komínek knih sahal od Slunce až na Pluto a zpět. (zdroj: studie IDC)*

 

 

DDWorld komentuje: Informace o rostoucí datové zátěži nejsou nijak nové a množství dat neustále narůstá. Když pomineme důležitá data a z digitalizované záznamy, je zde drtivá většina všeho skutečně duplicitami a většina navíc zbytečná. Problémem je hlavně se v rostoucím množství uchovávaných informací vyznat a uchovávat skutečně jen to, co za to stojí. Nemusíme být soukromá forma, stačí se doma podívat na vlastní disky, či spíše diskové pole. Těch zbytečných dat a nepořádek, co tam většinou převládá, si představte v celosvětovém měřítku a máte představu o tom, že vyhrožování datovým kolapsem zní možná sice přehnaně, ovšem nikoliv jako nerealistická PR kravina. Digitalizace je sice fajn, ale čeho je moc, toho je příliš a uchovávat TB dat na které už se v životě nepodívám a jejichž vymazáním se nic nestane je podle mého názoru tím nejlepším lékem na kolaps.

Zdroj: tisková zpráva EMC a S&T CZ

 

AUTOR: Jan "DD" Stach
Radši dělám věci pomaleji a pořádně, než rychle a špatně.

Starší články


Komentáře
Přidat Nový
shurin [Zobrazit profil] [Poslat zprávu] 2009-11-02 15:07:45
avatar
Dokud budou ty disky tak levný, tak mě nic nedonutí mazat, navic na zalohu dokumentu a dalsich dulezitych veci me staci jedno DVDcko a zbytek me vetsinou smaze nejaka chyba disku, ktera se chte nechte po par letech objeví, takže mam klid, a kdyz je to akutni tak smazu par HD filmu ci serialu a hnedle je je par desitek GB volných
Kosheen [Zobrazit profil] [Poslat zprávu] 2009-11-02 15:15:48
avatar
take mazanie dat je najmenej bolestive, ako ked strhnes naplast velmi rychlo hlavne ze to jedno dvd ostane
Raccon [Zobrazit profil] [Poslat zprávu] 2009-11-02 15:30:51

Já nějak nechápu v čem je problém, není jedno jestli mám v PC jeden TB disk nebo třeba tři? Když v nich mám pořádek? Mě se jen tak nestane že bych něco nenašel. Nejak to nechápů ,,Těch zbytečných dat a nepořádek, co tam většinou převládá, si představte v celosvětovém měřítku a máte představu o tom, že vyhrožování datovým kolapsem zní možná sice přehnaně, ovšem nikoliv jako nerealistická PR kravina." Proč si mám svoje disky představit v celosvětovém měřítku, moje disky jsou jenom moje ne?
Mizu165 [Zobrazit profil] [Poslat zprávu] - aj ja som mal kedysi poriadok. 2009-11-02 16:05:39

hej, tvoj HDD je zrejme novy, alebo tie data su nove tak to bolo aj u mna, ked som pomalicky zaplnal novy, prazdny HDD - mal som poriadok, vedel som, co tam vsetko mam.. Potom som upgradoval, prekopcil data na novsi disk a aj ten zacal postupne naplnat. Dnes vazne netusim skoro nic o datach, ktore boli este na starom HDD. Niekedy si len tak prechadzam zlozky a cudujem sa, co tam mam
Najvacsi problem su male subory, filmy a hudba je v poho, tam nie je neporiadok.
shurin [Zobrazit profil] [Poslat zprávu] 2009-11-02 18:57:38
avatar
Já si myslím, že mam co do počtu souboru jich mam mnohokrát méně než před pár lety, vetsinu stejne zabírají filmy a nejaky dokumenty a programy už nestahuju, to jen dávám otevřít, místo uložit.
Raccon [Zobrazit profil] [Poslat zprávu] 2009-11-02 21:24:15

No disk sice mam nový ale Obsah tam mam ze starého a ještě mnohem víc, pořádek jsem měl na starém a mám ho také na novém, ale nějak nechápu proč by měla uložená data způsobit nějaký kolaps, kolaps čeho? Můj, toho disku nebo čeho.
tynyt [Zobrazit profil] [Poslat zprávu] 2009-11-02 21:58:09
avatar
a teď si představ situaci: máš firmu. V té firmě samý notebook, takže čekat, že data budou na serveru a ne na stanici je zcela naivní. Každý uživatel si tedy syslí svá data v notebooku a teď nastává ta pravá veselice - představ si, co se bude dít, když ten notes ztratí/je mu ukraden/praští s ním o betonový patník... Začneš horko-těžko shánět jeho "ztracená" data (protože běžný BFU je pacient, který zásadně nezálohuje, protože jej "to zdržuje, a vůbec, zálohují jen přizdisráči". O takových eventualitách, že si nějaký zdatný borec sám smaže data, nebo si je nechtěně změní (nebo mu jej někdo změní), už ani nemluvím.

Tak nevím, jak pořídíš s těmi svými třemi "terárky" Ony ostatně řešení od EMC nejsou právě pro běžné domácí uživatele, i když deduplikovat data už umí i takový "hloupý" Acronis.
Raccon [Zobrazit profil] [Poslat zprávu] 2009-11-02 22:52:08

No to je hezký no, moje důležitá data se vejdou na flešku nebo na DVD. Jenomže jaká data jako domácí uživatel můžu mít na nějakém serveru? Instalace her? Filmy? Nevím jak by můj disk měl přispět ke kolapsu, at už bych na něm měl nepořádek jakýkoliv. Můj disk je snad jenom lokální a je jenom moje věc jestli to tam budu mít naházené nebo srovnané Nevim jak by měl takový kolaps vypadat
randomofamber [Zobrazit profil] [Poslat zprávu] - Věc pohledu na "věc" 2009-11-02 15:09:58
avatar
"TB dat na které už se v životě nepodívám a jejichž vymazáním se nic nestane je podle mého názoru tím nejlepším lékem na kolaps."

Nejhorší ze všeho je totiž rozhodnout co smazat. V daném okamžiku si můžete být jisti, že zrovna tato data nepotřebujete, ale sotva je smažete, zjistíte, že jste udělali chybu. Osobně ukládám všechna data, o kterých vím, že je po smazání už nikdy znovu nezískám. Vše co se dá znovu stáhnout nebo koupit, pak dle okolností a/nebo hodnoty mažu.
Kosheen [Zobrazit profil] [Poslat zprávu] 2009-11-02 15:13:51
avatar
tak ja mam 2x640gb disk v raid0 a vyuzite mam len polovicu dostupnej pamete. az budem mat disk plny tak si dolezite data napalim na dvd a znova bude disk prazdny. Robi mi dost problem zaplnit 1TB dat
samozrejme dbam na poriadok na hdd ako doma tak aj v praci a vzdy viem kde co mam.
Obcas robit cistky na hdd je velmi vhodne
tynyt [Zobrazit profil] [Poslat zprávu] 2009-11-02 21:59:02
avatar
RAID0? Ty svá data moc rád nemáš, co?
Kosheen [Zobrazit profil] [Poslat zprávu] 2009-11-03 07:24:17
avatar
su to disky stare max 1rok a rovnako dlho mam aj raid0, zatial bez problemov. samozrejme tie najdolezitejsie data mam zalohovane este na externom disku 120gb ktore občas aktualizujem a doplnujem. Ja by som sa toho raid0 az tak nebal ako sa o nich hovori, to skor plati pre disky starsieho veku tak 3r a viac
Ph0en1x [Zobrazit profil] [Poslat zprávu] - :) 2009-11-02 15:14:44

Hmm no co k tomu rict, snad jen format C: xD
J.C.Denton [Zobrazit profil] [Poslat zprávu] 2009-11-02 18:48:17
avatar
na cecku maji rozumny lidi jenom operacni system...tak to ti moc nepomuze
elesde [Zobrazit profil] [Poslat zprávu] 2009-11-02 19:18:52
avatar
A tiež rozumnÍ ľudia píšu spisovne. Ja osobne nič nevidím na tom, aby som musel mať 2 rôzne diskové priestory. Ja toho nesťahujem veľa kvôli ťahaniu 60kb/s, takže mi to je úprimne jedno.
Mak44 [Zobrazit profil] [Poslat zprávu] 2009-11-02 19:58:31

az ti padne ccko a nebudes vediet nabootovat tak zbadas. Je velmi velmi velmi nerozumne mat data a system na 1 particii. A je minimalne tak nerozumne mat dolezite data len na 1 disku. Takze zalohovat, zalohovat, zalohovat. A nie, ze na iny disk v danom pc
Trace4x10 [Zobrazit profil] [Poslat zprávu] 2009-11-02 20:08:44
avatar
Zalohovat, zalohovat, zalohovat. A pak se tlemit zpravam o datovym kolapsu . Ted vazne: zalohovani dat a hrozba kolapsu jsou 2 naprosto neslucitelny veci alejedny se nevyvarujem a bez druhy se neobejdem.
tynyt [Zobrazit profil] [Poslat zprávu] 2009-11-02 21:50:58
avatar
a co? Nabootuju WinPE/Linux prostředí z USB Flash, CD/DVD apod. Že si neumíš poradit ty, neznamená, že to nejde.

Tyhle nesmysly, jako že data jinam než OS, platí jen pro notorické přeinstalovávače Windows, běžný a zkušený uživatelé tohle opravdu nepotřebují. Naopak - běžnému uživateli většinou dochází na nějakém z rozdělených disků místo..
Kosheen [Zobrazit profil] [Poslat zprávu] 2009-11-03 07:26:41
avatar
kludne aj z dosu si to nakopirujes kam chces, len treba poznat tie spravne prikazy
Gang [Zobrazit profil] [Poslat zprávu] 2009-11-02 15:20:19

To je správně, ale mně spíše vadí šílená množství zbytečných dat, putujících netem.
Například, jen malo SW firem dělají patch jako opravdu malou zaplatu na velký soubor, většina posílá nový obsah celého souboru. Tak je to jednodušší. Bohužel, lidí se stárají o pohodlí, ne o budoucnost.
Superdrooper [Zobrazit profil] [Poslat zprávu] 2009-11-02 15:38:32
avatar
Snad si DD tyhle komentáře nikde dlouhodobě nezálohuje, protože by mě velice mrzelo, kdyby právě z důvodu zálohování mých zbytečných blábolů nastal ten celosvětový kolaps.
Tokamak [Zobrazit profil] [Poslat zprávu] 2009-11-02 15:53:18
avatar
Neni duvod nazyvat, bordel v souborech, nebo necitelne dvd datovy kolaps, jen takove fraze bez konkretniho vyznamu na straseni.
Martin99 [Zobrazit profil] [Poslat zprávu] - kolaps 2009-11-02 16:36:19
avatar
Nejsem si jistý, že jsem tu zprávu pochopil dobře. Mám se bát toho že bude málo místa, nebo že se v nich nevyznám? :-)
Ani jedno pro firmu či jednotlivce nevnímám jako kritické, ani jako téma pro článek.

btw. to přirovnání mnočství dat s knížkama ve vesmíru mě vždycky dostane
Raccon [Zobrazit profil] [Poslat zprávu] 2009-11-03 17:59:03

Nevím možná se nám disky zhroutí do sebe a vytvoří malou černou díru, co já vím
F3rda [Zobrazit profil] [Poslat zprávu] 2009-11-02 17:00:13
avatar
Velkej disk, hodně dat a málo místa? Promazat filmy a porno a schválně napište kolik zbylo Tipuju pár Giga fotek a jinak nic
Raccon [Zobrazit profil] [Poslat zprávu] 2009-11-02 21:26:06

Porno? Neblbni, to bych mohl vrátit disk
atomic [Zobrazit profil] [Poslat zprávu] 2009-11-02 17:29:32
avatar
nějak jsem nepochopil smysl toho článku..jasně, chápu že to má nabádat lidi k tomu aby si dělali pořádek a neschovávali si tuny zbytečných věcí..já osobně mám ve věcech pořádek, jak v životě, tak v počítači..Moji starostliví rodiče mne totiž tenkrát naučili jednu fakt praktickou věc - ten pořádek udržovat neustále, tzn. pro každou věc najít hned místo a ne to házet do šuplíku a pak třídit, v IT to znamená, že když něco stáhnu tak si to dobře pojmenuju a dám přesně na místo a kategorii, kde to najdu..ale teď zpět k mojí původní myšlence..může mi někdo osvětlit, jaký by měl tento "datový kolaps" důsledky? Spadne internet? Google nic nenajde? Všechny data zmizejí z povrchu zemského? Nebo jak tedy??
Raccon [Zobrazit profil] [Poslat zprávu] 2009-11-02 22:58:28

já nejak nepochopil jak nepořádek (který na svém disku nemám) na lokálním disku může způsobit celosvětový kolaps Data jsou snad uložené na mém disku, nikdo by k nim neměl mít přístup, tak nechápu jak mohou způsobit jakýkoliv kolaps. Teď mám 640 GB a mam na nich větší pořádek než jsem měl dříve na své 80 GB. Veškeré soubory rozdělené do kategorii, nestane se mi že bych něco nenašel. Jestli tam mám věci co nepotřebuju, komu to vadí? Mě ne.
j.matrix [Zobrazit profil] [Poslat zprávu] 2009-11-02 17:58:47
avatar
otvorim norton commander, vlavo disk C:, vpravo disk C:. Naco su mi dva disky C: ? tak som jeden zformatoval ako vidime, tento vtip ma velku pointu aj dnes
F3rda [Zobrazit profil] [Poslat zprávu] - :DDDDDDDDDDD 2009-11-02 18:25:00
avatar
Joooo DDDDDDDD IT klasika.
To mi připomnělo: Máme problém u zákazníka. Jakej? No na disku je místo jen vpravo. Cože? No píše to: "No space left on device"
Phosgore [Zobrazit profil] [Poslat zprávu] - Přidám něco z firmy 2009-11-03 04:22:37

Objemy zálohovaných dat v průběhu let tedy ve firmě (na začátku (teď 16 lidí):

2002... někde jsou pásky a diskety se zálohami
2003.....178 MB...2D
2004.....212 MB...2D
2005.....897 MB...2D + foto
2006...1,352 GB...2D + foto + 3D
2007...2,190 GB...2D + foto + 3D + rendery
2008..11,580 GB...3D, rendery rendery rendery...
2009..42,511 GB .. a to je teprv listopad ;)

mylsím, že to hezky ilustruje postup technologií....
za nárust v letech 2006 a 2007 byl víceméně zodpovědný jeden člověk co začal pořádně dělat v 3D. 2008 už nás bylo víc... a letos bylo dost práce ;)

Jinak duplicita je šílený problém. Když dělá na věci víc lidí, tak to prostě nejde a finální třídění a úklid zabere tak den.
MadMaxII [Zobrazit profil] [Poslat zprávu] 2009-11-03 10:58:09

Proto vetsina pracovnich prostredi nabizi moznosti spravy dat jako synchronizace atpdb. pro celou pracovni skupinu a vsechny data tech X lidi se davaji pod spolecny jediny project....
RadekFM [Zobrazit profil] [Poslat zprávu] 2009-11-03 07:31:18

Na kolik disku by se vesel cely internet? No, prijde na to, jestli s pornem nebo bez porna? :-)
Gang [Zobrazit profil] [Poslat zprávu] 2009-11-03 11:35:21

Teď už nejsou ty časy, kdy většina netu byla porno.
Dhatz [Zobrazit profil] [Poslat zprávu] 2009-11-03 22:32:17
avatar
to máš pravdu, to bylo ještě než začlo YT.
jardop [Zobrazit profil] [Poslat zprávu] 2009-11-03 08:44:17

a bude horsie..
MadMaxII [Zobrazit profil] [Poslat zprávu] 2009-11-03 10:52:58

Nezlob se DD ale je to PR kravina kterou jsi zbastil i s navijakem.

1. Vyrobci datovych ulozist nebreci ze nestihaji poptavku na trhu.
2. Smazat muzes vzdycky a cokoliv.

To ze nektere firmy na spravu serveru a datovych center prdi je uz jaksi vec podruzna, ale normalni firmy maji datova centra rozdelena na sekce a podle dulezitosti jsou zalohovana/nezalohovana ci po urcitych letech mazana, taktez existuji nastroje na trideni dat pred zalohama etc etc etc...

Takze ten nadpis je dost schyzofrenni a v nesouladu s realitou, kolaps ceka takove lidi maximalne srdecni(a jeste k tomu zbytecny) ale kdyz se pak podivaji na sve disky a skutecne se zamysli o co by prisli tak je to maximalne par dvdcek(fotky a filmy z dovolene resp. ze zivota atpdb.), zbytek se da vzdycky sehnat ci ozelet...
Gang [Zobrazit profil] [Poslat zprávu] 2009-11-03 11:36:43

"Smazat muzes vzdycky a cokoliv." - toto tvrzení je pravdivé jen při dodatku:"pokud tě nezajímají následky".
1. Dozvědět se, zda li informace je zbytečná, můžeš jen po přečtení. Stále kontrolovat stejné soubory, abys zjistil, zda li se stali zbytečnými, je obrovská práce.
2. Velice často informace má odkaz na další informaci, na kterou nic jiného neodkazuje. Takže abys se dozvěděl o hodnotě informace, občas ani nestačí zkontrolovat ji samotnou, musíš prohlédhout prakticky všechno, co máš.
Tento problém je naopak, o moc větší, než si myslí lidí z IT. Ale zatím samotné IT je přílíš mladé a přílíš rychle roste a mění se, aby se to pochopilo: stará informace je objemovým zlomkem v porovnání s novou a rychle zastarává.
Ale to nebude vždy. Ve všech lidskch činnostech je potřeba atkivit, spojených nejen s udržováním a tříděním staré informace, ale dokonce i se získáním ztracené staré informace. Například, existují celé firmy, které nedělají nic jiného, než hlédají staré komunikace pod zemi. Protože, bohužel, přílíš mnoho lidí si myslí, že "Smazat muzes vzdycky a cokoliv" :-)
MadMaxII [Zobrazit profil] [Poslat zprávu] 2009-11-04 08:59:37

1.Pokud budes mit predpripravenou strukturu(mimochodem na spravu dat existuji uz davno aplikace/nastroje) co kam ukladat tak kazdy clen skupiny je natolik "dospely" ze vi co kam dat a s jakymi nasledky(co chce se zalohuje, co chce se uklada x let, co chce se po roce smazne, etc.)...

2. Od toho existujou projecty pod kterymi jsou shromazdena vsechna potrebna data daneho ukolu/prace...

Ta veta "Smazat muzes vzdycky a cokoliv" byla myslena tak ze pokud jsi "dospely" tak si svoji praci(o zabave neni rec, tu si muzes stahnout/instnout znova, to same OS etc.) zalohujes(at na serveru ci danym nastrojem ci sam na externi datovou zalohu atpdb.) a pokud mas dulezita data zalohovana(zpravidla se to vejde na par DVD to co clovek vytvori rocne, ale existujou i vyjimky co "zerou" Gb napr. graficke odvetvi) tak ta veta plati......
A hlavne to byla odpoved na ten nadpis a clanek, proste zadny datovy kolaps nas neceka...
Dhatz [Zobrazit profil] [Poslat zprávu] 2009-11-03 22:28:17
avatar
u mě teda nejvíc zabírají hry, a tak aspoň mám hafo zajetých(a nemožných) které mažu když potřebuju místo na HD filmy, ale těch jsem už taky pár smazal.
Pouze registrovaní uživatelé mohou přidat komentář!