Jak se zachraňují data z poškozených disků [rozhovor]

Pevným diskům svěřujeme cenné osobní vzpomínky nebo důležitá firemní data, na zálohu se přitom často zapomene, nebo selže. V případě poruchy ale ještě není vše ztraceno.

Jak z útrob nefunkčního pevného disku dostat data? Na to jsme se zeptali odborníka z branže, Štěpána Mikeše. Je spolumajitelem firmy DataHelp, která se už patnáct let zabývá záchranou dat z pevných disků, polí RAID, SSD či jiných datových nosičů.

Co obnáší obnova dat z pevných disků? Co je k tomu potřeba?

Tenhle obor je hlavně o tom, jaké máte know-how, zkušenosti, znalosti konstrukce, fungování disků, šifrování a schopnosti přečtená data správně poskládat dohromady. Vybavení a technologie představují důležitý základ, ale i přes nejlepší nástroje a pomůcky jsou ale pořád největší devizou naše hlavy a ruce, protože každý problém i disk je jedinečný, individuální a neexistují univerzální funkční postupy na všechny problémy.

To bezesporu, ale zkusme se konkrétněji zaměřit právě na ty technologie. Používáte například nějaké unikátní nástroje?

Máme například svá vlastní hardwarová řešení, která jsme si nechali dělat na míru nebo i vyvinuli sami. Například různé stahováky ploten, když jsou zaseklá ložiska. Plotny disku se při manipulaci nesmíme dotknout, došlo by k fyzickému poškození nebo znečištění místa dotyku, což při dnešní extrémní hustotě zápisu dat znamená poničení obrovského množství uložených dat. Máme také vyvinutou unikátní technologii, díky které jsme schopni jako jedna z mála firem v republice řešit zadřená vyosená ložiska u většiny výrobců disků.

Datahelp2.jpg
Tady se zachraňují data. Nečekejte klišé v podobě prostředí jak z operačního sálu, dolování dat z disku je v podstatě technický a softwarový hacking

To bychom měli rozebrání disku. Ale jak zjistit strukturu zápisu a dostat z ploten nefunkčního disku kýžená data?

Využíváme jedno velice šikovné zařízení, které nám umožňuje hardwarovou diagnostiku a nastavení základních parametrů disků. S jeho pomocí se dají u většiny výrobců disků „hacknout“ servisní data, tedy místa, kde jsou uložena základní nastavení disku.

Tím se ale ještě k uživatelským datům na disku nedostanete…

Ale jsme o krok blíž. Umíme na bázi reverzního inženýrství upravit základní parametry disku. Zásadní pro další postup záchrany je vždy umět přečíst z plotny její charakteristiku, která je uložena v servisní oblasti. Je to část firmwaru disku. Najdou se v něm nastavení, která jsou pro mnoho disků stejná. Potom ale také informace, které jsou model od modelu jiné. A hlavně žádná plotna není z výroby stejná, bezchybná. Z toho důvodu dnes existují disky, které mají osazené například jen některé hlavy, protože ne všechny plotny disku z výroby splní kvalitativní parametry. Tak se prostě nepoužijí. A ten firmware s tím musí počítat.

K tomu, aby to vše správně fungovalo, je pak potřeba kalibrace a nastavení obcházení známých chyb z výroby. Když člověk zapne disk a nic na něj ještě nezapisuje nebo nečte, tak mezitím už proběhlo značné množství procesů a činností. Pokud nějaký z těch procesů neproběhne korektně, nastupují automatické opravné mechanizmy. Pokud selžou i ty, disk se pokusí o načtení nezbytných dat znovu. To je pak ono známé cvakání.

A když máte konkrétní firmware, tak už víte, jak z dané plotny číst data. Jasné. Ale než přijde na řadu obnova, předchází tomu nějaká porucha disku. Co je nejčastěji způsobuje?

Hodně často se nyní stává, že odejde jedna ze čtecích hlav disku. Disk cvaká, plotny se točí, ale k datům už se člověk nedostane. Tyto poruchy souvisí s neustále se zvyšující hustotou zápisu disků.

Datahelp media.jpg
Zachraňovat data se dá z ledasčeho, nejen z pevných disků

Pokud je vadná jen čtecí hlava, tak ji stačí vyměnit, a disk může fungovat dál, nebo ne?

I kdyby se třeba ty vadné hlavy někde podařilo vyměnit, tak to stejně nemusí fungovat, protože čtecí hlavy jsou svázané s konkrétním firmwarem a hlavně s konkrétní plotnou disku. Kalibrace a nastavení předzesilovačů čtecích hlav se provádí v závislosti na parametrech konkrétní plotny. Jsme rychle schopni zjistit, jestli je disk funkční nebo ne. Problém těch řídících elektronik ale někdy je, že odcházejí součástky, které nezpůsobují úplnou, ale jen částečnou nefunkčnost. Chyba se tak třeba projeví až po zahřátí, nebo disk čte, ale pomalu, a různé další věci. Tyto poruchy většinou způsobují nedestruktivní poškození, tzn., že ten disk nemusíme nějak složitě diagnostikovat a napravovat a data se dají snadno zachránit. A když je ten disk těžce poškozený, tak jsme schopni přečíst jen vybrané povrchy ploten. To se pak disk otevře a čtou se plotny napřímo. Pak jsme schopni z toho poskládat obraz disku.

Kompletní? To se asi pokaždé nepovede…

Vždy se snažíme zákazníkovi předat 100% bitovou kopii. To je ideální případ, zákazník pak nový disk s uloženými daty vrátí do počítače a může fungovat jako před havárií. Pokud je ovšem některý z povrchů ploten částečně nebo úplně vadný, čteme maximum toho, co jde. Problém je, že hlavy se střídají po pár kilobitech. V některých případech tedy dostaneme neúplný binární obraz disku, ze kterého musíme teprve požadovaná dat vydolovat. Ta se pak musí dále analyzovat a rozlišit soubory, které obsahují nečitelné bloky a ty, které jsou bezvadné. To je jedna z výhod námi používané technologie. Je k vadné plotně velmi šetrná. Jsme schopni vyčíst maximum možného i z disků, kde je některý povrch zcela zničený. Nevýhodou je, že je u takto poškozených disků často nenávratně ztracená adresářová struktura, ale například u fotek se to dá dále třídit dle metadat.

Dokážete dopředu určit, zda nebo co jde z disku zachránit?

Ano, provedeme diagnostiku disku a jsme schopni číst jen ty povrchy, které jsou zachranitelné. Např. máme často případy, že disk někde upadne a poškodí se čtecí hlavy. Majitel to pak doma zapíná a disk trápí, čímž velice často poškozené čtecí hlavy poškrábou povrch některých ploten. My to zjistíme a jsme schopni si pak selektivně číst jen ty plotny, které nejsou poškozené a teprve následně obraz disku doplnit daty z více poškozených částí, pokud se je podaří přečíst.

Častější tedy bývají poruchy čtecích hlav, ale co když se poškodí plotna?

Zásadou číslo jedna je stav disku a ploten při záchranných operacích nezhoršit. Riziko dalšího poškození je přitom u vadných ploten značné už při prvním načtení daného místa čtecí hlavou. Natož opakovaně, což je její standardní chování třeba v souborovém systému Windows. Díky tomu, že naší technologií lineárního čtení plotny čtecí zařízení nemusí dané místo vícekrát opakovaně přejíždět, riziko zhoršení stavu poškozeného místa výrazně snižujeme.

Disk.jpg
Seznamte se: plotna

Jaká je situace u diskových polí RAID? Ta většinou člověk nemá běžně doma, ale běží na nich spíš firemní data, servery atd. Jsou tam nějaká specifika?

Řešili jsme nedávno třeba situaci, kdy se výrobní firmě z důvodů selhání diskového pole řídicího systému zastavila celá výrobní linka. Jak jsme na místě zjistili, záloha dat probíhala správně, ale po havárii nebyl k dispozici záložní server s nakonfigurovaným systémem. A nastal problém, protože to původní diskové pole konfiguroval kdysi jeden odborník, který už ale z firmy před 10 lety odešel. Od té doby se vše ohledně nastavení dávno zapomnělo. Při rekonstrukci a zjišťování důležitých dat nikdo ve firmě samozřejmě nevěděl, co tam a jak nastavil. Tento scénář bohužel není zdaleka jediný, který jsme řešili. Následná rekonstrukce a obnova dat pole se výrazně zkomplikovala nejen časově, ale měla také výrazný finanční dopad. Rozhodně tedy doporučujeme mít technické detaily nastavení diskového pole dobře zdokumentované.

Jak dlouho obnova/záchrana dat z diskového pole trvá?

Zde asi není jednoznačná odpověď. Může to být hodina, mohou to být i dny. Někdy se to dá urychlit i vývojem záchranného procesu – např. se nám nedávno podařilo přijít na to, jakým způsobem efektivněji řešit maléry u diskových polí SAS disků v serverech od HP. Už jsme to uměli řešit dřív, nyní jsme ale přišli na fígl, který celkový postup dost urychlí. Dříve byla běžná doba opravy okolo 24 hodin, teď jsme schopni vše udělat za 12 hodin. Záleží samozřejmě na velikosti pole a počtu disků v poli, celkově jde ale o značné urychlení procesu, a to je pro firmy moc velká pomoc. V situaci, kdy se jim v továrně zastaví výroba, nebo přestane prodávat e-shop a ztráta se zvětšuje každou minutu, je rychlý a přesný zásah k nezaplacení.

Disky 1.jpg Disky 2.jpg
O práci není nouze...

Má s ohledem na eliminaci výskytu chyby smysl hledět na kapacitu disku?

Záleží vždy na způsobu využití a práce s diskem. Ale nemá například smysl pořizovat zbytečně vysokou kapacitu disku. Velký disk, který je málo zaplněný, má data uskupená jen na okraji plotny, kde je obvodová rychlost největší. Když si představíte velikost té trochy dat v poměru k celku, tak se bavíme jen o pár milimetrech využité záznamové plochy na plotně, po které čtecí hlava v těch nejvyšších rychlostech neustále dokola přejíždí. V disku není vakuum, je v něm vzduch, a i když čtecí hlava nad plotnou levituje, tak tam přeci jenom dochází k určitému tření a zahřívání. To po čase vede k degradaci povrchu plotny a začnou se objevovat poruchy. V lepším případě jen např. zvětšený výskyt vadných sektorů v těchto místech, v horším případě pak dochází k těžším závadám, například ke ztrátám kalibračních stop, které disk využívá k navigaci hlav nebo k fyzickému poškození plotem.

Jak moc je záchrana dat rutina?

Individuální přístup je poměrně častý jev a nadále bude. Disk si v každém počítači žije svým specifickým životem a je s ním jinak zacházeno. A technologie disků, byť všechny zvnějšku vypadají podobně, je model od modelu odlišná a vyvíjí se překotným tempem. Nedávno jsme se třeba museli naučit řešit unikátní problém u externích disků WD. Ty jsou teď velmi populární, takže k nám začínají poruchy chodit častěji. Výrobce u těchto disků zašifroval servisní data. Abychom se k těmto důležitým datům pro následnou záchranu mohli dostat, museli jsme se tuto ochranu naučit obejít. Ten disk má hodně ploten a čtecích hlav, které musíme při záchraně dat ovládnout a přimět používat tak, jak potřebujeme.

Diskuze (25) Další článek: Gigabyte uvádí nový desetipalcový tablet s Atomem a Windows 8.1

Témata článku: , , , , , , , , , , , , , , , , , , , , , , , ,