21.3. A hozzáférési idők szűk keresztmetszetei

Napjaink rendszerei szinte állandóan egyszerre több adathoz is hozzá akarnak férni. Például egy nagy forgalmú FTP vagy HTTP szerver több 100 Mbit/s sebességű kapcsolattal is csatlakozhat a világhálóhoz, amelyeken keresztül párhuzamosan többezernyi tranzakciót is folytathat, ami jelentősen meghaladja a legtöbb lemez átlagos átviteli sebességét.

A jelenleg kapható lemezek soros adatátviteli sebessége egészen 70 MB/s-ig is terjedhet, de ennek az értéknek kevés a jelentősége olyan környezetekben, ahol több, egymástól függetlenül futó program próbál egyszerre hozzáférni, hiszen ilyen esetekben csak a töredékét képesek elérni. Ilyenkor sokkal érdekesebb a lemezt kezelő alrendszer szempontjából nézni a problémát: így az egyes adatátviteli kérések terhelése lesz a meghatározó paraméter, vagyis az az idő, amit a kérés teljesítésében érintett meghajtók eltöltenek a feldolgozással.

Bármelyik kérést is vesszük, a kiszolgáláshoz a meghajtónak először a megfelelő helyre kell mozgatnia az író/olvasó fejeket, meg kell várni a fej alatt elhaladó első szektort, majd végrehajtani a megfelelő műveletet. Ezek a műveletek szétválaszthatatlanok: semmi értelme nincs megszakítani ezeket.

Tekintsünk egy átlagosnak mondható, nagyjából 10 kB méretű adatátvitelt: a legújabb nagyteljesítményű lemezek átlagosan 3,5 ms alatt képesek pozicionálni a fejeket. A leggyorsabb lemezek 15 000  fordulatot tesznek meg percenként (RPM), így az átlagos forgási késleltetés (egy fél fordulat ideje) 2 ms. 70 MB/s-os sebesség mellett az átvitel maga megközelítőleg 150 μs, ami szinte elhanyagolható a pozicionálás idejéhez képest. Ilyen esetekben a tényleges adatátviteli sebesség 1 MB/s-nél alig valamivel többre esik vissza, és tisztán látszik, hogy erősen függ az átvitt adat mennyiségétől.

A hagyományos és kézenfekvő megoldása ennek a problémának “még több cséve” használata: egyetlen nagy lemez helyett alkalmazzunk több kisebb, de azonos tárkapacitású lemezt. Mindegyik lemez képes egymástól függetlenül mozgatni a fejeiket és az adatokat, aminek köszönhetően a tényleges adatátvitel mértéke nagyjából a lemezek számával arányosan növekszik.

Az adatátvitelben bekövetkező javulás pontos aránya természetesen kisebb, mint a lemezek száma: habár az egyes meghajtók képesek párhuzamosan mozgatni az adatokat, semmilyen módon garantálhatjuk, hogy a kérések egyenletesen oszlanak el köztük. Emiatt szinte elkerülhetetlen, hogy az egyik meghajtót nagyobb terhelés érje, mint a másikat.

A lemezekre eső terhelés egyenletessége erősen függ attól, hogyan osztjuk el az adatokat a meghajtók között. Az itt használt példában a lemezen tárolt adatokat egy könyv oldalaiként érdemes elképzelni, vagyis rengeteg szám szerint címezhető adatszektorként. A virtuális lemezt ennek megfelelően a legegyszerűbben úgy tudjuk felosztani az egymás után következő független fizikai lemezek mérete szerint és így használni, mintha egy nagy könyvet kisebb részekre téptünk volna. Ezt a módszert nevezik összefűzésnek, és előnye, hogy a résztvevő lemezeknek nem kell azonos méretűeknek lenniük. Ez a megoldás remekül működik abban az esetben, amikor a virtuális lemez hozzáférései egyenletesen oszlanak el annak teljes területén. Amikor viszont az elérés csak egy kisebb területre korlátozódik, kevesebb javulás tapasztalható. A 21-1 Ábra mutatja be lemezek egy ilyen összefűzött konfigurációját.

Ábra 21-1. Az összefűzött szervezési mód

Feloszthatjuk a virtuális lemezünket kisebb azonos méretű darabokra is, melyeket különböző eszközökön sorosan tárolunk el. Például az első 256 szektort eltároljuk az első lemezen, majd a következő 256 szektort a következő lemezen és így tovább. Az utolsó lemez kitöltése után az egész folyamat ismétlődik, egészen az összes lemez megtöltéséig. Ezt a leképezést csíkozásnak (“striping”) vagy RAID-0-nak nevezzük [1]. A csíkozás használata során valamivel bonyolultabbá válik az adatok megtalálása és többletmunkát is jelenthet olyan esetekben, amikor az adatátvitel több lemezt is érint, de ezzel egyidőben sokkal jobban szétosztja a terhelést a lemezek között. A 21-2 Ábra mutatja be a lemezek csíkozott szervezését.

Ábra 21-2. A csíkozott szervezési mód

Megjegyzések

[1]

A RAID jelentése: Olcsó lemezek hibatűrő tömbje (Redundant Array of Inexpensive Disks). Különféle típusú hibatűrési megoldásokat vonultat fel, habár az eredeti elnevezés félrevezető lehet, mivel redundanciát nem tartalmaz.

Ha kérdése van a FreeBSD-vel kapcsolatban, a következő címre írhat (angolul): <freebsd-questions@FreeBSD.org>.
Ha ezzel a dokumentummal kapcsolatban van kérdése, kérjük erre a címre írjon: <gabor@FreeBSD.org>.