6. Az újraírható MiniDisc rendszer


6.1 Bevezetés

A MiniDisc rendszert azzal a nyilvánvaló céllal tervezték, hogy felváltsa a hagyományos kompakt kazettás rendszert. A MiniDisc formátum két különböző típusú hordozóréteget definiál. Az egyik egy írható magneto-optikai lemez otthoni felvétel készítésre, a másik egy hagyományos csak olvasható lemez zene és szoftver publikáció céljára.

1992 -ben mutatták be a MiniDisc rendszert a fogyasztói piacon, mint egy új digitális hang lejátszó- és rögzítő rendszert. Ez csupán tíz évvel követte a Compact Disc (CD) bemutatását. Köztudott, hogy a CD a hagyományos bakelit lemezeket váltotta fel a hanglemez piacon. A CD technológia 16 bites kvantálásra és 44,1 kHz -en mintavételezett digitális hangrögzítésre épül. A CD hangminősége nagy előrelépést jelentett bámely más hétköznapi felvevő rendszerhez hasonlítva.
A CD elterjedése előtt sok mérnök a CD kifejlődését csupán a jobb hangminőségnek tuajdonította, de a CD lejátszó piacra dobása után kiderült, hogy a fogyasztónak nagy értékké vált az optikai lemezes rendszer gyors, véletlenszerű elérés módja Ezen kívül a 12 cm -es lemezt könnyebb volt kezelni az LP -hez képest. Mind a lejátszó és a hordozó hosszabb élettartama erősen hozzájárult a CD formátum elfogadásához. A fejlesztés következő célpontja nyilvánvalóan az újraírható CD volt. A Sony és a Philips együtt dolgoztak ezen a rendszeren és 1989 -ben technikai valósággá tették. Két különböző CD rendszer alakult ki: az egyszer írható CD-R és az újraírható CD-MO.
Az audio kazetták eladási aránya csökkent 1989 óta és a Sony érezte, hogy az audio kazetta, mint hangrögzítő fomátum életének végéhez közelít. Ha el is fogadta volna a fogyasztói társadalom az írható CD -t, még akkor is bonyolult lett volna betörni a hordozható készülékek piacára. Itt ugyanis a kompakt kazettás rendszerek uralkodtak az erős rázkódás állóságuknak és kis méretüknek köszönhetően. Egy új, lemezes rendszer kialakításának egyértelmű célja ezen gyengeségek kiküszöbölése volt. A Sonynak sikerült ezt megvalósítania a MiniDisc-el (MD).
Magneto-optikai lemezes adattároló rendszereket pár éve már használtak számítógépes rendszerekben. Erre a technológiára alapozva kifejlesztettek egy közvetlenül felülírható rendszert ugyanakkora kapacitással, mint egy CD. Ezen kívül rázkódás álló memóriát alkalmaznak a hordozhatóság érdekében és egy digitális hang tömörítő eljárást használnak - amit ATRAC -nak hívnak (Adaptive TRansform Acoustic Coding) - aminek köszönhetően 64 mm -re csökkenthető a lemez átmérője. A félvezető elemek gyors technológiai fejlődése segített ennek megvalósításában.
A CD-ROM megvalósításához hasonlóan az MD Adat rendszer is az audio MD -re épül. A 140 Mbyte -os kapacitás és a célorientált file struktúra új lehetőségeket nyújt az MD adat lemezek különböző számítógépes konfigurációkba illesztésére. A MiniDisc rendszer szabvány leírását az ún. "Szivárvány könyv" tartalmazza (Rainbow Book).

6.2. Rendszer konfiguráció

A kis házméretet a könnyű kezelhetőség és a lemez védelme érdekében alkalmazták. A ház fizikai méretei: 72 mm (sz), 68 mm (d), 5 mm (m), mely részletes tanulmányok eredménye. Két különböző típusú hordozó réteg és három féle lemez létezik. Az egyik a CD -hez hasonló szokványos lemez, amely aluminium fényvisszaverő réteggel és beleégetett jel mintázattal (pitek) rendelkezik. A második típus az írható lemez, amely széles barázdákkal bevont magneto-optikai hordozó réteggel rendelkezik. A harmadik típusú lemezen van előre égetett és írható réteg is. A barázdákat egy 22,05 kHz -es vivő modulálja, amit pedig a cím adat modulál. Ez az előmodulációs eljárás elősegíti a helyes sávkövetést, a kerületi sebesség állandó értéken tartását és a hozzáférés vezérlését felvételkor. A 42. ábrán láthatók az MD lemezek típusai. Minden MD rendszernek képesnek kell lennie ezt a három típusú lemezt lejátszani. Ez azt jelenti, hogy az MD felvevő/lejátszó két funkciós optikai pick-up-al van felszerelve az előre rögzített bit mintázat és a magneto-optikai lemez olvasásához.

Az MD lemez hordozója fröccsöntési eljárásokkal készül. Így viszonylag egyszerűen kialakítható egy optimális illesztő terület, ami a lemez precíz betöltését, illetve rögzítését biztosítja. A 43. ábrán látható a lemez házba helyezett hordozófelületének keresztmetszeti rajza. Az optikai lemezt centralizálni kell miután a meghajtóba kerül. Mint a CD -nél, itt is a polykarbonát hordozó belső kerületét használják erre, mint referenciát. Az egyszerű acélból készült alátét durván pozícionálódik a beállító terület szemközti oldalára, hogy pontos beállítást és centralizációt biztosítson. Ez az egyszerű eljárás csökkentheti a polykarbonát lemez középponti részeinek mechanikai igénybevételét is. Ily módon segít elkerülni a kettős optikai törést is a polykarbonát hordozón.

A házon található egy porvédő zár. A gyári (műsoros) MD-n ez a zár csak az alsó részen van, míg az írható MD -nek mindkét oldalán található (44. ábra). Ez az egyszerű ház és lemez felépítés olcsóvá teszi a gyártást. Ez pedig elengedhetetlen, ha zene rögzítésre, vagy szoftver kiadásokra akarjuk használni.
Az optikai paraméterei az MD lemeznek (laser hullámhossz, track pitch, az optikai pick up numerikus aperturája (NA), stb.) majdnem ugyanazok, mint a CD -nél (10. táblázat).
6.3. Mágneses-mező modulációs felülírás (Magnetic-Field Modulation Overwriting)

Egy másik rendszerben (a laser modulációs rendszerben) - ami a mágneses-mező moduláció mellett használt - a jelet a félvezető laser teljesítmény szintjének változtatásával rögzítik. A kétféle domén közül csak az egyiket használják. A terület amit a laser megvilágít 1 -es lesz, ahol nem rögzítünk semmit 0 lesz. A felvett mintázat asszimetrikus lesz. Ezen kívül még egy probléma merül fel a laser modulációval kapcsolatban: érzékeny a felvételi teljesítmény ingadozásaira. Amikor a felvételi teljesítmény ingadozik a bitek kezdő- és vég pozíciója könnyen eltorzulhat, így a mintázat hossza változó lesz.
A felvevő/lejátszó MiniDisc -ek a digitális jeleket magneto-optikai úton rögzítik a mágneses-mező moduláció rendszer segítségével. Ezt a rendszert az újraírható CD technológia alapján alkalmazták. Az optikai fej és a lemezhez érő mágneses fej egymással szemközt helyezkednek el a lemez két oldalán, közrefogva azt (45. ábra). Mágneses-mező moduláció esetén egy félvezető laser folyamatosan megvilágítja a felületet, mintegy 4,5 mW teljesítménnyel. Amikor a fénypont a lemezre esik, a felszíni réteg hőmérséklete kb. a Curie pontig emelkedik (kb. 180 °C). Amint a fénypont továbbhalad a réteg hőmérséklete csökkenni kezd. Ez a folyamat állandóan ismétlődik. Amikor N (É) vagy S (D) mágneses mezőbe kerül a pont amit a laser besugárzott egy-egy 1-t vagy 0 -t rögzít a rendszer a Curie hőmérséklet izotermáját határvonalként használva. Így a rögzített 1-es vagy 0 alakja és hossza meghatározott (46. ábra). Ha a mágneses mező elég gyorsan változik, lehetségessé válik, hogy 0,3 ěm -es osztással írjunk egy pitbe, még akár egy 780 nm -es hullámhosszúságú fénysugár és 0,45 NA -s lencse kombinációjával is. Továbbá az "1" és a "0" területek szimmetrikusak lesznek, ami a mágneses-mező moduláció jellemzője.
A mágneses-mező modulációnak még egy nagy előnye, hogy rendkívül ellenálló a lemez dőléssel szemben. Amikor a lemez meghajlik, a fénypont eltorzul. A laser moduláció esetében a felvett bitmintának az alakját a fénypont szabja meg. A torzulás elég jelentős lehet. A mágneses-mező moduláció során a lasert a magneto-optikus réteg hőmérsékletének növelésére használják és nem befolyásolja a felvett bitmintázat alakját. Így ha felvétel közben a lemez megdől, vagy elhajlik kisebb lesz a torzulás.
A 47. és a 48. ábrán láthatók egy kísérlet eredményei. A 47. ábra a hibás blokkok arányának ingadozását mutatja a lemez dőlésének függvényében felvételkor és lejátszáskor. A lemez akár +/- 1,5 fokkal is megdőlhet a barázdák irányában, a blokk hibaarány még akkor is majdnem stabil marad, mindaddig, míg olvasáskor is meg nem dől a lemez. A 48. ábrán látható a mérés eredménye sugár irányú dőlés esetén. Nagyon hasonlóak a párhuzamos dőlésnél mért értékekhez.
 




Amint azt már elmondtuk számos előnye van a mágneses-mező modulációnak. Ezeknek a tulajdonságoknak köszönhető a tömegtermelésben készülő MD rendszerek nagy megbízhatósága felvételkor és lejátszáskor, habár bonyolultnak tűnik a mágneses fej elkészítése. Egy a lemezzel érintkező író fej alkalmazása viszonylag egyszerű megoldás. Az MD lemez felső részét be kell vonni egy vékony védőréteggel, ami megvédi a hordozó réteget a környezeti hatásoktól és ezzel a réteggel beállítható a súrlódási erő a megfelelő értékre. Így, ha az író fej csak durván érintkezik is ezzel a réteggel, akkor is megfelelő nagyságú mágneses mezőt hoz létre. Rendkívül megbízható ez a módszer, akár milliószor is körbefordulhat a lemez. Lényeges, hogy a fej meghajtó árama elég kicsi ahhoz, hogy telepről működjön.

6.4. Adat struktúra

Az előre elkészített és az írható MD rögzített jele nagyon hasonlít a CD -nél alkalmazotthoz. EFM -et (Eight-to-Fourteen Modulation) és CIRC -t (Cross Interleaved Reed-Solomon Code) alkalmaznak. Mint ismeretes, az EFM és a CIRC kombinációja potenciális hibajavítási lehetőségeket és nagy adatsűrűséget eredményez. A "csupasz" CD lemez is hosszú távon képes az adatok biztonságos tárolására. Így, ha a lemezt egy tokba helyezzük, elvárható a megbízhatóság növekedése. Ez erősen befolyásolta a tervezőket, hogy ugyanezt a rendszert használják.

Az audio CD -től eltérően kissé megváltoztatták a CIRC szekvenciákat egy olyan keret formátumra, ami alkalmas az egyes audio szekvenciák közti szünetek és a folyamatos adat szekvenciák kezelésére is. A neve: ACIRC (Advanced CIRC).
A MD rendszer csoportokba rendezve rögzített, tömörített audio adatot használ. A blokk formátuma nagyon hasonló a CD-ROM mode-2 -höz. A CD-ROM esetében a blokk cím alapja a CD subcode címe, így a fizikai cím amit használunk a játékidőn alapszik. A CD és a CD-ROM perceket, másodperceket és kereteket használ. Az MD-nél felváltották az idő alapú címzést a bináris kód alapúval, ami keret (blokk) egységeken alapszik. Egy ilyen egységet (keret, blokk) szektornak nevezünk. A hosszú ACIRC hibajavító kód miatt három szektort "bekötő" szektorként kell használni. Ha a felhasználó megváltoztat, vagy új adatokat rögzít az MD lemezre, két vagy három szektort kell rögzíteni az új adat kezdő és vég pozíciójánál.
A rögzítendő adat hossza változó, ami problémát okoz a címzés szempontjából, ezért bevezették a cluster (csoport) fogalmát, ami meghatározza a rögzítendő, vagy felülírandó adat minimumát. Egy cluster 36 szektorból áll. Ebből 32 szektort használnak az információ tárolására, a további négyet pedig az adatok összekötésére (linking - feladatuk a CD-nél alkalmazott mergin bitekéhez hasonló), illetve plusz információk rögzítésére (49. ábra). Feljebb elmondtuk, hogy a hordozó előkészítését (pregroove) a 22,05 kHz -es vivő végzi, amit a cím adat modulál. A cím a szektor és a cluster számmal egyezik meg. A meghajtó egység bármely írási és olvasási folyamat közben megtalálja a helyes címet a modulált hordozó segítségével.
Az információ hordozó felület belső részén található a tartalomjegyzék (TOC = Table Of Contents), amit előre égetett felületen rögzítenek (gyárilag). Néhány szektor a lemez azonosítását, illetve az adott lemez típushoz tartozó plusz információkat tartalmazza. Az írható MD lemezen a TOC -ban található néhány olyan paraméter is, amit felvétel készítéskor használnak (optimális felvevő teljesítmény, a felhasználói terület kezdő és vég címe, stb.). A gyári MD TOC -ja tartalmazza a sáv felosztás táblázatát (track allocation table), a track -ek nevének táblázatát, a felvétel dátumát, stb. A track felosztás táblázatnak van egy része, ami a zeneszámok kezdő és vég címére mutat a program területen. A track név, és dátum táblázat opció. A felhasználói tartalomjegyzéket (UTOC = User TOC) felvétel készítés, vagy szerkesztés után rögzítik a lemezre. A UTOC track felosztás táblázata ugyanúgy kezeli a program területeket. Maximum 255 zeneszámot definiál a track felosztás táblázat, plusz lehetőség nyílik a feldarabolt track -ek összekötésére, folyamatosként feltüntetve azokat. A rázkódásálló memória alkalmazásával az MD képes automatikusan összefűzni a szétdarabolt részeket. Így az MD rendszer könnyü és megbízható működést biztosít.

6.5. Rázkódás védelmi memória

Egy hagyományos optikai lemezes rendszer könnyen hibázhat, ha rázkódás, vagy ütés éri. Emiatt sokáig úgy gondolták, hogy a mágnesszalagos média a legjobb megoldás kültéri használatra. Bár az autókba szerelhető CD lejátszókat mechanikai felfüggesztéssel védik a rázkódástól, a hordozható berendezésekben - mint a Walkman - bonyolult mechanikai védelmet alkalmazni, mert túl sok helyet foglal. Így más megoldást kellett találni.

Tapasztalatból tudjuk, hogy az ütések és a rázkódások nem folyamatosak. Ezért a MiniDisc rendszer egy az optikai pick-up és az ATRAC kódoló közé helyezett félvezető memóriát használ adat pufferelésre. Egy 4 Mbit -es memóriában kb. 12 másodpercnyi tömörített hanganyag tárolható. Amikor az optikai pick-up elkezdi olvasni az adatokat a lemezről, néhány másodpercnél kevesebb idő alatt feltöltődik a memória, mert az optikai olvasás és az ATRAC dekóder között ötszörös bitsebességbeli különbség van. Így normál lejátszáskor az optikai pick-up szakaszosan olvassa az adatot a lemezről, hogy folyamatosan feltöltve tartsa a memóriát. Ha a pick-up kiesik a pozíciójából ütés/rázkódás miatt és az adatfolyam megszakad, az adatokat a dekóder továbbra is olvashatja a memóriából így biztosítva a folyamatos lejátszást még 12 s-ig. Amint a pick-up visszanyeri a pozícióját, újra feltölti a memóriát. Mivel a lemez egész területén kb. 13,3 ms -ként találhatók cím információk, a pick-up általában 1 s alatt visszanyeri a pozícióját (50. ábra). Mostanában a CD lejátszó gyártók is alkalmaznak egy majdnem ugyanilyen módszert. Így ez az optikai lemezes rendszer már megfelel kültéri használatra.

6.6. MD-adat szabvány

Az audio MiniDisc szabványra épülő MD-adat szabványt 1993 -ban fejlesztették ki. Az MD-adat lemez és a kulcsfontosságú alkatrészek (optikai pick-up és LSI chipek) majdnem ugyanazok, mint az audio MD rendszernél. Így általában ugyanaz az infrastruktúrája az MD-adat lemez gyártásának is, mint az audio MD lemezé. Tulajdonképp hasonlít a CD-ROM előállítási folyamatához. Az MD-adat lemeznek kb.140 Mbyte a kapacitása (51. ábra). A különböző lemeztípusoknak (csak olvasható, írható és hibrid lemez) és a kis méretnek köszönhetően az MD-adat rendszer a jövő adathordozója és publikációs médiája lehet. Annak ellenére, hogy az audio és az adat MD jellemzői nagyon hasonlóak, az audio MD fizikai jellemzőit továbbfejlesztették. Lényeges, hogy az audio vásárló ne keverje össze a két lemeztípust. Emiatt az adat lemez házának alakja eltérő (51. ábra). Szükség volt a jobb adatminőség és a magasabb adatátviteli sebesség biztosítására, ezért egyes jellemzők megváltoztak, hogy megfeleljenek a kívánalmaknak. Plusz az MD célorientált file struktúrával rendelkezik, ami különböző platformokon futó alkalmazásokat támogat.

Az adat lemez file struktúráját és terjedelmét úgy tervezték, hogy megbírkózzon az MD fizikai korlátjaival. Az adat sávot - ugyanúgy, mint az audio lemeznél - a TOC -ban és a UTOC -ban definiálják. Az első cluster a boot cluster, a további 16 pedig a VMA (Volume Management Area) -t tartalmazza, amiben az összes file és könyvtár kezelési információ található. A VMA fizikailag középen helyezkedik el és általában egy félvezető memóriával cache -elik, a hozzáférések illetve az újraírások száma minimális. Továbbá meggondolva, hogy a cluster egy minimális egységet jelent, az adat lemez file struktúrája 2 - 64 kbyte -ig terjedő méretű blokkokat képes kezelni. A blokkméretet automatikusan választja ki a rendszer a felhasználó által használt alkalmazásoknak megfelelően. A file rendszer támogatja a hierarhikus könyvtárszerkezetet, rövid- és hosszú file neveket, plusz információkat, stb., így könnyen csatolható különféle gazdarendszerekhez, illetve lehetővé teszi az adatcserét a különböző rendszerek közt (10. táblázat).
 
 
10. táblázat: a MiniDisc rendszer paraméterei
Fő paraméterek
Audio MD
Adat MD
Kapacitás
Max. 74 perc
140 Mb
Cartridge méret
68(d) x 72(sz) x 5(m) mm
A diszk jellemzői
 
Átmérő
64 mm
Vastagság
1,2 mm
A középső lyukátmérő
11 mm
A programterület kezdetének átmérője
32 mm
A bevezető rész kezdetének átmérője
Max. 29 mm
Pit nagyság
1,6 mm
Kerületi sebesség
1,2 - 1,4 m/s
1,2, vagy 2,4 m/s
Optikai paraméterek
 
A laser hullámhossza
780 nm
Lencse NA
0,45
Laser teljesítmény rögzítéskor
2,5 - 5 mW
Rögzítési eljárás
Mágneses-mező moduláció
Átalános audio jellemzők
 
Csatornák száma
Sztereo/mono
Frekvencia tartomány
5 Hz - 20 kHz
Dinamika
105 dB
Nyávogás, lebegés
Quartz precízség
Jelformátum / adatstruktúra
 
Mintavételezési frekvencia
44,1 kHz
 
Tömörítés
ATRAC
 
Moduláció
EFM
Hibajavító eljárás
ACIRC
Szektor méret  
2048, vagy 2336 byte
Cluster méret  
32 szektor
Maximális cluster szám  
kb. 2200
Maximális szektor szám  
kb. 70000
Blokkméret  
2 kbyte - 64 kbyte

6.7. ATRAC: Adaptive Transform Acoustic Coding (Alkalmazkodó Leképezésű Akusztikus Kódolás)

A lecsökkent tárolókapacitás ellenére szükséges volt, hogy a MD jó hangminőséget adjon és 74 perces játékidővel rendelkezzen. Ezért az ATRAC -ot úgy tervezték, hogy megfeleljen a következő követelményeknek: a 16 bites, 44,1 kHz -es sztereo audio jelet kevesebb, mint 1/5 -ére tömörítse össze a hangminőség minimális romlása mellett. Hordozható készülékekben is alkalmazható egyszerű és olcsó hardverrel is megoldható legyen a kódolás és a dekódolás.

A digitális audio jel tömörítésekor bizonyos mennyiségű zaj adódik a jelhez. A legtöbb audio kódolási eljárásnak az az alapelve, hogy az ilyen zaj idő- és frekvencia tartománybeli eloszlását úgy kezeljék, hogy az hallhatatlan legyen az emberi fül számára. Ha ez sikeres, akkor az ilyen módon előállított jel megkülönböztethetetlen lesz az eredetitől.
Az audio kódoló rendszerek általában úgy működnek, hogy felosztják a jelet különböző idő- és frekvenciatartománybeli egységekre. Ezt a felosztást használva a jelet a pszihoakusztikai törvényszerűségeknek megfelelően elemzik. Az elemzés során kimutatható, hogy mely egységek a kritikusak és ezért nagy pontossággal kódolandók, és mely egységek kevésbé jelentősek és így elviselnek némi kvantálási zajt a kívánt hangminőség romlása nékül. Erre az információra alapozva rendelik az elérhető biteket az egyes egységekhez. A spektrális összetevőket ezután kvantálják ezeknek a biteknek a felhasználásával. A dekóderben a kvantált spektrumot visszaalakítják a bit kiosztásnak megfelelően és ezután audio jellé szintetizálják.
Az ATRAC rendszer is a fentieknek megfelelően - csak számos kiegészítéssel - működik. A pszihoakusztikus jellemzőket ugyanis nem csak a bit kiosztás során használja, hanem az idő- és a frekvencia tartomány felosztásakor is. A bemeneti jelet nem azonos frekvencia osztásokban analizálják, és így kiemelik a fontos, alacsony frekvenciás összetevőket. Ezen kívül változó hosszúságú blokkokat használnak, ami a bemeneti jelhez igazodik. Így a statikus részek is hatékonyan kódolhatók és az átmeneti, gyorsan változó részekre nem pazarolják az időbeli felbontást.
Elsőként az ATRAC kódolót vizsgáljuk meg az idő- és frekvencia tartománybeli felosztás, a spektrális összetevők kvantálása és a bit kiosztás alapján, majd az ATRAC dekódert mutatjuk be.

6.7.1 Az ATRAC kódoló
Az 52. ábrán látható a kódoló blokkdiagrammja. A kódoló három részből áll. Az analízis rész spektrális összetevőire bontja a jelet, amelyeket csoportokba (BFU = Block Floating Unit) rendeznek. A bit allokáció rész elosztja a rendelkezésre álló biteket az egyes BFU -k között, kevesebb bitet osztva a kisebb jelentőségű csoportoknak. A kvantálás rész kvantálja az egyes spektrális összetevőket a meghatározott szóhosszúságra.
 



Idő - frekvencia analízis

Ez a rész generálja a BFU -kat három lépésben, az alsáv- és az átviteli kódolás segítségével.(53. ábra). Először a jelet felosztják három alsávra: 0-5,5 kHz, 5,5-11 kHz és 11-22 kHz. A kritikus frekvenciasávok listáját a 11. táblázat tartalmazza. Ezután minden egyes alsávot áttranszformálnak a frekvencia tartományba, így létrehozva a spektrális összetevőket. Végül ezeket a spektrális össztevőket nem azonos méretű csoportokba - a BFU -kba - fogják.

 
11. táblázat: az ATRAC által használt kritikus frekvenciasávok
Kritikus sáv
Frekvencia (Hz)
Kritikus sáv
Frekvencia (Hz)
Alsó
Felső
Szélesség
Alsó
Felső
Szélesség
0 0 100 100 13 2000 2320 320
1 100 200 100 14 2320 2700 380
2 200 300 100 15 2700 3150 450
3 300 400 100 16 3150 3700 550
4 400 510 110 17 3700 4400 700
5 510 630 120 18 4400 5300 900
6 630 770 140 19 5300 6400 1100
7 770 920 150 20 6400 7700 1300
8 920 1080 160 21 7700 9500 1800
9 1080 1270 190 22 9500 12000 2500
10 1270 1480 210 23 12000 15500 3500
11 1480 1720 240 24 15500 22050 6550
12 1720 2000 280
Az alsávokra történő felosztást QMF (Quadrature Mirror Filter) szűrők használatával oldják meg. A bemenő jelet felső- és alsó sávra osztja az első QMF szűrő, majd a másodikat ismét két részre osztja a második szűrő. A QMF -ek használata biztosítja, hogy az alsávokra osztás miatt keletkezett időtartománybeli aliasing megszűnjön a rekonstruálás során.
Ezután mindhárom alsávot áttranszformálják a frekvencia tartományba az MDCT segítségével (Modified Discrete Cosine Transform). Az MDCT -t használva 50 % -os átlapolás engedhető meg az időtartománybeli ablakok között, ami jobb frekvencia felbontást eredményez a kritikus mintavételezés megtartása mellet. Fix keretméret helyett az ATRAC az egyes sávokhoz a jelek karakterisztikáitól függő kerethosszt választ. Két üzemmód van: hosszú (11,6 ms) és rövid (1,45 ms a magas frekvencia tartomány számára és 2,9 ms a többinek). Normál esetben a hosszút használják, a jó frekvencia felbontás érdekében. Azonban a jel felfutásakor, illetve bizonyos részeinél hibák adódhatnak. Általában a kvantálási zaj terjed szét az egész blokkon és a kezdeti kvantálási zajt még semmi sem maszkolja; ezt hívják elő-visszhangnak. Ennek kiküszöbölésére a kódoló átkapcsol rövid módba, a jel felfutásakor. Ilyenkor a jel előtt csak egy rövid részen található zaj, amit elnyom a visszafelé irányuló maszkolás. A visszafelé irányuló maszkolás nem hatásos a hosszú mód esetén, mert nagyon rövid ideig áll fenn. Így az ATRAC kódoló hatásos a statikus és az átmeneti jelek kódolásakor is (54. ábra).
Vegyük észre, hogy a rövid mód nem szükséges a jel gyengülésekor, mert ilyenkor a kvantálási zajt az előre irányuló maszkolás nyomja el, ami sokkal tovább tart, mint a visszafelé irányuló. A maximális rugalmasság biztosításához minden egyes sávhoz külön választható a blokk méret üzemmódja.
 

Ezután az MDCT spektrális összetevőket BFU -kba csoportosítják. Minden csoport fix számú összetevőt tartalmaz. Hosszú mód esetén egy ilyen egység 11,6 ms -ot jelent egy keskeny frekvencia sávra; rövid módban minden csoport időben kevesebb, de nagyobb frekvencia felbontást biztosít (55. ábra). A BFU -k sűrűsége alacsony frekvenciákon nagyobb, mint magas frekvenciákon; ez az emberi fül pszihoakusztikus tulajdonságait tükrözi.Minden egyes hang keret hossza fix 212 byte. A lemezre 11 sztereo hang keretet rögzítenek minden két szektorba. Mono felvétel készítésekor kétszeres mennyiségű hang rögzíthető a lemezre.

Spektrális kvantálás

A spektrális értékeket két paraméter - a szó hossz és a skála felbontás alapján kvantálják. A skála felbontás a kvantálás teljes sávszélességét definiálja, míg a szó hosszúság a felbontás precízségét ezen a skálán belül. Az egy spektrumhoz tartozó BFU-knak ugyanakkora ez a két paraméterük, ami az egy csoportba foglalt frekvenciák pszihoakusztikai hasonlóságát tükrözi.

A skála felbontási tényezőt - ami a spektrális összetevők számosságát tükrözi egy BFU -n belül - fix értékek közül választják. A szó hosszt a bit allokációs algoritmus határozza meg.
Minden egyes hangkerettel (ami 512 bemeneti pontból áll) együtt a következő információkat is tárolják a lemezen:
Bit allokáció
 
A bit allokációs algoritmus osztja el a rendelkezésre álló biteket az egyes BFU -k között. A sok bittel rendelkező egységek mentesek lesznek a kvantálási zajtól, míg a kevéssel rendelkezőkben jelentős lesz a zaj. A jó hangminőség érdekében az algoritmusnak elegendő bitet kell biztosítania a kritikus egységek számára és ügyelnie kell arra, hogy a zaj a nem kritikus egységekben ne legyen hallható.
Az ATRAC nem definiál speciális bit allokációs algoritmust - bármely megfelelő algoritmus használható. Az egyes BFU -k szó hossza a MiniDiscen tárolódik a kvantált spektrummal együtt, így a dekóder teljesen független a bit allokációs algortimustól. Ez biztosítja a kódoló evolúciós fejlődését a MiniDisc szabvány, vagy a dekóder megváltoztatása nélkül.
Nagyon sok a szóba jöhető algoritmus az egészen egyszerűektől a szélsőségesen bonyolultakig. A hordozható MD rekorderek lehetőségei ezen a téren kissé korlátozottak, mert olcsó és kis teljesítmény igényű, kompakt hardver elemekből kell felépíteni őket. Az ATRAC azonban egyszerű bit allokációs algoritmus esetén is jó hangminőséget ad a pszihoakusztikai jellemzői miatt. Már a kódoló változó idő-frekvencia struktúrája is pszihoakusztikai törvényszerűségeken alapul, tehermentesítve ezzel az allokációs algoritmust.
Az egyik javasolt algoritmus fix és változó bitek kombinációját használja. A fix bitek hangsúlyozzák a fontos, kis frekvenciájú tartományokat, kevesebb bitet adva a magas frekvenciákat tartalmazó BFU-knak. A változó biteket az egyes BFU-kban található spektrális összetevők logaritmusának megfelelően osztják ki. A totális bit allokáció (btot(k)) a fix bitek (bfix(k)) és a változó bitek (bvar(k)) súlyozott összege:
 
            btot(k) = Tbvar + (1-T)bfix

A T súlyozó tényező a hang tonalításának mértéke: tiszta szinuszos hang esetén 1, fehér zaj esetén 0 az értéke. Ez azt jelenti, hogy a fix és a változó bitek aránya változtatható. Ezért tiszta hangok esetén a rendelkezésre álló biteket kevesebb BFU között osztják el. Zajosabbb jelek esetén az algoritmus a fix biteket fogja kihangsúlyozni, hogy csökkentse a kevésbé érzékeny, magas frekvenciákhoz kiosztott bitek számát.
A fenti egyenlet nem vonatkozik a teljes bitsebességre, és általában több bitet oszt ki, mint ami rendelkezésre áll. A fix adatsebesség biztosítása érdekében az összes BFU -ra egységesen vonatkozó offsetet számolnak (boff). Ezt az értéket minden btot(k) -ból levonják, így áll elő a végső bit kiosztás (b(k)).

            b(k) = integer[btot(k)-boff]

Ha a kivonás negatív számot eredményez, akkor a kérdéses BFU -nak 0 bitet oszt ki az algoritmus.

 
6.7.2. Az ATRAC dekóder

Az 56. ábrán látható a dekóder blokk diagramja. A dekóder először a spektrális összetevőket állítja elő a kvantált értékekből a szó hosszt és a skála felbontási paramétert használva. Ezekből a spektrális összetvőkből állítja elő az eredeti audio jelet. Az összetevőket először visszatranszformálják az idő tartományba az inverz MDCT segítségével, hosszú- és rövid módot használva a paramétereknek megfelelően. Végül a három, időtartománybeli jelből szintetizálják a kimeneti jelet QMF szintézis szűrőkkel.

Előző    Kezdőlap   Tartalomjegyzék   Következő