6. Az újraírható MiniDisc
rendszer
6.1 Bevezetés
A MiniDisc rendszert azzal a nyilvánvaló céllal
tervezték, hogy felváltsa a hagyományos kompakt kazettás rendszert. A MiniDisc
formátum két különböző típusú hordozóréteget definiál. Az egyik egy írható
magneto-optikai lemez otthoni felvétel készítésre, a másik egy hagyományos csak
olvasható lemez zene és szoftver publikáció céljára.
1992 -ben mutatták be a MiniDisc rendszert a
fogyasztói piacon, mint egy új digitális hang lejátszó- és rögzítő rendszert. Ez
csupán tíz évvel követte a Compact Disc (CD) bemutatását. Köztudott, hogy a CD a
hagyományos bakelit lemezeket váltotta fel a hanglemez piacon. A CD technológia
16 bites kvantálásra és 44,1 kHz -en mintavételezett digitális hangrögzítésre
épül. A CD hangminősége nagy előrelépést jelentett bámely más hétköznapi felvevő
rendszerhez hasonlítva.
A CD elterjedése előtt sok mérnök a CD
kifejlődését csupán a jobb hangminőségnek tuajdonította, de a CD lejátszó piacra
dobása után kiderült, hogy a fogyasztónak nagy értékké vált az optikai lemezes
rendszer gyors, véletlenszerű elérés módja Ezen kívül a 12 cm -es lemezt
könnyebb volt kezelni az LP -hez képest. Mind a lejátszó és a hordozó hosszabb
élettartama erősen hozzájárult a CD formátum elfogadásához. A fejlesztés
következő célpontja nyilvánvalóan az újraírható CD volt. A Sony és a Philips
együtt dolgoztak ezen a rendszeren és 1989 -ben technikai valósággá tették. Két
különböző CD rendszer alakult ki: az egyszer írható CD-R és az újraírható
CD-MO.
Az audio kazetták eladási aránya csökkent 1989
óta és a Sony érezte, hogy az audio kazetta, mint hangrögzítő fomátum életének
végéhez közelít. Ha el is fogadta volna a fogyasztói társadalom az írható CD -t,
még akkor is bonyolult lett volna betörni a hordozható készülékek piacára. Itt
ugyanis a kompakt kazettás rendszerek uralkodtak az erős rázkódás állóságuknak
és kis méretüknek köszönhetően. Egy új, lemezes rendszer kialakításának
egyértelmű célja ezen gyengeségek kiküszöbölése volt. A Sonynak sikerült ezt
megvalósítania a MiniDisc-el (MD).
Magneto-optikai lemezes adattároló rendszereket
pár éve már használtak számítógépes rendszerekben. Erre a technológiára alapozva
kifejlesztettek egy közvetlenül felülírható rendszert ugyanakkora kapacitással,
mint egy CD. Ezen kívül rázkódás álló memóriát alkalmaznak a hordozhatóság
érdekében és egy digitális hang tömörítő eljárást használnak - amit ATRAC -nak
hívnak (Adaptive TRansform Acoustic Coding) - aminek köszönhetően 64 mm -re
csökkenthető a lemez átmérője. A félvezető elemek gyors technológiai fejlődése
segített ennek megvalósításában.
A CD-ROM megvalósításához hasonlóan az MD Adat
rendszer is az audio MD -re épül. A 140 Mbyte -os kapacitás és a célorientált
file struktúra új lehetőségeket nyújt az MD adat lemezek különböző számítógépes
konfigurációkba illesztésére. A MiniDisc rendszer szabvány leírását az ún.
"Szivárvány könyv" tartalmazza (Rainbow Book).
6.2.
Rendszer konfiguráció
A kis házméretet a könnyű kezelhetőség és a lemez
védelme érdekében alkalmazták. A ház fizikai méretei: 72 mm (sz), 68 mm (d), 5
mm (m), mely részletes tanulmányok eredménye. Két különböző típusú hordozó réteg
és három féle lemez létezik. Az egyik a CD -hez hasonló szokványos lemez, amely
aluminium fényvisszaverő réteggel és beleégetett jel mintázattal (pitek)
rendelkezik. A második típus az írható lemez, amely széles barázdákkal bevont
magneto-optikai hordozó réteggel rendelkezik. A harmadik típusú lemezen van
előre égetett és írható réteg is. A barázdákat egy 22,05 kHz -es vivő modulálja,
amit pedig a cím adat modulál. Ez az előmodulációs eljárás elősegíti a helyes
sávkövetést, a kerületi sebesség állandó értéken tartását és a hozzáférés
vezérlését felvételkor. A 42. ábrán láthatók az MD lemezek típusai. Minden MD
rendszernek képesnek kell lennie ezt a három típusú lemezt lejátszani. Ez azt
jelenti, hogy az MD felvevő/lejátszó két funkciós optikai pick-up-al van
felszerelve az előre rögzített bit mintázat és a magneto-optikai lemez
olvasásához.

Az MD lemez hordozója
fröccsöntési eljárásokkal készül. Így viszonylag egyszerűen kialakítható egy
optimális illesztő terület, ami a lemez precíz betöltését, illetve rögzítését
biztosítja. A 43. ábrán látható a lemez házba helyezett hordozófelületének
keresztmetszeti rajza. Az optikai lemezt centralizálni kell miután a meghajtóba
kerül. Mint a CD -nél, itt is a polykarbonát hordozó belső kerületét használják
erre, mint referenciát. Az egyszerű acélból készült alátét durván pozícionálódik
a beállító terület szemközti oldalára, hogy pontos beállítást és centralizációt
biztosítson. Ez az egyszerű eljárás csökkentheti a polykarbonát lemez középponti
részeinek mechanikai igénybevételét is. Ily módon segít elkerülni a kettős
optikai törést is a polykarbonát hordozón.
A házon található egy porvédő zár. A gyári
(műsoros) MD-n ez a zár csak az alsó részen van, míg az írható MD -nek mindkét
oldalán található (44. ábra). Ez az egyszerű ház és lemez felépítés olcsóvá
teszi a gyártást. Ez pedig elengedhetetlen, ha zene rögzítésre, vagy szoftver
kiadásokra akarjuk használni.
Az optikai paraméterei az MD lemeznek (laser
hullámhossz, track pitch, az optikai pick up numerikus aperturája (NA), stb.)
majdnem ugyanazok, mint a CD -nél (10. táblázat).
6.3. Mágneses-mező modulációs felülírás
(Magnetic-Field Modulation Overwriting)
Egy másik rendszerben (a laser modulációs
rendszerben) - ami a mágneses-mező moduláció mellett használt - a jelet a
félvezető laser teljesítmény szintjének változtatásával rögzítik. A kétféle
domén közül csak az egyiket használják. A terület amit a laser megvilágít 1 -es
lesz, ahol nem rögzítünk semmit 0 lesz. A felvett mintázat asszimetrikus lesz.
Ezen kívül még egy probléma merül fel a laser modulációval kapcsolatban:
érzékeny a felvételi teljesítmény ingadozásaira. Amikor a felvételi teljesítmény
ingadozik a bitek kezdő- és vég pozíciója könnyen eltorzulhat, így a mintázat
hossza változó lesz.

A felvevő/lejátszó MiniDisc -ek a digitális jeleket
magneto-optikai úton rögzítik a mágneses-mező moduláció rendszer segítségével.
Ezt a rendszert az újraírható CD technológia alapján alkalmazták. Az optikai fej
és a lemezhez érő mágneses fej egymással szemközt helyezkednek el a lemez két
oldalán, közrefogva azt (45. ábra). Mágneses-mező moduláció esetén egy félvezető
laser folyamatosan megvilágítja a felületet, mintegy 4,5 mW teljesítménnyel.
Amikor a fénypont a lemezre esik, a felszíni réteg hőmérséklete kb. a Curie
pontig emelkedik (kb. 180 °C). Amint a fénypont továbbhalad a réteg hőmérséklete
csökkenni kezd. Ez a folyamat állandóan ismétlődik. Amikor N (É) vagy S (D)
mágneses mezőbe kerül a pont amit a laser besugárzott egy-egy 1-t vagy 0 -t
rögzít a rendszer a Curie hőmérséklet izotermáját határvonalként használva. Így
a rögzített 1-es vagy 0 alakja és hossza meghatározott (46. ábra). Ha a mágneses
mező elég gyorsan változik, lehetségessé válik, hogy 0,3 ěm -es osztással írjunk
egy pitbe, még akár egy 780 nm -es hullámhosszúságú fénysugár és 0,45 NA -s
lencse kombinációjával is. Továbbá az "1" és a "0" területek szimmetrikusak
lesznek, ami a mágneses-mező moduláció jellemzője.

A
mágneses-mező modulációnak még egy nagy előnye, hogy rendkívül ellenálló a lemez
dőléssel szemben. Amikor a lemez meghajlik, a fénypont eltorzul. A laser
moduláció esetében a felvett bitmintának az alakját a fénypont szabja meg. A
torzulás elég jelentős lehet. A mágneses-mező moduláció során a lasert a
magneto-optikus réteg hőmérsékletének növelésére használják és nem befolyásolja
a felvett bitmintázat alakját. Így ha felvétel közben a lemez megdől, vagy
elhajlik kisebb lesz a torzulás.
A 47. és a 48. ábrán láthatók egy kísérlet
eredményei. A 47. ábra a hibás blokkok arányának ingadozását mutatja a lemez
dőlésének függvényében felvételkor és lejátszáskor. A lemez akár +/- 1,5 fokkal
is megdőlhet a barázdák irányában, a blokk hibaarány még akkor is majdnem stabil
marad, mindaddig, míg olvasáskor is meg nem dől a lemez. A 48. ábrán látható a
mérés eredménye sugár irányú dőlés esetén. Nagyon hasonlóak a párhuzamos
dőlésnél mért értékekhez.

Amint azt már elmondtuk számos előnye van a
mágneses-mező modulációnak. Ezeknek a tulajdonságoknak köszönhető a
tömegtermelésben készülő MD rendszerek nagy megbízhatósága felvételkor és
lejátszáskor, habár bonyolultnak tűnik a mágneses fej elkészítése. Egy a
lemezzel érintkező író fej alkalmazása viszonylag egyszerű megoldás. Az MD lemez
felső részét be kell vonni egy vékony védőréteggel, ami megvédi a hordozó
réteget a környezeti hatásoktól és ezzel a réteggel beállítható a súrlódási erő
a megfelelő értékre. Így, ha az író fej csak durván érintkezik is ezzel a
réteggel, akkor is megfelelő nagyságú mágneses mezőt hoz létre. Rendkívül
megbízható ez a módszer, akár milliószor is körbefordulhat a lemez. Lényeges,
hogy a fej meghajtó árama elég kicsi ahhoz, hogy telepről működjön.
6.4. Adat
struktúra
Az előre elkészített és az írható MD rögzített
jele nagyon hasonlít a CD -nél alkalmazotthoz. EFM -et (Eight-to-Fourteen
Modulation) és CIRC -t (Cross Interleaved Reed-Solomon Code) alkalmaznak. Mint
ismeretes, az EFM és a CIRC kombinációja potenciális hibajavítási lehetőségeket
és nagy adatsűrűséget eredményez. A "csupasz" CD lemez is hosszú távon képes az
adatok biztonságos tárolására. Így, ha a lemezt egy tokba helyezzük, elvárható a
megbízhatóság növekedése. Ez erősen befolyásolta a tervezőket, hogy ugyanezt a
rendszert használják.
Az audio CD -től eltérően kissé megváltoztatták
a CIRC szekvenciákat egy olyan keret formátumra, ami alkalmas az egyes audio
szekvenciák közti szünetek és a folyamatos adat szekvenciák kezelésére is. A
neve: ACIRC (Advanced CIRC).
A MD rendszer csoportokba rendezve rögzített,
tömörített audio adatot használ. A blokk formátuma nagyon hasonló a CD-ROM
mode-2 -höz. A CD-ROM esetében a blokk cím alapja a CD subcode címe, így a
fizikai cím amit használunk a játékidőn alapszik. A CD és a CD-ROM perceket,
másodperceket és kereteket használ. Az MD-nél felváltották az idő alapú címzést
a bináris kód alapúval, ami keret (blokk) egységeken alapszik. Egy ilyen
egységet (keret, blokk) szektornak nevezünk. A hosszú ACIRC hibajavító kód miatt
három szektort "bekötő" szektorként kell használni. Ha a felhasználó
megváltoztat, vagy új adatokat rögzít az MD lemezre, két vagy három szektort
kell rögzíteni az új adat kezdő és vég pozíciójánál.
A rögzítendő adat hossza változó, ami problémát
okoz a címzés szempontjából, ezért bevezették a cluster (csoport) fogalmát, ami
meghatározza a rögzítendő, vagy felülírandó adat minimumát. Egy cluster 36
szektorból áll. Ebből 32 szektort használnak az információ tárolására, a további
négyet pedig az adatok összekötésére (linking - feladatuk a CD-nél alkalmazott
mergin bitekéhez hasonló), illetve plusz információk rögzítésére (49. ábra).
Feljebb elmondtuk, hogy a hordozó előkészítését (pregroove) a 22,05 kHz -es vivő
végzi, amit a cím adat modulál. A cím a szektor és a cluster számmal egyezik
meg. A meghajtó egység bármely írási és olvasási folyamat közben megtalálja a
helyes címet a modulált hordozó segítségével.

Az információ hordozó felület belső részén található a tartalomjegyzék
(TOC = Table Of Contents), amit előre égetett felületen rögzítenek (gyárilag).
Néhány szektor a lemez azonosítását, illetve az adott lemez típushoz tartozó
plusz információkat tartalmazza. Az írható MD lemezen a TOC -ban található
néhány olyan paraméter is, amit felvétel készítéskor használnak (optimális
felvevő teljesítmény, a felhasználói terület kezdő és vég címe, stb.). A gyári
MD TOC -ja tartalmazza a sáv felosztás táblázatát (track allocation table), a
track -ek nevének táblázatát, a felvétel dátumát, stb. A track felosztás
táblázatnak van egy része, ami a zeneszámok kezdő és vég címére mutat a program
területen. A track név, és dátum táblázat opció. A felhasználói
tartalomjegyzéket (UTOC = User TOC) felvétel készítés, vagy szerkesztés után
rögzítik a lemezre. A UTOC track felosztás táblázata ugyanúgy kezeli a program
területeket. Maximum 255 zeneszámot definiál a track felosztás táblázat, plusz
lehetőség nyílik a feldarabolt track -ek összekötésére, folyamatosként
feltüntetve azokat. A rázkódásálló memória alkalmazásával az MD képes
automatikusan összefűzni a szétdarabolt részeket. Így az MD rendszer könnyü és
megbízható működést biztosít.
6.5. Rázkódás védelmi
memória
Egy hagyományos optikai lemezes rendszer könnyen
hibázhat, ha rázkódás, vagy ütés éri. Emiatt sokáig úgy gondolták, hogy a
mágnesszalagos média a legjobb megoldás kültéri használatra. Bár az autókba
szerelhető CD lejátszókat mechanikai felfüggesztéssel védik a rázkódástól, a
hordozható berendezésekben - mint a Walkman - bonyolult mechanikai védelmet
alkalmazni, mert túl sok helyet foglal. Így más megoldást kellett találni.
Tapasztalatból tudjuk, hogy az
ütések és a rázkódások nem folyamatosak. Ezért a MiniDisc rendszer egy az
optikai pick-up és az ATRAC kódoló közé helyezett félvezető memóriát használ
adat pufferelésre. Egy 4 Mbit -es memóriában kb. 12 másodpercnyi tömörített
hanganyag tárolható. Amikor az optikai pick-up elkezdi olvasni az adatokat a
lemezről, néhány másodpercnél kevesebb idő alatt feltöltődik a memória, mert az
optikai olvasás és az ATRAC dekóder között ötszörös bitsebességbeli különbség
van. Így normál lejátszáskor az optikai pick-up szakaszosan olvassa az adatot a
lemezről, hogy folyamatosan feltöltve tartsa a memóriát. Ha a pick-up kiesik a
pozíciójából ütés/rázkódás miatt és az adatfolyam megszakad, az adatokat a
dekóder továbbra is olvashatja a memóriából így biztosítva a folyamatos
lejátszást még 12 s-ig. Amint a pick-up visszanyeri a pozícióját, újra feltölti
a memóriát. Mivel a lemez egész területén kb. 13,3 ms -ként találhatók cím
információk, a pick-up általában 1 s alatt visszanyeri a pozícióját (50. ábra).
Mostanában a CD lejátszó gyártók is alkalmaznak egy majdnem ugyanilyen módszert.
Így ez az optikai lemezes rendszer már megfelel kültéri használatra.
6.6. MD-adat
szabvány
Az audio MiniDisc szabványra épülő MD-adat
szabványt 1993 -ban fejlesztették ki. Az MD-adat lemez és a kulcsfontosságú
alkatrészek (optikai pick-up és LSI chipek) majdnem ugyanazok, mint az audio MD
rendszernél. Így általában ugyanaz az infrastruktúrája az MD-adat lemez
gyártásának is, mint az audio MD lemezé. Tulajdonképp hasonlít a CD-ROM
előállítási folyamatához. Az MD-adat lemeznek kb.140 Mbyte a kapacitása (51.
ábra). A különböző lemeztípusoknak (csak olvasható, írható és hibrid lemez) és a
kis méretnek köszönhetően az MD-adat rendszer a jövő adathordozója és
publikációs médiája lehet. Annak ellenére, hogy az audio és az adat MD jellemzői
nagyon hasonlóak, az audio MD fizikai jellemzőit továbbfejlesztették. Lényeges,
hogy az audio vásárló ne keverje össze a két lemeztípust. Emiatt az adat lemez
házának alakja eltérő (51. ábra). Szükség volt a jobb adatminőség és a magasabb
adatátviteli sebesség biztosítására, ezért egyes jellemzők megváltoztak, hogy
megfeleljenek a kívánalmaknak. Plusz az MD célorientált file struktúrával
rendelkezik, ami különböző platformokon futó alkalmazásokat támogat.

Az adat lemez file struktúráját és terjedelmét úgy
tervezték, hogy megbírkózzon az MD fizikai korlátjaival. Az adat sávot -
ugyanúgy, mint az audio lemeznél - a TOC -ban és a UTOC -ban definiálják. Az
első cluster a boot cluster, a további 16 pedig a VMA (Volume Management Area)
-t tartalmazza, amiben az összes file és könyvtár kezelési információ található.
A VMA fizikailag középen helyezkedik el és általában egy félvezető memóriával
cache -elik, a hozzáférések illetve az újraírások száma minimális. Továbbá
meggondolva, hogy a cluster egy minimális egységet jelent, az adat lemez file
struktúrája 2 - 64 kbyte -ig terjedő méretű blokkokat képes kezelni. A
blokkméretet automatikusan választja ki a rendszer a felhasználó által használt
alkalmazásoknak megfelelően. A file rendszer támogatja a hierarhikus
könyvtárszerkezetet, rövid- és hosszú file neveket, plusz információkat, stb.,
így könnyen csatolható különféle gazdarendszerekhez, illetve lehetővé teszi az
adatcserét a különböző rendszerek közt (10. táblázat).
10. táblázat: a MiniDisc rendszer paraméterei
Fő paraméterek |
Audio MD |
Adat MD |
Kapacitás |
Max. 74 perc |
140 Mb |
Cartridge méret |
68(d) x 72(sz) x 5(m) mm |
A diszk jellemzői |
|
Átmérő |
64 mm |
Vastagság |
1,2 mm |
A középső lyukátmérő |
11 mm |
A programterület kezdetének átmérője |
32 mm |
A bevezető rész kezdetének átmérője |
Max. 29 mm |
Pit nagyság |
1,6 mm |
Kerületi sebesség |
1,2 - 1,4 m/s |
1,2, vagy 2,4 m/s |
Optikai paraméterek |
|
A laser hullámhossza |
780 nm |
Lencse NA |
0,45 |
Laser teljesítmény rögzítéskor |
2,5 - 5 mW |
Rögzítési eljárás |
Mágneses-mező moduláció |
Átalános audio jellemzők |
|
Csatornák száma |
Sztereo/mono |
Frekvencia tartomány |
5 Hz - 20 kHz |
Dinamika |
105 dB |
Nyávogás, lebegés |
Quartz precízség |
Jelformátum / adatstruktúra |
|
Mintavételezési frekvencia |
44,1 kHz |
|
Tömörítés |
ATRAC |
|
Moduláció |
EFM |
Hibajavító eljárás |
ACIRC |
Szektor méret |
|
2048, vagy 2336 byte |
Cluster méret |
|
32 szektor |
Maximális cluster szám |
|
kb. 2200 |
Maximális szektor szám |
|
kb. 70000 |
Blokkméret |
|
2 kbyte - 64 kbyte |
6.7. ATRAC:
Adaptive Transform Acoustic Coding (Alkalmazkodó Leképezésű Akusztikus
Kódolás)
A lecsökkent tárolókapacitás ellenére szükséges
volt, hogy a MD jó hangminőséget adjon és 74 perces játékidővel rendelkezzen.
Ezért az ATRAC -ot úgy tervezték, hogy megfeleljen a következő követelményeknek:
a 16 bites, 44,1 kHz -es sztereo audio jelet kevesebb, mint 1/5 -ére tömörítse
össze a hangminőség minimális romlása mellett. Hordozható készülékekben is
alkalmazható egyszerű és olcsó hardverrel is megoldható legyen a kódolás és a
dekódolás.
A digitális audio jel tömörítésekor bizonyos
mennyiségű zaj adódik a jelhez. A legtöbb audio kódolási eljárásnak az az
alapelve, hogy az ilyen zaj idő- és frekvencia tartománybeli eloszlását úgy
kezeljék, hogy az hallhatatlan legyen az emberi fül számára. Ha ez sikeres,
akkor az ilyen módon előállított jel megkülönböztethetetlen lesz az
eredetitől.
Az audio kódoló rendszerek általában úgy
működnek, hogy felosztják a jelet különböző idő- és frekvenciatartománybeli
egységekre. Ezt a felosztást használva a jelet a pszihoakusztikai
törvényszerűségeknek megfelelően elemzik. Az elemzés során kimutatható, hogy
mely egységek a kritikusak és ezért nagy pontossággal kódolandók, és mely
egységek kevésbé jelentősek és így elviselnek némi kvantálási zajt a kívánt
hangminőség romlása nékül. Erre az információra alapozva rendelik az elérhető
biteket az egyes egységekhez. A spektrális összetevőket ezután kvantálják
ezeknek a biteknek a felhasználásával. A dekóderben a kvantált spektrumot
visszaalakítják a bit kiosztásnak megfelelően és ezután audio jellé
szintetizálják.
Az ATRAC rendszer is a fentieknek megfelelően -
csak számos kiegészítéssel - működik. A pszihoakusztikus jellemzőket ugyanis nem
csak a bit kiosztás során használja, hanem az idő- és a frekvencia tartomány
felosztásakor is. A bemeneti jelet nem azonos frekvencia osztásokban
analizálják, és így kiemelik a fontos, alacsony frekvenciás összetevőket. Ezen
kívül változó hosszúságú blokkokat használnak, ami a bemeneti jelhez igazodik.
Így a statikus részek is hatékonyan kódolhatók és az átmeneti, gyorsan változó
részekre nem pazarolják az időbeli felbontást.
Elsőként az ATRAC kódolót vizsgáljuk meg az idő-
és frekvencia tartománybeli felosztás, a spektrális összetevők kvantálása és a
bit kiosztás alapján, majd az ATRAC dekódert mutatjuk be.

Az 52. ábrán látható a kódoló blokkdiagrammja. A kódoló három
részből áll. Az analízis rész spektrális összetevőire bontja a jelet, amelyeket
csoportokba (BFU = Block Floating Unit) rendeznek. A bit allokáció rész elosztja
a rendelkezésre álló biteket az egyes BFU -k között, kevesebb bitet osztva a
kisebb jelentőségű csoportoknak. A kvantálás rész kvantálja az egyes spektrális
összetevőket a meghatározott szóhosszúságra.
Idő - frekvencia analízis
Ez a rész generálja a BFU -kat három lépésben, az
alsáv- és az átviteli kódolás segítségével.(53. ábra). Először a jelet
felosztják három alsávra: 0-5,5 kHz, 5,5-11 kHz és 11-22 kHz. A kritikus
frekvenciasávok listáját a 11. táblázat tartalmazza. Ezután minden egyes alsávot
áttranszformálnak a frekvencia tartományba, így létrehozva a spektrális
összetevőket. Végül ezeket a spektrális össztevőket nem azonos méretű
csoportokba - a BFU -kba - fogják.
11. táblázat: az ATRAC által használt kritikus
frekvenciasávok
Kritikus sáv |
Frekvencia (Hz) |
Kritikus sáv |
Frekvencia (Hz) |
Alsó |
Felső |
Szélesség |
Alsó |
Felső |
Szélesség |
0 |
0 |
100 |
100 |
13 |
2000 |
2320 |
320 |
1 |
100 |
200 |
100 |
14 |
2320 |
2700 |
380 |
2 |
200 |
300 |
100 |
15 |
2700 |
3150 |
450 |
3 |
300 |
400 |
100 |
16 |
3150 |
3700 |
550 |
4 |
400 |
510 |
110 |
17 |
3700 |
4400 |
700 |
5 |
510 |
630 |
120 |
18 |
4400 |
5300 |
900 |
6 |
630 |
770 |
140 |
19 |
5300 |
6400 |
1100 |
7 |
770 |
920 |
150 |
20 |
6400 |
7700 |
1300 |
8 |
920 |
1080 |
160 |
21 |
7700 |
9500 |
1800 |
9 |
1080 |
1270 |
190 |
22 |
9500 |
12000 |
2500 |
10 |
1270 |
1480 |
210 |
23 |
12000 |
15500 |
3500 |
11 |
1480 |
1720 |
240 |
24 |
15500 |
22050 |
6550 |
12 |
1720 |
2000 |
280 |
|
|
|
Az alsávokra történő felosztást QMF (Quadrature
Mirror Filter) szűrők használatával oldják meg. A bemenő jelet felső- és alsó
sávra osztja az első QMF szűrő, majd a másodikat ismét két részre osztja a
második szűrő. A QMF -ek használata biztosítja, hogy az alsávokra osztás miatt
keletkezett időtartománybeli aliasing megszűnjön a rekonstruálás során.
Ezután mindhárom alsávot áttranszformálják a
frekvencia tartományba az MDCT segítségével (Modified Discrete Cosine
Transform). Az MDCT -t használva 50 % -os átlapolás engedhető meg az
időtartománybeli ablakok között, ami jobb frekvencia felbontást eredményez a
kritikus mintavételezés megtartása mellet. Fix keretméret helyett az ATRAC az
egyes sávokhoz a jelek karakterisztikáitól függő kerethosszt választ. Két
üzemmód van: hosszú (11,6 ms) és rövid (1,45 ms a magas frekvencia tartomány
számára és 2,9 ms a többinek). Normál esetben a hosszút használják, a jó
frekvencia felbontás érdekében. Azonban a jel felfutásakor, illetve bizonyos
részeinél hibák adódhatnak. Általában a kvantálási zaj terjed szét az egész
blokkon és a kezdeti kvantálási zajt még semmi sem maszkolja; ezt hívják
elő-visszhangnak. Ennek kiküszöbölésére a kódoló átkapcsol rövid módba, a jel
felfutásakor. Ilyenkor a jel előtt csak egy rövid részen található zaj, amit
elnyom a visszafelé irányuló maszkolás. A visszafelé irányuló maszkolás nem
hatásos a hosszú mód esetén, mert nagyon rövid ideig áll fenn. Így az ATRAC
kódoló hatásos a statikus és az átmeneti jelek kódolásakor is (54. ábra).
Vegyük észre, hogy a rövid mód nem szükséges a
jel gyengülésekor, mert ilyenkor a kvantálási zajt az előre irányuló maszkolás
nyomja el, ami sokkal tovább tart, mint a visszafelé irányuló. A maximális
rugalmasság biztosításához minden egyes sávhoz külön választható a blokk méret
üzemmódja.
Ezután az MDCT spektrális
összetevőket BFU -kba csoportosítják. Minden csoport fix számú összetevőt
tartalmaz. Hosszú mód esetén egy ilyen egység 11,6 ms -ot jelent egy keskeny
frekvencia sávra; rövid módban minden csoport időben kevesebb, de nagyobb
frekvencia felbontást biztosít (55. ábra). A BFU -k sűrűsége alacsony
frekvenciákon nagyobb, mint magas frekvenciákon; ez az emberi fül
pszihoakusztikus tulajdonságait tükrözi.Minden egyes hang keret hossza fix 212
byte. A lemezre 11 sztereo hang keretet rögzítenek minden két szektorba. Mono
felvétel készítésekor kétszeres mennyiségű hang rögzíthető a lemezre.
Spektrális kvantálás
A spektrális értékeket két paraméter - a szó hossz
és a skála felbontás alapján kvantálják. A skála felbontás a kvantálás teljes
sávszélességét definiálja, míg a szó hosszúság a felbontás precízségét ezen a
skálán belül. Az egy spektrumhoz tartozó BFU-knak ugyanakkora ez a két
paraméterük, ami az egy csoportba foglalt frekvenciák pszihoakusztikai
hasonlóságát tükrözi.
A skála felbontási tényezőt - ami a spektrális
összetevők számosságát tükrözi egy BFU -n belül - fix értékek közül választják.
A szó hosszt a bit allokációs algoritmus határozza meg.
Minden egyes hangkerettel (ami 512 bemeneti
pontból áll) együtt a következő információkat is tárolják a lemezen:
- az MDCT blokk méret módja (hosszú, vagy rövid).
- adat a szó hosszról az egyes BFU -kra.
- skála felbontási paraméter az egyes BFU -kra.
- kvantált spektrális összetevők.
Bit allokáció
A bit allokációs algoritmus osztja el a
rendelkezésre álló biteket az egyes BFU -k között. A sok bittel rendelkező
egységek mentesek lesznek a kvantálási zajtól, míg a kevéssel rendelkezőkben
jelentős lesz a zaj. A jó hangminőség érdekében az algoritmusnak elegendő bitet
kell biztosítania a kritikus egységek számára és ügyelnie kell arra, hogy a zaj
a nem kritikus egységekben ne legyen hallható.
Az ATRAC nem definiál speciális bit allokációs
algoritmust - bármely megfelelő algoritmus használható. Az egyes BFU -k szó
hossza a MiniDiscen tárolódik a kvantált spektrummal együtt, így a dekóder
teljesen független a bit allokációs algortimustól. Ez biztosítja a kódoló
evolúciós fejlődését a MiniDisc szabvány, vagy a dekóder megváltoztatása
nélkül.
Nagyon sok a szóba jöhető algoritmus az egészen
egyszerűektől a szélsőségesen bonyolultakig. A hordozható MD rekorderek
lehetőségei ezen a téren kissé korlátozottak, mert olcsó és kis teljesítmény
igényű, kompakt hardver elemekből kell felépíteni őket. Az ATRAC azonban
egyszerű bit allokációs algoritmus esetén is jó hangminőséget ad a
pszihoakusztikai jellemzői miatt. Már a kódoló változó idő-frekvencia
struktúrája is pszihoakusztikai törvényszerűségeken alapul, tehermentesítve
ezzel az allokációs algoritmust.
Az egyik javasolt algoritmus fix és változó
bitek kombinációját használja. A fix bitek hangsúlyozzák a fontos, kis
frekvenciájú tartományokat, kevesebb bitet adva a magas frekvenciákat tartalmazó
BFU-knak. A változó biteket az egyes BFU-kban található spektrális összetevők
logaritmusának megfelelően osztják ki. A totális bit allokáció
(btot(k)) a fix bitek (bfix(k)) és a változó bitek
(bvar(k)) súlyozott összege:
btot(k) = Tbvar + (1-T)bfix
A T súlyozó tényező a hang tonalításának
mértéke: tiszta szinuszos hang esetén 1, fehér zaj esetén 0 az értéke. Ez azt
jelenti, hogy a fix és a változó bitek aránya változtatható. Ezért tiszta hangok
esetén a rendelkezésre álló biteket kevesebb BFU között osztják el. Zajosabbb
jelek esetén az algoritmus a fix biteket fogja kihangsúlyozni, hogy csökkentse a
kevésbé érzékeny, magas frekvenciákhoz kiosztott bitek számát.
A fenti egyenlet nem vonatkozik a teljes
bitsebességre, és általában több bitet oszt ki, mint ami rendelkezésre áll. A
fix adatsebesség biztosítása érdekében az összes BFU -ra egységesen vonatkozó
offsetet számolnak (boff). Ezt az értéket minden btot(k)
-ból levonják, így áll elő a végső bit kiosztás (b(k)).
b(k) =
integer[btot(k)-boff]
Ha a kivonás negatív számot eredményez,
akkor a kérdéses BFU -nak 0 bitet oszt ki az algoritmus.
6.7.2. Az
ATRAC dekóder
Az 56. ábrán látható a dekóder blokk diagramja. A
dekóder először a spektrális összetevőket állítja elő a kvantált értékekből a
szó hosszt és a skála felbontási paramétert használva. Ezekből a spektrális
összetvőkből állítja elő az eredeti audio jelet. Az összetevőket először
visszatranszformálják az idő tartományba az inverz MDCT segítségével, hosszú- és
rövid módot használva a paramétereknek megfelelően. Végül a három,
időtartománybeli jelből szintetizálják a kimeneti jelet QMF szintézis szűrőkkel.
Előző
Kezdőlap
Tartalomjegyzék
Következő