1. A digitális hangtechnika alapjai


1.1. Digitális hangjelek

A hiradástechnikában az átviendő, vagy rögzítendő információ megjelenési formája a jel. Ezek elektromágneses jelek, mert csak ezeket lehet elektronikus úton átvinni, illetve feldolgozni.

Matematikai osztályozás alapján léteznek:
1. táblázat: a különböző jelek tulajdonságai
Jel
Értelmezési tartomány
Értékkészlet
Analóg
folytonos folytonos
Lépcsős
folytonos diszkrét
Mintavételezett
diszkrét folytonos
Digitális
diszkrét diszkrét

A digitális hangjelek eredeti forrása mindig analóg jel. Az analóg jelből a digitalizálás során keletkezik a digitális jel. A digitális jel az analóg jelből meghatározott időközönként vett mintákból áll. Az egyes minták értékét bináris kódszavak tartalmazzák. Tehát a digitális hangjeleket feldolgozó áramkörök digitálisak, azaz logikai áramkörökből és tárolóelemekből állnak.

1.2. Az analóg és a digitális hangjelfeldolgozás összehasonlítása

Először vizsgáljuk meg az analóg hangátvitel folyamatát ! (1. ábra). Az erősítő a bemenetére csatlakoztatott mikrofon jelét felerősíti és a kimenetére csatlakoztatott hangszóróra továbbítja. A vázolt példában a mikrofon a jel forrása, az erősítő az átviteli csatorna, a hangszóró pedig a fogyasztó. Teljesen mindegy, hogy mennyire bonyolult úton jut el a jel a forrástól a fogyasztóig, ez a felbontás mindig elvégezhető. Ebből a szempontból lényegtelen, hogy analóg, vagy digitális jelfeldolgozásról van szó. Viszont fontos tudni, hogy az átviteli csatornának vannak-e olyan tulajdonságai, amelyek befolyásolják az átvitt jelet. Mielőtt tovább boncolnánk ezt a kérdést leszögezhetjük, hogy sajnos vannak ilyen tulajdonságai az átviteli csatornának. Ezeken kívül felléphetnek még különböző zavarójelek is.

1.2.1. Az átviteli csatorna jellemzői

Jel-zaj viszony

Az átvitel során a csatornán mindig fellép valamilyen zavaró hatás is, ami a fenti példában a hangszóróból áradó zajként érzékelhető. A jel-zaj viszony a hasznos és a zavaró jel (zaj) aránya dB-ben (2. ábra). A jel-zaj viszonyt lineáris frekvenciamenet és lezárt be- és kimenet mellett mérik.

A zajt az átviteli csatornát felépítő aktív és passzív alkatrészek hozzák létre. A zajfeszültség a hallható frekvenciatartomány széles sávjában jelentkezik (fehér zaj: minden frekvencia megtalálható benne csak különböző intenzítás értékekkel).

Dinamika

A kifogástalanul reprodukálható kimenő jel maximális értékének és a még zajmentesnek érzékelt kimenő jel minimális értékének aránya dB-ben. A dinamikát felülről a kivezérelhetőség, alulról a zaj korlátozza.

Sávszélesség

Az átviteli csatorna sávszélességét tekintve sávszűrő jellegű. A frekvencia növekedésével a hasznos jel amplitúdója általában csökken, ezenkívül egyenfeszültségű, illetve kisfrekvenciás összetevők átvitelére általában nincs lehetőség.
A sávszélesség az a frekvenciatartomány, amelyen belül a kimenő jel értéke a vonatkoztatási frekvencián mért értékhez képest maximum +/-3 dB-lel tér el (3. ábra).
Linearítás

Ideális átviteli csatorna esetén a bemeneti jel a kimeneti jellel lineáris viszonyban van. Ellenkező esetben torzítás keletkezik, amit nemlineáris torzításnak neveznek (4. ábra). A nemlineáris torzításokat általában az aktív elemek görbült jelleggörbéi okozzák.
 
Harmónikustorzítás
 
Az átviteli csatorna kimenetén általában a bemeneti jel bizonyos frekvencia összetevőinek felharmónikusai is megjelennek. A torzítás mértékét a Klirr-faktor fejezi ki: a felharmónikusok effektív értékének és a felharmónikusokkal terhelt kimeneti jel értékének hányadosa %-ban.

1.2.2. Az analóg átvitel jellemzői

1.2.3. A digitális hangjelfeldolgozás előnyei és hátrányai

Az egyik legnagyobb előny, hogy a zavarójelek a digitális jel durva H/L struktúráját nem tudják olyan könnyen megzavarni, mint analóg átvitel során. A zavarófeszültséggel terhelt digitális jelből egyszerű határolással visszaállítható az eredeti négyszögjel (5. ábra). Így a csatornából származó zaj kiszűrhető, emiatt pedig a J/Z viszony is jobb: általában a 90 dB-t is meghaladja. A fentiek következménye, hogy másolatok készítése esetén a másolat minősége az eredetiével megegyező.
 

Hátrányok:

Fontos, hogy a 90 dB-es érték a rendszerdinamika és nem tévesztendő össze a hangfrekvenciás jel dinamika értékével, vagyis a leghangosabb és leghalkabb hangok közötti különbséggel.

1.3. A digitalizálás folyamata

1.3.1. A mintavételi tétel

C. E. Shannon 1948-as munkájában kifejti, hogy a mintavétellel nyert diszkrét mintákból álló impulzussorozat információtartalma megegyezik az eredeti, időben folytonos analóg jel információtartalmával. Ez viszont csak bizonyos feltételek érvényesülése esetén igaz. Ezeket a feltételeket a Shannon-féle mintavételi tétel tartalmazza: a mintavételezett jelből akkor állítható vissza információ veszteség nélkül az eredeti analóg jel, ha a mintavételi frekvencia (fm) legalább kétszerese az analóg jelben előforduló legmagasabb frekvenciának (fmax). A mintavételi frekvencia értékének állandónak kell lennie. Képlettel:
 
fm >= 2fmax

Az fmax frekvenciát Nyquist-frekvenciának is nevezik.
 

Ha nem tartjuk be a mintavételi tételt, akkor a kimeneti jelben ún. gyűrődési torzítások keletkeznek (aliasing). A 6. ábrán látható a mintavevő és -tartó áramkör kimenetén megjelenő kimeneti feszültség idő- és frekvenciatartománybeli képe.
Látható, hogy az eredeti alapsávi spektrum mellett a mintavevő frekvencia és annak felharmónikusai környezetében járulékos oldalsávok is megjelennek. Ha a mintavételi tételt nem tartjuk be, akkor az alapsáv és az fm mellett megjelenő alsó oldalsáv között átlapolódás jön létre (7. ábra). Az ebbe a tartományba eső rész eltorzul és többé már nem rekonstruálható.
A hangfrekvenciás jelek digitális feldolgozása a PCM technikán alapul (Pulse Code Modulation). Az analóg jeltől a PCM kódolású digitális jelig a 8. ábrán látható úton jutunk.
 

1.3.2. Bemeneti aluláteresztő szűrő

Feladata a bemenő analóg jel felső frekvenciahatárolása, hogy megfeleljen a mintavételi tételben megfogalmazott követelményeknek. Anti-aliasing szűrőnek is nevezik. Az anti-aliasing szűrővel szemben támasztott követelmények:

1.3.3. Mintavevő és -tartó áramkör

A sávhatárolt bemenő jel mintavételezését végzi. Elvi kapcsolási rajza a 9. ábrán látható. Az analóg kapcsolót a mintavevő jel vezérli. A kapcsoló zárt állapotában a kondenzátor a bemeneti feszültség pillanatnyi értékére töltődik fel, majd a kapcsoló nyit és a kondenzátorban a kapcsoló következő zárásáig tárolódik a feszültség minta.


 


Azt az időt amikor a kapcsoló zárt állapotban van nevezik mintavételi időnek, amikor pedig nyitva van az a tartási idő. A tartási idő alatt a kondenzátorban tárolt feszültség értéket a kvantáló áramkörnek fel kell dolgoznia. Ezalatt a kondenzátorban tárolt feszültség nem változhat meg. Természetesen vannak veszteségek. A kondenzátor nem képes egyik pillanatról a másikra feltöltődni - a kondenzátor feltöltődési idejét nevezik beállási időnek. Miután a kapcsoló nyit a kondenzátor az áramkör szórt ellenállásain keresztül igen lassan kisül. A mintavevő és -tartó áramkör minőségét a beállási idő és a kisülés határozzák meg (10. ábra).
A töltőellenállás - ami a vezetékek és a kapcsoló szórt ellenállásából tevődik össze - és a tároló kondenzátor aluláteresztő szűrőt alkot, ami befolyásolja a frekvenciamenetet.
 
1.3.4. A/D átalakítás (kvantálás)

A mintavevő és -tartó kimenetén megjelenő minták még végtelen sok értéket vehetnek fel. A kvantáló feladata a jel értékkészletének diszkrétté tétele. Azaz a végtelen sok értéket véges sok érték segítségével kell ábrázolnia, ugyanis csak meghatározott számú bináris adatszó áll rendelkezésre attól függően, hogy hány bitre kvantálunk. Általában 16 bites kvantálást alkalmaznak, ami 65536 amplitúdóérték megkülönböztetését jelenti. A kvantálót is a mintavevő jel vezérli.
A kvantálás lehet lineáris és nemlineáris. Az előbbi esetben a kvantálási lépcsők azonos nagyságúak. A jelben azonban sokkal gyakoribbak a kis amplitúdójú minták és így a kisebb helyiértékű bitek sokkal jobban kihasználtak. Emiatt a kvantálási bitek számát csökkentik és a bemeneti jelet egy dinamika kompresszorra vezetik, ami a jel dinamikáját lecsökkenti, így alkalmassá válik a kevesebb bittel történő ábrázolásra. Visszaalakítás során a jelet egy dekompresszoron vezetik keresztül, melynek karakterisztikája ellentétes a kompresszoréval, így az eredeti dinamika visszaállítható (11. ábra).Kialakításukat tekintve megkülönböztethetők integráló rendszerű és szukcesszív approximációs elven működő A/D átalakítók
Az A/D átalakítók hibái:


1.3.5. Kódolás
 

A kódolásra azért van szükség, mert az A/D átalakító kimenetén megjelenő bináris kódszavak csak a minta értékét adják meg, az előjeléről nem tartalmaznak információt. Általában kettes komplemens kódot alkalmaznak: a pozitív számokat normál bináris kóddal ábrázolják (LSB a jobb oldalon áll), a negatív számokat pedig az adott számérték kettes komplemensével. Egy szám kettes komplemense a szám bitenkénti invertálásával és +1 hozzáadásával képezhető. A következő példában 8 különböző amplitúdóértéket különböztetünk meg. Ehhez kettes komplemens kódban négy bitet alkalmaznak, mert az előjelet plusz egy biten - az MSB-n (Most Significant Bit = legnagyobb súlyú bit) ábrázolják. Nézzük pl. a 3 és a -3 kettes komplemens kódját:

3(10) = 0011(2)

-3(10) = inv0011(2) + 1 = 1100(2) + 1 = 1101(2)

Az előjelbit (MSB) pozitív számok esetén 0, negatív számok esetén pedig 1.
A kettes komplemens kódolású jel már a PCM jelnek felel meg. Ezt a jelet nevezik forráskódnak, magát a folyamatot pedig forráskódolásnak. A PCM jel az A/D átalakító kimenetén párhuzamos, vagy soros formában jelenik meg. Az egyes bitek között a jelszint a bitek értékétől függően a 0, vagy az 1 szinten marad. Ez az NRZ kódolás (Non Return to Zero).

1.3.6. Hibafelismerés, hibajavítás

A hibák detektálásának illetve javításának nagy szerepe van a megbízható digitális átvitel kialakításában. A digitális jel az átviteli csatornán ugyanúgy ki van téve a csatornát érő zavaró hatásoknak, mint az analóg jel. A különbség az, hogy amennyiben a digitális jel eltorzul (olyan mértékben, hogy a határolással nem állítható helyre az eredeti négyszögjel), akkor megváltozik az információtartalma. A hiba tulajdonképp egy vagy több bit invertálódását jelenti. A csatornát érő zavarimpulzusok - hosszuktól függően - több kódszót is tönkretehetnek. Ez az ún. burst error.
Ahhoz, hogy a hiba javítható legyen először is fel kell ismerni a hiba tényét, helyét és jellegét. Ezután az alkalmazott hibajavítási eljárástól függően újrakérik a hibás részt, vagy ha a hibafelismerő/-javító eljárás olyan, hogy önmagában is elegendő információt szolgáltat a hiba javításához, akkor a rendszer egyszerűen kijavítja a hibát.
Az elterjedt hibafelismerő és -javító eljárások:
Ezekről az eljárásokról részletesen ír Andrew S. Tannenbaum: Számítógépes hálózatok c. művében.
 
1.3.7. Hibaelfedés

Egyetlen hibajavító eljárás sem képes minden hiba kijavítására. A hibaelfedés pszihoakusztikai jellemzőkre épül. A hibák miatti hiányzó adatokat a hibás kódszava(ka)t megelőző és követő kódszavak magasabb rendű interpolálásával nyerik. Az így kapott kódszóval a hibás részt elfedik (maszkolás). Ha egymás után több kódszó is megsérül, akkor a hibaelfedés nem működik helyesen. A hatékonyság a kódszavak tér- és időbeli összekeverésével növelhető (interleaving). Így a kódszavak nem a keletkezésük sorrendjében továbbítódnak. A helyes sorrendet a dekódolás során vissza kell állítani. Az eljárás következtében nagyobb lesz a valószínűsége, hogy egy hibás kódszót hibátlan kódszavak fognak közre. Az interleaving eljárás egyik speciális formája a cross interleaving (14. ábra).

1.3.8. Csatornakódolás, csatornamoduláció

A forráskódolású jelet az átviteli csatorna jellemzőihez a csatornakódolás során illesztik. A csatornakódolásra két okból van szükség: egyrészt a csatornán felléphetnek zavarok, ami miatt meghibásodik az átvitt digitális jel. A csatornakódolás segítségével elősegíthető a hibák egyszerűbb javítása. A második ok a bitek megfelelő időben történő kiolvasása. Ha nem szinkron átvitelről van szó, akkor a csatornakódolású jelből elő kell tudni állítani az eredeti órajelet is, illetve az átvitt jel nem tartalmazhat egyenfeszültségű, vagy kisfrekvenciás összetevőket. Ezek a követelmények a forráskódolású jelbe való járulékos élátmenetek bejuttatásával elégíthetők ki.
A csatornakódok jellemzői:
                Tw = +/-1/2Tmin

1.4. A PCM jel visszaalakítása analóg hangfrekvenciás jellé

A PCM jelet időben és értékben újra folytonossá kell tenni. Ezt a következő úton valósítják meg: először D/A átalakító segítségével PAM (Pulse Amplitude Modulation) jelet hoznak létre. Ezután a PAM impulzusok szélességét mintavevő és -tartó segítségével megnövelik, végül egy aluláteresztő szűrő segítségével integrálással nyerik az erdeti analóg jelet. Az aluláteresztő szűrőnek az integrálás mellett még egy fontos szerepe van: a PCM jel PAM jellé alakítása a D/A átalakítóval egy újabb mintavételi folyamatot jelent és így az alapsávi spektrum mellett ismét megjelenik a zavaróspektrum, amit ki kell szűrni.
A bináris számsorokból álló PCM jel egyes kódszavaihoz a D/A átalakító az egyes kódszavak információtartalmával arányos feszültség értéket rendeli hozzá. A legkisebb feszültség értékét az átalakító áramköri felépítése határozza meg. A maximális kimeneti feszültség:
 
            Ukimax = ULSB * 2n

A D/A átalakítók felépítésük alapján lehetnek:
A D/A átalakítók esetében is felléphetnek a fent ismertetett hibák. Ezenkívül még a beállási idő jellemzi a D/A átalakítókat, ami azt adja meg, hogy mennyi idő kell ahhoz, hogy a D/A átalakító bemenetére adott jel átalakításakor a kimeneti feszültség +/-1/2 LSB pontossággal beálljon annak értékére.
A D/A átalakítóban áramgenerátor és a PCM jel által vezérelt félvezető kapcsolók segítségével történik a kódszavak feszültséggé alakítása. A kapcsolók nem egyidejű átkapcsolásának következménye az ún. glitche. Ez a beállási szakaszon látható zavarójel (19. ábra). Ezért a D/A átalakító kimeneti jelét glitchementesítő áramkörre vezetik, amelynek működése szintén a 19. ábrán látható. A glitchementesítő impulzus szélessége általában a mintavételi intervallum felével egyenlő.
A D/A átalakítók pontossága még az alkalmazott referenciafeszültség pontosságától is függ.
 

A következő részben a DAT rendszert vizsgáljuk meg, amely tömörítés nélküli audio adat rögzítésére képes.

Előző    Kezdőlap   Tartalomjegyzék   Következő