1. A digitális hangtechnika
alapjai
1.1. Digitális
hangjelek
A hiradástechnikában az átviendő, vagy rögzítendő
információ megjelenési formája a jel. Ezek elektromágneses jelek, mert csak
ezeket lehet elektronikus úton átvinni, illetve feldolgozni.
Matematikai osztályozás alapján léteznek:
- Analóg jelek.
- Lépcsős jelek (amplitúdóban diszkrétek).
- Mintavételezett jelek (időtartományban
diszkrétek).
- Digitális jelek.
1. táblázat: a különböző jelek tulajdonságai
Jel |
Értelmezési tartomány |
Értékkészlet |
Analóg |
folytonos |
folytonos |
Lépcsős |
folytonos |
diszkrét |
Mintavételezett |
diszkrét |
folytonos |
Digitális |
diszkrét |
diszkrét |
A digitális hangjelek eredeti forrása mindig
analóg jel. Az analóg jelből a digitalizálás során keletkezik a digitális jel. A
digitális jel az analóg jelből meghatározott időközönként vett mintákból áll. Az
egyes minták értékét bináris kódszavak tartalmazzák. Tehát a digitális
hangjeleket feldolgozó áramkörök digitálisak, azaz logikai áramkörökből és
tárolóelemekből állnak.
1.2. Az analóg és
a digitális hangjelfeldolgozás összehasonlítása
Először vizsgáljuk meg az
analóg hangátvitel folyamatát ! (1. ábra). Az erősítő a bemenetére
csatlakoztatott mikrofon jelét felerősíti és a kimenetére csatlakoztatott
hangszóróra továbbítja. A vázolt példában a mikrofon a jel forrása, az erősítő
az átviteli csatorna, a hangszóró pedig a fogyasztó. Teljesen mindegy, hogy
mennyire bonyolult úton jut el a jel a forrástól a fogyasztóig, ez a felbontás
mindig elvégezhető. Ebből a szempontból lényegtelen, hogy analóg, vagy digitális
jelfeldolgozásról van szó. Viszont fontos tudni, hogy az átviteli csatornának
vannak-e olyan tulajdonságai, amelyek befolyásolják az átvitt jelet. Mielőtt
tovább boncolnánk ezt a kérdést leszögezhetjük, hogy sajnos vannak ilyen
tulajdonságai az átviteli csatornának. Ezeken kívül felléphetnek még különböző
zavarójelek is.
1.2.1. Az átviteli csatorna
jellemzői
Jel-zaj viszony
Az átvitel során a csatornán mindig fellép
valamilyen zavaró hatás is, ami a fenti példában a hangszóróból áradó zajként
érzékelhető. A jel-zaj viszony a hasznos és a zavaró jel (zaj) aránya dB-ben (2.
ábra). A jel-zaj viszonyt lineáris frekvenciamenet és lezárt be- és kimenet
mellett mérik.
A zajt az átviteli csatornát felépítő aktív és
passzív alkatrészek hozzák létre. A zajfeszültség a hallható frekvenciatartomány
széles sávjában jelentkezik (fehér zaj: minden frekvencia megtalálható benne
csak különböző intenzítás értékekkel).
Dinamika
A kifogástalanul reprodukálható kimenő jel
maximális értékének és a még zajmentesnek érzékelt kimenő jel minimális
értékének aránya dB-ben. A dinamikát felülről a kivezérelhetőség, alulról a zaj
korlátozza.
Sávszélesség
Az átviteli csatorna sávszélességét
tekintve sávszűrő jellegű. A frekvencia növekedésével a hasznos jel amplitúdója
általában csökken, ezenkívül egyenfeszültségű, illetve kisfrekvenciás összetevők
átvitelére általában nincs lehetőség.
A sávszélesség az a frekvenciatartomány, amelyen
belül a kimenő jel értéke a vonatkoztatási frekvencián mért értékhez képest
maximum +/-3 dB-lel tér el (3. ábra).

Linearítás
Ideális átviteli csatorna esetén a bemeneti
jel a kimeneti jellel lineáris viszonyban van. Ellenkező esetben torzítás
keletkezik, amit nemlineáris torzításnak neveznek (4. ábra). A nemlineáris
torzításokat általában az aktív elemek görbült jelleggörbéi okozzák.
Harmónikustorzítás
Az átviteli csatorna kimenetén általában a
bemeneti jel bizonyos frekvencia összetevőinek felharmónikusai is megjelennek. A
torzítás mértékét a Klirr-faktor fejezi ki: a felharmónikusok effektív értékének
és a felharmónikusokkal terhelt kimeneti jel értékének hányadosa %-ban.
1.2.2. Az analóg átvitel
jellemzői
- A jel tartalmát (a jelentést) nem veszi
figyelembe.
- Az átvitel során a jel csillapodik, ezért
erősítőket kell alkalmazni.
- Az erősítők nem képesek a hasznos jel és a zaj
szétválasztására, így a zajt is erősítik, ami a J/Z viszony folyamatos
romlását idézi elő.
- Minél több erősítő fokozaton halad keresztül a
jel, annál torzultabb lesz. Analóg rendszerben azonban a torzulás nem biztos,
hogy információ veszteséget okoz.
1.2.3. A digitális
hangjelfeldolgozás előnyei és hátrányai
Az egyik legnagyobb előny, hogy a
zavarójelek a digitális jel durva H/L struktúráját nem tudják olyan könnyen
megzavarni, mint analóg átvitel során. A zavarófeszültséggel terhelt digitális
jelből egyszerű határolással visszaállítható az eredeti négyszögjel (5. ábra).
Így a csatornából származó zaj kiszűrhető, emiatt pedig a J/Z viszony is jobb:
általában a 90 dB-t is meghaladja. A fentiek következménye, hogy másolatok
készítése esetén a másolat minősége az eredetiével megegyező.
Hátrányok:
- A digitális jel érzékeny az adatvesztésre és a
hibák javítása nem egyszerű feladat a fogyasztói oldalon.
- A digitális jelfeldolgozó áramkörök
bonyolultabbak.
- Az áramkörök túlvezérlése a digitális jel
teljes összeomlásához vezet.
Fontos, hogy a 90 dB-es érték a rendszerdinamika
és nem tévesztendő össze a hangfrekvenciás jel dinamika értékével, vagyis a
leghangosabb és leghalkabb hangok közötti különbséggel.
1.3. A
digitalizálás folyamata
1.3.1. A mintavételi
tétel
C. E. Shannon 1948-as munkájában kifejti,
hogy a mintavétellel nyert diszkrét mintákból álló impulzussorozat
információtartalma megegyezik az eredeti, időben folytonos analóg jel
információtartalmával. Ez viszont csak bizonyos feltételek érvényesülése esetén
igaz. Ezeket a feltételeket a Shannon-féle mintavételi tétel tartalmazza: a
mintavételezett jelből akkor állítható vissza információ veszteség nélkül az
eredeti analóg jel, ha a mintavételi frekvencia (fm) legalább
kétszerese az analóg jelben előforduló legmagasabb frekvenciának
(fmax). A mintavételi frekvencia értékének állandónak kell lennie.
Képlettel:
fm >= 2fmax
Az fmax frekvenciát
Nyquist-frekvenciának is nevezik.

Ha nem tartjuk be a mintavételi tételt, akkor a
kimeneti jelben ún. gyűrődési torzítások keletkeznek (aliasing). A 6. ábrán
látható a mintavevő és -tartó áramkör kimenetén megjelenő kimeneti feszültség
idő- és frekvenciatartománybeli képe.
Látható, hogy az eredeti alapsávi spektrum
mellett a mintavevő frekvencia és annak felharmónikusai környezetében járulékos
oldalsávok is megjelennek. Ha a mintavételi tételt nem tartjuk be, akkor az
alapsáv és az fm mellett megjelenő alsó oldalsáv között átlapolódás
jön létre (7. ábra). Az ebbe a tartományba eső rész eltorzul és többé már nem
rekonstruálható.
A hangfrekvenciás jelek digitális feldolgozása a
PCM technikán alapul (Pulse Code Modulation). Az analóg jeltől a PCM kódolású
digitális jelig a 8. ábrán látható úton jutunk.

1.3.2. Bemeneti aluláteresztő
szűrő
Feladata a bemenő analóg jel felső
frekvenciahatárolása, hogy megfeleljen a mintavételi tételben megfogalmazott
követelményeknek. Anti-aliasing szűrőnek is nevezik. Az anti-aliasing szűrővel
szemben támasztott követelmények:
- Vízszintes átviteli karakterisztika egészen a
felső határfrekvenciáig.
- Meredek átmenet az áteresztő tartományból a
zárótartományba.
- Az fmax frekvencia fölött min. 80
dB-es csillapítás.
- Kis harmónikus torzítás.
- Kis tranziens idő.
- Kis fázistorzítás.
- Kis csoportfutási idő.
- Az egész digitális rendszernél kisebb saját
zaj.
1.3.3. Mintavevő és -tartó
áramkör
A sávhatárolt bemenő jel mintavételezését
végzi. Elvi kapcsolási rajza a 9. ábrán látható. Az analóg kapcsolót a mintavevő
jel vezérli. A kapcsoló zárt állapotában a kondenzátor a bemeneti feszültség
pillanatnyi értékére töltődik fel, majd a kapcsoló nyit és a kondenzátorban a
kapcsoló következő zárásáig tárolódik a feszültség minta.

Azt az időt amikor a kapcsoló zárt állapotban van
nevezik mintavételi időnek, amikor pedig nyitva van az a tartási idő. A tartási
idő alatt a kondenzátorban tárolt feszültség értéket a kvantáló áramkörnek fel
kell dolgoznia. Ezalatt a kondenzátorban tárolt feszültség nem változhat meg.
Természetesen vannak veszteségek. A kondenzátor nem képes egyik pillanatról a
másikra feltöltődni - a kondenzátor feltöltődési idejét nevezik beállási időnek.
Miután a kapcsoló nyit a kondenzátor az áramkör szórt ellenállásain keresztül
igen lassan kisül. A mintavevő és -tartó áramkör minőségét a beállási idő és a
kisülés határozzák meg (10. ábra).
A töltőellenállás - ami a vezetékek és a
kapcsoló szórt ellenállásából tevődik össze - és a tároló kondenzátor
aluláteresztő szűrőt alkot, ami befolyásolja a frekvenciamenetet.
1.3.4. A/D átalakítás
(kvantálás)
A mintavevő és -tartó kimenetén megjelenő
minták még végtelen sok értéket vehetnek fel. A kvantáló feladata a jel
értékkészletének diszkrétté tétele. Azaz a végtelen sok értéket véges sok érték
segítségével kell ábrázolnia, ugyanis csak meghatározott számú bináris adatszó
áll rendelkezésre attól függően, hogy hány bitre kvantálunk. Általában 16 bites
kvantálást alkalmaznak, ami 65536 amplitúdóérték megkülönböztetését jelenti. A
kvantálót is a mintavevő jel vezérli.
A kvantálás lehet lineáris és nemlineáris. Az
előbbi esetben a kvantálási lépcsők azonos nagyságúak. A jelben azonban sokkal
gyakoribbak a kis amplitúdójú minták és így a kisebb helyiértékű bitek sokkal
jobban kihasználtak. Emiatt a kvantálási bitek számát csökkentik és a bemeneti
jelet egy dinamika kompresszorra vezetik, ami a jel dinamikáját lecsökkenti, így
alkalmassá válik a kevesebb bittel történő ábrázolásra. Visszaalakítás során a
jelet egy dekompresszoron vezetik keresztül, melynek karakterisztikája
ellentétes a kompresszoréval, így az eredeti dinamika visszaállítható (11.
ábra).Kialakításukat tekintve megkülönböztethetők integráló rendszerű és
szukcesszív approximációs elven működő A/D átalakítók

Az A/D átalakítók
hibái:
Kvantálási zaj: mivel a kvantáló csak
véges számú értéket különböztet meg, a végtelen sok értéket felvehető minta
értéke esetleg két kvantálási szint közé esik. Ebben az esetben a kvantáló
dönti el, hogy a minta melyik szinthez tartozik, azaz +/-1/2 lépésköznyi hibát
visz be a jelbe. Ezt a hibát nevezik kvantálási zajnak.
Granulációs zaj: ha a kvantálásra
kerülő jel amplitúdója olyan kicsi, hogy jellemzéséhez az LSB (Least
Significant Bit = legkisebb súlyú bit) is elegendő, akkor a szinuszjel
négyszögjellé torzul. A négyszögjel azonban minden frekvencia összetevőt
tartalmaz, így tartalmazhat olyan összetevőket is amelyek miatt aliasing jön
létre. Ez a torzítás sokkal erősebben érzékelhető, mint a nemlineáris
torzítás. A granulációs torzítás értéke az amplitúdó csökkentésével
növekszik.
Linearitási hiba: ideális esetben az
A/D átalakítók karakterisztikája lineáris, azaz lineárisan növekvő bemeneti
feszültség esetén az A/D átalakítóhoz csatlakoztatott D/A átalakító kimenetén
egyenletes lépcsőzésű jel jelenik meg. Az egyenletes lépcsőzéstől való eltérés
az abszolút nemlinearítás, az ideális karakterisztikától való két mintavételi
érték közötti eltérés pedig a differenciális nemlinearítás. Mindkettőt az LSB
sokszorosaként, vagy töredékeként adják meg (12.ábra).
Monotonításhiba: a lineárisan növekvő
bemenő jel ellenére a D/A átalakító kimenetén a lépcsős jel folytonossága
megszakad (13. ábra). Nagy torzítást okoz.
Ofszethiba: az egyenfeszültségi szint
eltolódása. Hatására az A/D átalakító kimenetén is eltolódnak a bináris
értékek, illetve lecsökken a kivezérelhetőségi tartomány. Az alkalmazott
műveleti erősítők pontos beállításával kiküszöbölhető.
Túlvezérlési hiba: az A/D átalakító
túlvezérlése esetén a kimenetén vagy a maximális érték jelenik meg, vagy annak
komplemense. Ebben az esetben az A/D átalakító teljesen meghamisítja a
bemeneti jelet.


1.3.5. Kódolás
A kódolásra azért van szükség, mert az A/D
átalakító kimenetén megjelenő bináris kódszavak csak a minta értékét adják meg,
az előjeléről nem tartalmaznak információt. Általában kettes komplemens kódot
alkalmaznak: a pozitív számokat normál bináris kóddal ábrázolják (LSB a jobb
oldalon áll), a negatív számokat pedig az adott számérték kettes komplemensével.
Egy szám kettes komplemense a szám bitenkénti invertálásával és +1 hozzáadásával
képezhető. A következő példában 8 különböző amplitúdóértéket különböztetünk meg.
Ehhez kettes komplemens kódban négy bitet alkalmaznak, mert az előjelet plusz
egy biten - az MSB-n (Most Significant Bit = legnagyobb súlyú bit) ábrázolják.
Nézzük pl. a 3 és a -3 kettes komplemens kódját:
3(10) = 0011(2)
-3(10) = inv0011(2) +
1 = 1100(2) + 1 = 1101(2)
Az előjelbit (MSB) pozitív számok esetén 0,
negatív számok esetén pedig 1.
A kettes komplemens kódolású jel már a PCM
jelnek felel meg. Ezt a jelet nevezik forráskódnak, magát a folyamatot pedig
forráskódolásnak. A PCM jel az A/D átalakító kimenetén párhuzamos, vagy soros
formában jelenik meg. Az egyes bitek között a jelszint a bitek értékétől függően
a 0, vagy az 1 szinten marad. Ez az NRZ kódolás (Non Return to Zero).
1.3.6. Hibafelismerés,
hibajavítás
A hibák detektálásának illetve javításának
nagy szerepe van a megbízható digitális átvitel kialakításában. A digitális jel
az átviteli csatornán ugyanúgy ki van téve a csatornát érő zavaró hatásoknak,
mint az analóg jel. A különbség az, hogy amennyiben a digitális jel eltorzul
(olyan mértékben, hogy a határolással nem állítható helyre az eredeti
négyszögjel), akkor megváltozik az információtartalma. A hiba tulajdonképp egy
vagy több bit invertálódását jelenti. A csatornát érő zavarimpulzusok -
hosszuktól függően - több kódszót is tönkretehetnek. Ez az ún. burst
error.
Ahhoz, hogy a hiba javítható legyen először is
fel kell ismerni a hiba tényét, helyét és jellegét. Ezután az alkalmazott
hibajavítási eljárástól függően újrakérik a hibás részt, vagy ha a
hibafelismerő/-javító eljárás olyan, hogy önmagában is elegendő információt
szolgáltat a hiba javításához, akkor a rendszer egyszerűen kijavítja a
hibát.
Az elterjedt hibafelismerő és -javító
eljárások:
- Paritásbit.
- Hosszirányú redundancia ellenőrzés (LRC =
Longitudinal Redundancy Check). Az egyszerű paritásbites eljárás
továbbfejlesztése.
- Ciklikus redundancia ellenőrzés (CRC = Cyclic
RC).
Ezekről az eljárásokról részletesen ír Andrew S.
Tannenbaum: Számítógépes hálózatok c. művében.
Egyetlen hibajavító eljárás sem képes
minden hiba kijavítására. A hibaelfedés pszihoakusztikai jellemzőkre épül. A
hibák miatti hiányzó adatokat a hibás kódszava(ka)t megelőző és követő kódszavak
magasabb rendű interpolálásával nyerik. Az így kapott kódszóval a hibás részt
elfedik (maszkolás). Ha egymás után több kódszó is megsérül, akkor a hibaelfedés
nem működik helyesen. A hatékonyság a kódszavak tér- és időbeli összekeverésével
növelhető (interleaving). Így a kódszavak nem a keletkezésük sorrendjében
továbbítódnak. A helyes sorrendet a dekódolás során vissza kell állítani. Az
eljárás következtében nagyobb lesz a valószínűsége, hogy egy hibás kódszót
hibátlan kódszavak fognak közre. Az interleaving eljárás egyik speciális formája
a cross interleaving (14. ábra).
1.3.8.
Csatornakódolás, csatornamoduláció
A forráskódolású jelet az átviteli csatorna
jellemzőihez a csatornakódolás során illesztik. A csatornakódolásra két okból
van szükség: egyrészt a csatornán felléphetnek zavarok, ami miatt meghibásodik
az átvitt digitális jel. A csatornakódolás segítségével elősegíthető a hibák
egyszerűbb javítása. A második ok a bitek megfelelő időben történő kiolvasása.
Ha nem szinkron átvitelről van szó, akkor a csatornakódolású jelből elő kell
tudni állítani az eredeti órajelet is, illetve az átvitt jel nem tartalmazhat
egyenfeszültségű, vagy kisfrekvenciás összetevőket. Ezek a követelmények a
forráskódolású jelbe való járulékos élátmenetek bejuttatásával elégíthetők
ki.
A csatornakódok jellemzői:
- Futási hossz (T): két szintváltozás közötti távolság bitekben. Az előre
definiált futási hosszal rendelkező kódok az ún. RLL kódok (Run Length
Limited). Az RLL kódok a két élváltozás közötti minimális (Tmin) és
maximális (Tmax) futási hosszal jellemezhetők (15. ábra).

- Jitter margin (fázishiba - Tw): egy intervallumot (időablakot)
jelöl ki. Soros adatjel kiértékelésénél van jelentősége. A jitteres jelet az
órajelnek megfelelő ütemben olvassák ki. Ha a jitter egy bizonyos szint fölé
emelkedik, akkor a biteket hibásan detektálják (16. ábra). Az a tartomány,
amin belül a detektálás még biztosan helyesen történik a jitter margin. Egy
bit kifogástalan kiértékeléséhez a Tmin-től függő idő áll
rendelkezésre:
T
w = +/-1/2T
min
- DSV (Digital Sum Value): a csatornakód egyenfeszültségű komponensére
jellemző összeg. A H szintű biteket +1-el, az L szintűeket -1-el helyettesítve
minden bitet összeadnak - ez a DSV. Amennyiben ez 0, akkor a jel nem tartalmaz
DC összetevőt.
- Szemábra: a szintingadozások, jitterhibák és egyéb zavarok, zajok miatt a
csatornakódolt jel eltorzítva jelenik meg az átviteli csatorna kimenetén (17.
ábra). Ha ezt a jelet egy oszcilloszkóp függőleges bemenetére vezetjük, és a
vizszintes bemenetet az órajellel hajtjuk meg, akkor kapjuk a szemábrát (18.
ábra). A szemábrán Tw-nek két jelszintátmenet közötti távolság
felel meg. A maximális szemnyílás jelenti a maximális amplítúdót. Vizszintes
irányban a növekvő fázishiba korlátozza a szemnyílást.
1.4. A PCM jel
visszaalakítása analóg hangfrekvenciás jellé
A PCM jelet időben és értékben újra
folytonossá kell tenni. Ezt a következő úton valósítják meg: először D/A
átalakító segítségével PAM (Pulse Amplitude Modulation) jelet hoznak létre.
Ezután a PAM impulzusok szélességét mintavevő és -tartó segítségével megnövelik,
végül egy aluláteresztő szűrő segítségével integrálással nyerik az erdeti analóg
jelet. Az aluláteresztő szűrőnek az integrálás mellett még egy fontos szerepe
van: a PCM jel PAM jellé alakítása a D/A átalakítóval egy újabb mintavételi
folyamatot jelent és így az alapsávi spektrum mellett ismét megjelenik a
zavaróspektrum, amit ki kell szűrni.
A bináris számsorokból álló PCM jel egyes
kódszavaihoz a D/A átalakító az egyes kódszavak információtartalmával arányos
feszültség értéket rendeli hozzá. A legkisebb feszültség értékét az átalakító
áramköri felépítése határozza meg. A maximális kimeneti feszültség:
Ukimax = ULSB * 2n
A D/A átalakítók felépítésük alapján
lehetnek:
- létrahálózatot alkalmazó passzív áramosztósak.
- aktív áramosztósak
- integráló rendszerűek
A D/A átalakítók esetében is felléphetnek a fent
ismertetett hibák. Ezenkívül még a beállási idő jellemzi a D/A átalakítókat, ami
azt adja meg, hogy mennyi idő kell ahhoz, hogy a D/A átalakító bemenetére adott
jel átalakításakor a kimeneti feszültség +/-1/2 LSB pontossággal beálljon annak
értékére.
A D/A átalakítóban áramgenerátor és a PCM jel
által vezérelt félvezető kapcsolók segítségével történik a kódszavak
feszültséggé alakítása. A kapcsolók nem egyidejű átkapcsolásának következménye
az ún. glitche. Ez a beállási szakaszon látható zavarójel (19. ábra). Ezért a
D/A átalakító kimeneti jelét glitchementesítő áramkörre vezetik, amelynek
működése szintén a 19. ábrán látható. A glitchementesítő impulzus szélessége
általában a mintavételi intervallum felével egyenlő.
A D/A átalakítók pontossága még az alkalmazott
referenciafeszültség pontosságától is függ.