Ugrás a tartalomhoz

Hangdizájn, hangszintézis és hangátalakítás

Szigetvári Andrea, Siska Ádám (2014)

Typotex Kiadó

Hangdizájn, hangszintézis és hangátalakítás

Hangdizájn, hangszintézis és hangátalakítás

Szigetvári Andrea

Siska Ádám


Tartalom

Bevezetés
1. A hangszín fogalma, a multidimenzionális hangszíntér
Elmélet
Illusztráció
Feladatok
2. Hullámforma-ismétlés
Elmélet
Mintavételezés
Generálás
Megvalósítás
Összegzés
Feladatok
Függelék
3. Additív szintézis
Elmélet
Megvalósítás
Összegzés
Feladatok
Függelék
4. Szubtraktív szintézis
Elmélet
Forrásjelek
Szűrőtípusok
Megvalósítás
Összegzés
Feladatok
Függelék
5. Granuláris szintézis
Elmélet
Megvalósítás
Összegzés
Feladatok
Függelék
6. Fizikai modellezés
Elmélet
Megvalósítás
Összegzés
Feladatok
Függelék
7. Formáns szintézis
Elmélet
A formánsok
A magánhangzók képzése
Megvalósítás
Formáns szintézis szűrőkkel
Additív formáns szintézis
Összegzés
Feladatok
8. Modulációs technikák I: amplitúdó- és ringmoduláció
Elmélet
A folyamat
A spektrum és a hangszín
Megvalósítás
Összegzés
Feladatok
Függelék
9. Modulációs technikák II: frekvencia-moduláció
Elmélet
A folyamat
A spektrum és a hangszín
Álfrekvenciák keletkezése
Megvalósítás
Összegzés
Feladatok
Függelék
10. Spektrumanalízis
Elmélet
Megvalósítás
Összegzés
Feladatok
11. Reszintézis és alkalmazásai: transzpozíció, nyújtás, szűrés, keresztszintézis
Elmélet
Reszintézis
Nyújtás
Transzponálás
Spektrális szűrés
Keresztszintézis
Megvalósítás
Összegzés
Feladatok
12. Jelfeldolgozás I: késleltetésen alapuló eszközök
Elmélet
Szűrés vagy késleltetés?
Flanger, fázistoló
Elhangolás, vibrato
Kórus
Megvalósítás
Összegzés
Feladatok
13. Jelfeldolgozás II: torzítók
Elmélet
Jelalak-torzítás
Kvantálási torzítás
Megvalósítás
Összegzés
Feladatok
14. Jelfeldolgozás III: kompresszálás, zengetés
Elmélet
Kompresszálás
Zengetés
Megvalósítás
Összegzés
Feladatok
Függelék
15. Multidimenzionális hangszínvektorok
Elmélet
Hangszínvektorok
Pontok, trajektóriák, kombinációk
Megvalósítás
Összegzés
Feladatok
Irodalomjegyzék

Az ábrák listája

1.1. Szinuszos rezgés. Az egyensúlyi helyzettől való kitérés az idő függvényében (bal), illetve a szinuszos rezgés spektruma (jobb). A szinuszos rezgést az 1.4. hangpélda mutatja be.
1.2. Egy zenekari hang spektruma (a hangot az 1.5. hangpélda tartalmazza). Az egyes szinuszos rezgések amplitúdóját a függőleges, frekvenciáját a vízszintes tengely mutatja.
1.3. Egy zenekari részletről készített szonogram (a hangot az 1.6. hangpélda tartalmazza). A függőleges tengely a frekvenciát (hertz), a vízszintes az időt (másodperc) mutatja. A pillanatnyi spektrumot (az adott frekvenciák pillanatnyi erősségét a hangban) az alkalmazott kék-piros színskála érzékelteti.
1.4. HApp_01_01 (OSX) : Alapok. A nagy kijelző az éppen hallott hang szonogramját, az alatta levő pedig a pillanatnyi spektrumát mutatja. A szonogram, illetve a spektrum teteje és alja szabadon állítható.
1.5. HApp_01_01 (OSX) : Burkológörbék. Szakaszos üzemmódban a hang amplitúdóját tudjuk a burkológörbével szabályozni.
1.6. HApp_01_01 (OSX) : Hangszínváltozás. A két hangszín ("1"-es és "2"-es) egy szinuszos hang, illetve egy fúvós hangszer hangszíne. A csúszkával tudjuk szabályozni az átmenetet e két hangszín között.
2.1. Fuvola hangjának részlete. A hang periodikus jellege jól látszik. Figyeljük meg, hogy az egyes periódusok nem teljesen egyformák! Ezen apró fluktuációk miatt halljuk a hangot természetesnek, organikusnak.
2.2. Különböző forrásjelek hullámformái (bal) és spektrumai (jobb). Fentről lefelé: háromszögjel (2.1. hangpélda), fűrészfogjel (2.2. hangpélda), négyszögjel (2.3. hangpélda) és impulzussorozat (2.4. hangpélda). A spektrumokat L0=55 dB-re normáltuk. Az impulzussorozat hullámformája és spektruma δ-függő; ezen az ábrán δ=0,1.
2.3. Hullámforma-ismétlés háromszögjelből felépítve. Hasonlóan működik a program a Szinusz és a Fűrészfog opciók esetén is. A bal oldalon megjelenő formula azt definiálja, hogy (egyetlen, egységnyi időtartamú periódus esetén) az amplitúdó hogyan függ az időtől.
2.4. Szabadon szerkeszthető hullámforma. A bal oldali panel segítségével készíthetjük el saját hullámformánkat.
2.5. Hullámforma létrehozása szinuszok összeadásával. Figyeljük meg, hogy a nem-egész arányok következtében a kapott hullámforma a periódus végén megszakad, emiatt a hangban lesz egy kattanás, torzulás. A szonogramban így sokkal több szinusz jelenik meg, mint amennyit az összeadáshoz felhasználtunk.
2.6. Mintavételezett hullámforma létrehozása.
3.1. Additív szintetizátor sematikus modellje, ahol minden oszcillátor (időben változó) frekvenciája és amplitúdója egyedileg szabályozható.
3.2. Egy trombitahang spektrális összetevőinek burkológörbéi.
3.3. Nyolc csatornás additív szintetizátor. A csatornák időtartam-, frekvencia- és amplitúdó-arányai, valamint amplitúdó-burkológörbéi egyedileg szabályozhatóak.
3.4. Negyvennyolc csatornás additív szintetizátor.
3.5. A frekvencia-arányok megadását szolgáló modul.
3.6. A komponensek időtartamait meghatározó szerkesztőfelület.
4.1. Fehérzaj (bal) és rózsazaj (jobb) jellemző spektrumai. Logaritmikus frekvencia-ábrázolás mellett (ekkor az azonos vízszintes távolság azonos hangköznek felel meg) jól látható, hogy míg a frekvenciák amplitúdója fehérzaj esetén gyakorlatilag állandó, a rózsazajban az amplitúdók csökkenő tendenciát követnek (oktávonként 3 dB esést).
4.2. A legfontosabb szűrőtípusok idealizált amplitúdó-karakterisztikái. Felső sor (balról jobbra): aluláteresztő, felüláteresztő, sáváteresztő, sávzáró; alsó sor (balról jobbra): low-shelf, high-shelf, mindent áteresztő. fc (típustól függően) a levágási- vagy a középfrekvenciát, míg b a sávszélességet jelöli. A valóságban a karakterisztikák levágása sosem végtelenül éles; a levágási tartomány meredeksége fontos jellemzője az adott szűrő minőségének. A mindent áteresztő szűrő esetén (mivel amplitúdó-karakterisztikája teljesen vízszintes) feltüntettük a fázis-karakterisztikát is.
4.3. Fehérzaj szűrése több lépcsőben. A felhasznált alapszűrő egy sáváteresztő karakterisztikájú, 1 000 Hz középfrekvenciájú, 100 Hz sávszélességű szűrő. Az egyes lépésekben rendre 1, 2, 3 és 4 ilyen szűrőt kapcsoltunk össze soros elrendezésben. A szonogram függőleges tengelyén a frekvencia (Hz), vízszintes tengelyén az idő (másodperc) szerepel. Az eredményt a 4.3. hangpélda tartalmazza.
4.4. A HApp_03_01 példaprogram. A jobb oldali szűrővel különböző forrásokat szűrhetünk.
4.5. Burkológörbével modulálható paraméter. A jobb felső "Burkoló" kapcsoló kikapcsolt állapotában a paramétert a bal felső számdoboz határozza meg. Bekapcsolt állapotban a bal felső számdobozban megadott konstans szorzódik a burkológörbével. Utóbbi értékei mindig 0 és 1 közé esnek.
4.6. Fehérzajt szűrő nyolcsávos ekvalizátor.
5.1. Három különböző hangszemcse. A szaggatott vonalak az amplitúdó-burkológörbéket mutatják, amiket a szemcsék "kivágásához" használtunk (e burkológörbéket a gyakorlatban valamilyen ablakfüggvénynek – lásd a 10. fejezetet – szokás választani). A két felső szemcsét szinuszos hangból generáltuk, a kettő közti hangszínkülönbség az eltérő belső szerkezetből, pontosabban, az oszcillációk eltérő számából adódik (lásd az 5.1. és az 5.2. hangpéldákat). A lenti szemcsét egy zajforrással hoztuk létre (lásd az 5.3. hangpéldát).
5.2. Egy granuláris szintetizátor kezelőfelülete. A program a szemcséket egy hangfile-ból vágja ki.
5.3. Grafikus adatbevitel. A két tengelyen a két szabályozni kívánt paraméter szerepel, melyeket legördülő listákból válaszhatunk ki. A rajzolt gesztust felvehetjük, illetve visszajátszhatjuk.
6.1. Tömegpont-rugó modell. Az ábrán a bal oldali tömegpont kitérített állapotban van, a modellezés során lépésenként modellezzük, hogy e kezdeti kitérés hatására hogyan mozog a teljes rendszer.
6.2. Körszimmetrikus (bal) és hasábos (jobb) alrendszerek. A modális szintézis során ilyen alrendszerek kollektív rezgéseit vizsgáljuk.
6.3. Egy szabálytalan cső közelítése hengeres hullámvezetőkkel: az eredeti, komplex cső (a) és a hullámvezető-modell (b).
6.4. Egy fúvós hangszer (klarinét) nagyon egyszerű modellje. A fúvókának egy zajszerű gerjesztés, a csőnek különböző késleltetők, míg a hanglyuknak és a tölcsérnek egy keverő és egy szűrő felel meg.
6.5. Karplus–Strong algoritmus Max programnyelven. A példát a HApp_06_01(OSX)(WIN) program tartalmazza.
6.6. A CCRMA által fejlesztett TBone kezelőfelülete. A szoftver rézfúvós hangszerek (elsősorban harsona és trombita) modellezésére alkalmas.
7.1. Egy "a" magánhangzó spektrumának alsó tartománya. Figyeljük meg, ahogy a legjellemzőbb formánsok kiemelkednek a spektrumból.
7.2. Egy "sz" mássalhangzó spektrumának alsó tartománya. Láthatjuk, hogy ez a spektrum nem jellemezhető pusztán néhány csúcs megadásával.
7.3. A tüdőkből kiáramló levegő, illetve a garaton (hangszálak, hangrés) áthaladó légoszlop nyomásának vázlatos képe az idő függvényében.
7.4. Tenor énekesek által énekelt "a" magánhangzó legjellemzőbb formánsai.
7.5. Ekvalizátorral megvalósított formáns szintézis blokkdiagramja.
7.6. HApp_07_01(OSX)(WIN): Formáns szintézis szűrőkkel.
7.7. HApp_07_02(OSX)(WIN): általános FOF-szintézis. A három panel eltérő módokon hoz létre formánsokat.
7.8. HApp_07_03(OSX): FOF-szintézis. Először a jobb felső legördülő listából kiválasztunk egy tetszőleges magánhangzót, majd az egyes szintézis-paraméterek (hanghossz, alapfrekvencia, skirt factor, maximális szemcseszám, levágási hangerő), valamint a kimeneti hangerő beállítása után a bal felső gomb megnyomásával hallhatjuk a szintézis eredményét. Az egyes formánsokat a jobb felső sarokban levő táblázat mutatja be, míg a jobb alsó részen levő oszcilloszkóp a szintetizált jel időbeli lefutását mutatja meg. A 7.3. hangpéldát ezzel a programmal hoztuk létre.
7.9. Az (7.1) egyenlet által leírt függvény. A kék vonal az α által megszabott exponenciális esést, a piros vonal a β által szabályozott koszinuszos indítást mutatja. A két görbe Az () egyenlet által leírt függvény. A kék vonal az α által megszabott exponenciális esést, a piros vonal a β által szabályozott koszinuszos indítást mutatja. A két görbe t=\frac{π}{β} -nál találkozik. A végeredményt (a modulált szinuszhullámot) a fekete jel ábrázolja. -nál találkozik. A végeredményt (a modulált szinuszhullámot) a fekete jel ábrázolja.
7.10. A FOF-szintézis folyamata. Az alapfrekvencia által diktált pillanatokban egy-egy új hullámot generálunk (ezeket mutatják az egymás fölé helyezett formánshullámok), az így kapott hullámformákat pedig összeadjuk. Amint az ábrán is látható, általában az egyes alap-hullámformák később érnek véget, mint amikor a következő visszajátszás kezdődik, így "többszörös kiolvasással" kell élnünk.
7.11. HApp_07_04(OSX): FOF-szintézis interpolációval. Először beállítjuk a bal felső számdobozban a magánhangzók számát, majd az egyes legördülő listákból kiválasztunk egy-egy tetszőleges hangzót. A szintézis-paraméterek (alapfrekvencia, skirt factor, maximális szemcseszám, levágási hangerő) és a kimeneti hangerő beállítása után kiválasztjuk a kívánt üzemmódot (impulzusvezérelt, illetve folytonos). Impulzusüzemmódban az indítógomb megnyomásával, folytonos üzemmódban az interpolációs csúszka állításával hallhatjuk a szintézis eredményét. A jobb alsó részen levő oszcilloszkóp a szintetizált jel időbeli lefutását mutatja meg.
8.1. Az amplitúdó- (a) és ringmoduláció (b) folyamatábrái.
8.2. Az amplitúdó- (a) és ringmoduláció (b) spektruma.
8.3. Amplitúdó-moduláció komplex vivőhullámmal.
8.4. Amplitúdó-moduláció Max programnyelven (HApp_08_01(OSX)(WIN)).
8.5. Amplitúdó-moduláció Max programnyelven.
9.1. A frekvencia-moduláció folyamatábrája.
9.2. Frekvencia-deviáció a modulálójel amplitúdójának függvényében.
9.3. Oldalfrekvenciák megjelenése.
9.4. A hordozójel és az első három oldalfrekvencia amplitúdójához tartozó Bessel-függvény. A fekete vonal a 0., a kék az 1., a piros a 2., a zöld a 3. elsőfajú Bessel-függvényt mutatja.
9.5. A modulációs index hatása a spektrum szélességére. Mindkét esetben fc=1210 Hz és fm=110 Hz (vagyis A modulációs index hatása a spektrum szélességére. Mindkét esetben fc=1210 Hz és fm=110 Hz (vagyis H=\frac{1}{11} , a hang harmonikus), azonban míg a bal oldali ábrán I=3, a jobb oldalin I=10. A két hangot a 9.2. (bal oldali spektrum) és a 9.3. (jobb oldali spektrum) hangpéldák tartalmazzák. , a hang harmonikus), azonban míg a bal oldali ábrán I=3, a jobb oldalin I=10. A két hangot a 9.2. (bal oldali spektrum) és a 9.3. (jobb oldali spektrum) hangpéldák tartalmazzák.
9.6. Harmonikus (bal) és inharmonikus (jobb) spektrumok. A bal oldali ábrán Harmonikus (bal) és inharmonikus (jobb) spektrumok. A bal oldali ábrán H=\frac{f_m}{f_c}=\frac{348 \textrm{Hz}}{1218 \textrm{Hz}} , melynek tovább nem egyszerűsíthető alakja \frac{p}{q}=\frac{2}{7} ; az alaphangra ebből f0=174 Hz adódik, hiszen ekkor 2f0=fm és 7f0=fc is teljesül. A jobb oldali ábrán H=\frac{f_m}{f_c}=\frac{121 \textrm{Hz}}{784 \textrm{Hz}}\approx\frac{\sqrt{5}-1}{8} , ami irracionális, így a spektrumhoz nem tartozik egyértelmű alaphang. A két hangot a 9.4. (harmonikus) és a 9.5. (inharmonikus) hangpéldák tartalmazzák. , melynek tovább nem egyszerűsíthető alakja Harmonikus (bal) és inharmonikus (jobb) spektrumok. A bal oldali ábrán H=\frac{f_m}{f_c}=\frac{348 \textrm{Hz}}{1218 \textrm{Hz}} , melynek tovább nem egyszerűsíthető alakja \frac{p}{q}=\frac{2}{7} ; az alaphangra ebből f0=174 Hz adódik, hiszen ekkor 2f0=fm és 7f0=fc is teljesül. A jobb oldali ábrán H=\frac{f_m}{f_c}=\frac{121 \textrm{Hz}}{784 \textrm{Hz}}\approx\frac{\sqrt{5}-1}{8} , ami irracionális, így a spektrumhoz nem tartozik egyértelmű alaphang. A két hangot a 9.4. (harmonikus) és a 9.5. (inharmonikus) hangpéldák tartalmazzák. ; az alaphangra ebből f0=174 Hz adódik, hiszen ekkor 2f0=fm és 7f0=fc is teljesül. A jobb oldali ábrán Harmonikus (bal) és inharmonikus (jobb) spektrumok. A bal oldali ábrán H=\frac{f_m}{f_c}=\frac{348 \textrm{Hz}}{1218 \textrm{Hz}} , melynek tovább nem egyszerűsíthető alakja \frac{p}{q}=\frac{2}{7} ; az alaphangra ebből f0=174 Hz adódik, hiszen ekkor 2f0=fm és 7f0=fc is teljesül. A jobb oldali ábrán H=\frac{f_m}{f_c}=\frac{121 \textrm{Hz}}{784 \textrm{Hz}}\approx\frac{\sqrt{5}-1}{8} , ami irracionális, így a spektrumhoz nem tartozik egyértelmű alaphang. A két hangot a 9.4. (harmonikus) és a 9.5. (inharmonikus) hangpéldák tartalmazzák. , ami irracionális, így a spektrumhoz nem tartozik egyértelmű alaphang. A két hangot a 9.4. (harmonikus) és a 9.5. (inharmonikus) hangpéldák tartalmazzák.
9.7. (a): Oldalfrekvenciák helyzete magas modulációs indexek esetén (fc=fm=440). (b) és (c): oldalfrekvenciák pozitív tartományba hozása. Mivel fc=fm, ezért H=1, így (a): Oldalfrekvenciák helyzete magas modulációs indexek esetén (fc=fm=440). (b) és (c): oldalfrekvenciák pozitív tartományba hozása. Mivel fc=fm, ezért H=1, így \frac{2}{H}=2 , ami egész. Emiatt a tükrözött és az eredeti frekvenciák átfedésbe kerülnek, és az előjelhelyes összeadás miatt az eredetileg 1320 Hz-nél levő formáns eltűnik; a spektrum új csúcsai 440 és 880 hertznél lesznek. , ami egész. Emiatt a tükrözött és az eredeti frekvenciák átfedésbe kerülnek, és az előjelhelyes összeadás miatt az eredetileg 1320 Hz-nél levő formáns eltűnik; a spektrum új csúcsai 440 és 880 hertznél lesznek.
9.8. Tükröződő spektrumok. A tükrözés előtti állapotot a pontozott fekete spektrum, a tükrözés utáni végeredményt a piros spektrum mutatja. A bal oldali ábrán Tükröződő spektrumok. A tükrözés előtti állapotot a pontozott fekete spektrum, a tükrözés utáni végeredményt a piros spektrum mutatja. A bal oldali ábrán H=\frac{f_m}{f_c}=\frac{466 \textrm{Hz}}{699 \textrm{Hz}}=\frac{2}{3} (ebből az alaphang f0=233 Hz) és I=5. Mivel \frac{2}{H}=3 , várakozásainknak megfelelően a tükrözött frekvenciák az eredetiekkel átfedésbe kerülnek. A jobb oldali ábrán H=\frac{f_m}{f_c}=\frac{574 \textrm{Hz}}{2214 \textrm{Hz}}=\frac{7}{27} (ebből az alaphang f0=82 Hz) és I=8. Mivel \frac{2}{H}=\frac{27}{14} , a tükrözött frekvenciák új komponenseket illesztenek a spektrumba. Mivel fc mod fm=492 Hz (ami megegyezik fm-f0-lal), a kapott hang, habár – matematikai értelemben – harmonikus, nagyon szélesen elhelyezkedő frekvencia-párokat tartalmaz, így nem alakul ki igazi hangmagasság-érzet. A két hangot a 9.6. (bal) és a 9.7. (jobb) hangpéldák tartalmazzák. (ebből az alaphang f0=233 Hz) és I=5. Mivel Tükröződő spektrumok. A tükrözés előtti állapotot a pontozott fekete spektrum, a tükrözés utáni végeredményt a piros spektrum mutatja. A bal oldali ábrán H=\frac{f_m}{f_c}=\frac{466 \textrm{Hz}}{699 \textrm{Hz}}=\frac{2}{3} (ebből az alaphang f0=233 Hz) és I=5. Mivel \frac{2}{H}=3 , várakozásainknak megfelelően a tükrözött frekvenciák az eredetiekkel átfedésbe kerülnek. A jobb oldali ábrán H=\frac{f_m}{f_c}=\frac{574 \textrm{Hz}}{2214 \textrm{Hz}}=\frac{7}{27} (ebből az alaphang f0=82 Hz) és I=8. Mivel \frac{2}{H}=\frac{27}{14} , a tükrözött frekvenciák új komponenseket illesztenek a spektrumba. Mivel fc mod fm=492 Hz (ami megegyezik fm-f0-lal), a kapott hang, habár – matematikai értelemben – harmonikus, nagyon szélesen elhelyezkedő frekvencia-párokat tartalmaz, így nem alakul ki igazi hangmagasság-érzet. A két hangot a 9.6. (bal) és a 9.7. (jobb) hangpéldák tartalmazzák. , várakozásainknak megfelelően a tükrözött frekvenciák az eredetiekkel átfedésbe kerülnek. A jobb oldali ábrán Tükröződő spektrumok. A tükrözés előtti állapotot a pontozott fekete spektrum, a tükrözés utáni végeredményt a piros spektrum mutatja. A bal oldali ábrán H=\frac{f_m}{f_c}=\frac{466 \textrm{Hz}}{699 \textrm{Hz}}=\frac{2}{3} (ebből az alaphang f0=233 Hz) és I=5. Mivel \frac{2}{H}=3 , várakozásainknak megfelelően a tükrözött frekvenciák az eredetiekkel átfedésbe kerülnek. A jobb oldali ábrán H=\frac{f_m}{f_c}=\frac{574 \textrm{Hz}}{2214 \textrm{Hz}}=\frac{7}{27} (ebből az alaphang f0=82 Hz) és I=8. Mivel \frac{2}{H}=\frac{27}{14} , a tükrözött frekvenciák új komponenseket illesztenek a spektrumba. Mivel fc mod fm=492 Hz (ami megegyezik fm-f0-lal), a kapott hang, habár – matematikai értelemben – harmonikus, nagyon szélesen elhelyezkedő frekvencia-párokat tartalmaz, így nem alakul ki igazi hangmagasság-érzet. A két hangot a 9.6. (bal) és a 9.7. (jobb) hangpéldák tartalmazzák. (ebből az alaphang f0=82 Hz) és I=8. Mivel Tükröződő spektrumok. A tükrözés előtti állapotot a pontozott fekete spektrum, a tükrözés utáni végeredményt a piros spektrum mutatja. A bal oldali ábrán H=\frac{f_m}{f_c}=\frac{466 \textrm{Hz}}{699 \textrm{Hz}}=\frac{2}{3} (ebből az alaphang f0=233 Hz) és I=5. Mivel \frac{2}{H}=3 , várakozásainknak megfelelően a tükrözött frekvenciák az eredetiekkel átfedésbe kerülnek. A jobb oldali ábrán H=\frac{f_m}{f_c}=\frac{574 \textrm{Hz}}{2214 \textrm{Hz}}=\frac{7}{27} (ebből az alaphang f0=82 Hz) és I=8. Mivel \frac{2}{H}=\frac{27}{14} , a tükrözött frekvenciák új komponenseket illesztenek a spektrumba. Mivel fc mod fm=492 Hz (ami megegyezik fm-f0-lal), a kapott hang, habár – matematikai értelemben – harmonikus, nagyon szélesen elhelyezkedő frekvencia-párokat tartalmaz, így nem alakul ki igazi hangmagasság-érzet. A két hangot a 9.6. (bal) és a 9.7. (jobb) hangpéldák tartalmazzák. , a tükrözött frekvenciák új komponenseket illesztenek a spektrumba. Mivel fc mod fm=492 Hz (ami megegyezik fm-f0-lal), a kapott hang, habár – matematikai értelemben – harmonikus, nagyon szélesen elhelyezkedő frekvencia-párokat tartalmaz, így nem alakul ki igazi hangmagasság-érzet. A két hangot a 9.6. (bal) és a 9.7. (jobb) hangpéldák tartalmazzák.
9.9. Egy kétcsatornás FM szintetizátor. A jobb oldali ág lehetővé teszi a modulációs index időbeli változtatását (egy burkológörbe segítségével), a modulációs frekvencia helyett pedig a harmonicitási arányt használja.
10.1. Néhány a legismertebb ablakfüggvények közül. Felső sor: négyszögfüggvény (bal), Hann- vagy von Hann-függvény (jobb); alsó sor: Hamming-függvény (bal), Blackman-függvény (jobb).
10.2. Szinuszhullám spektruma négyszögletes (bal) és Blackman–Harris (jobb) ablakfüggvények használatával (a "valódi" spektrum egyetlen frekvenciát tartalmazna, ahogy az a 1.1. ábrán látható). Míg a négyszögletes ablaknak a frekvencia-felbontása, addig a Blackman–Harrisnek a zajszintje kíváló.
10.3. Az eltérő ablakméretek okozta torzítás vizsgálata. Mindkét szonogram a 10.1. hangminta alapján készült. A bal oldali szonogramon az ablakméret 1,45 ms (689 Hz-es felbontás), a jobb oldalin 1 486 ms (0,67 Hz-es felbontás). Látható, hogy míg a bal oldali szonogram időfelbontása kiváló, a frekvencia-felbontás annyira gyenge, hogy lehetetlen megmondani, milyen frekvenciák alkotják a spektrumot. A jobb oldali ábrával fordított a helyzet: itt a frekvencia-felbontás egyértelmű, ám az időfelbontás annyira rossz, hogy képtelenség megmondani, melyik frekvencia mikor szól. A szonogramok által megjelenített tartományok: 0–5 kHz és 1,5–1,7 s (bal); 100–1 000 Hz} és 0–3,8 s (jobb).
10.4. A Fourier-analízis lépései.
10.5. Hangfile-ok Fourier-analízisét végző mintaprogram. Figyeljük meg, hogy az ablakfüggvények változásával hogyan változik az egyes csúcsok élessége, illetve a hozzáadott háttérzaj mértéke.
11.1. Transzpozíció az eredeti spektrális burkológörbe megtartásával. Az eredeti spektrumot a fekete, a spektrális burkológörbét a kék, az új spektrumot a piros vonalak jelzik. Figyeljük meg, hogy (mivel transzponáláskor a frekvenciák aránya az, ami változatlanul marad) a távolság az új és az eredeti komponensek között a frekvencia növekedésével arányosan nő.
11.2. Többsávos spektrális szűrő. Bal oldalon a forrás spektruma és a szűrő-karakterisztika (piros vonal), jobb oldalon a szűrt spektrum látható. A 11.9. hangpélda többsávos szűrővel szűrt fehérzajt tartalmaz.
11.3. Kép alapján vezérelt komplex spektrális szűrés. Az eljárás során a képet alkotó képpontokat szűrő-paraméterekként értelmezzük. Először vízszintesen felosztjuk a képet annyi szeletre, ahány FFT ablakunk van; ezután az egyes szeletekben levő képpontokat hozzárendeljük a nekik megfelelő FFT-ablakoknak. Egy-egy ablakon belül úgy alakítjuk ki a szűrőprofilt, hogy a képpontokhoz függőleges elhelyezkedésük alapján frekvenciaértékeket rendelünk, és az így meghatározott frekvenciákon olyan mértékű szűrést írunk elő, mint amilyen az adott frekvenciának megfelelő képpont intenzitása (az intenzitás annak a mértéke, hogy az adott pont mennyire sötét vagy világos). A 11.10. hangpélda elkészítéséhez fehérzajt vettünk alapul, melyet egy fényképpel szűrtünk. Az ábra az így kapott hang szonogramjának egy (1 200 Hz és 4 000 Hz közötti) részletét mutatja.
11.4. Keresztszintézisben részt vevő spektrumok. A fekete spektrum a vivőjelhez tartozik (zajszerű forrás), a piros pedig a moduláló jel (hangszerhang). A végeredményt a kék spektrum mutatja.
11.5. Lejátszás sebességének változtatása Max programnyelven. A HApp_11_01(OSX)(WIN) és a HApp_11_02(OSX)(WIN) példák kezelőfelületei ugyanúgy néznek ki, ám míg előbbi esetén a lejátszás sebessége tetszőlegesen állítható, utóbbinál a sebesség a csúszka elengedése után visszatér a "normálishoz" (mint egy valódi lemezjátszón).
11.6. Spektrális analízis-reszintézis útján végzett műveletek. A jobb oldali ekvalizátorral vezérelhetjük a spektrális szűrést, míg a bal oldalon a hang függetlenül transzponálható és nyújtható. A megfelelő számdobozban megadott hangmagasság-szorzót a hangmagasság-görbe segítségével tudjuk modulálni. A jobb oldali felső egység egyszerű amplitúdó-modulációt tesz lehetővé.
11.7. Keresztszintézis. A kimeneti jel amplitúdóit az Keresztszintézis. A kimeneti jel amplitúdóit az \displaystyle A_0[n]=A_1[n]\cos\left(\frac{π}{2}x\right)+A_2[n]\sin\left(\frac{π}{2}x\right) , míg fázisait a \displaystyle\phi_0[n]=\phi_1[n]y+\phi_2[n]\left(1-y\right) képlet alapján határozhatjuk meg (x és y az "Amplitúdó" és "Fázis (Frekvencia)" csúszkák értékei, melyek 0 és 1 között lehetnek). , míg fázisait a Keresztszintézis. A kimeneti jel amplitúdóit az \displaystyle A_0[n]=A_1[n]\cos\left(\frac{π}{2}x\right)+A_2[n]\sin\left(\frac{π}{2}x\right) , míg fázisait a \displaystyle\phi_0[n]=\phi_1[n]y+\phi_2[n]\left(1-y\right) képlet alapján határozhatjuk meg (x és y az "Amplitúdó" és "Fázis (Frekvencia)" csúszkák értékei, melyek 0 és 1 között lehetnek). képlet alapján határozhatjuk meg (x és y az "Amplitúdó" és "Fázis (Frekvencia)" csúszkák értékei, melyek 0 és 1 között lehetnek).
12.1. Flanger folyamatábrája. A felső késleltető konstans időt késik, az alsó késési idejét egy szinuszos oszcillátor modulálja.
12.2. Három szűrőt tartalmazó fázistoló folyamatábrája. A szűrők "középfrekvenciáit" (mely jelen esetben azt a frekvenciát jelenti, ami felett a szűrő megfordítja a fázist) egy szinuszos oszcillátor modulálja.
12.3. A flanger (bal) és a fázistoló (jobb) jellemző spektrumai.
12.4. Fázistolás. A felső kijelző a bejövő, a középső kijelző a fázistolt jelet mutatja. A fázistolás mértékét fokokban adhatjuk meg. Az eredmény a legalsó kijelzőn jelenik meg.
12.5. Késleltetés és visszacsatolás Max programnyelven.
12.6. Késleltetésre/szűrésre épülő modulok Max programnyelven: Vibrato, Flanger, Fázistoló és Kórus.
13.1. Szinuszhullám (bal fent) különböző torzításai: klippelés (jobb fent), tükrözés (bal lent), körülfolyatás (jobb lent). A piros vonalak a levágási amplitúdókat jelölik.
13.2. Egy 220 Hz-es szinuszhullám és torzításai (szonogram). Balról jobbra: torzítatlan jel, klippelés, lágy torzítás, nullátmeneti torzítás, tükrözés, körülfolyatás, Csebisev-torzítás. A szonogram a 13.1. hangpélda alapján készült.
13.3. Alacsony dinamikai felbontású szinuszjel. Az eredeti jelet a fekete, a kvantált jelet a piros vonal mutatja.
13.4. Jelalak-torzítás Max programnyelven. A központi kijelző a torzítás karakterisztikáját mutatja -3 és +3 között (lineáris amplitúdóértékek). A két vízszintes piros vonal a ±1 amplitúdóértéket jelöli, a két szürke pedig az x=0 és y=0 tengelyeket.
13.5. Kvantálási torzítás Max programnyelven. A mintavételi frekvencia csökkentésével megfigyelhető az eredeti jel magas frekvenciáinak visszatükröződése, az álfrekvenciák megjelenése. A dinamikai tartomány szűkítésével a jel egyre zajosabbá válik.
14.1. Egyszerű kompresszorok sematikus karakterisztikái. A piros vonalak mindkét ábrán az aktiválódás határértékét, a feketék a végső hangerő-karakterisztikát mutatják. A bal oldali ábra a határérték felett halkít, a jobb oldali a határérték alatt erősít. Mindkét esetben megfigyelhető, hogy az eszköz egy nagyobb dinamika-tartományt képez le egy kisebbre.
14.2. Adott határérték fölött levágó limiter karakterisztikája. A 14.1. ábra bal oldalán található karakterisztikával összehasonlítva látható, hogy a limiter valójában egy kompresszor, ahol a ∞:1 tömörítési arány miatt a karakterisztika határérték feletti része teljesen lapos.
14.3. A hanghullámok által bejárható lehetséges trajektóriák egy része. A piros vonal a közvetlen hangot, a szaggatott feketék néhány elsőrendű, míg a pontozott feketék néhány másodrendű visszaverődést mutatnak.
14.4. Kompresszálás, limitálás és ekvalizátor Max nyelven.
14.5. A HApp_14_01(OSX)(WIN) programban alkalmazott tömörítő teljes karakterisztikája. A fekete vonal magát a karakterisztikát, a piros vonal a határértéket, a kék vonal pedig az aktiválódáshoz szükséges minimális hangerő szintjét mutatja.
14.6. Zengetés Max programnyelven.
15.1. A HApp_15_01(OSX)(WIN) interaktív példa. A felső panel egy szubtraktív szintetizátort, az alsó panel ennek valós idejű vezérlőit tartalmazza: az amplitúdók (bal fent), a jósági tényezők (jobb fent), az impulzus-időtartamok (bal lent) és az impulzus-gyakoriságok (jobb lent) szabályozóit.