Il Mascheramento Audio


La povera persona di cui prima si trova sempre nella solita stanza silenziosa. Stavolta viene diffuso un tono alla frequenza di 1KHz, detto tono maschera, tenuto fisso a 60dB (leggi volume alto). Ripetiamo il discorso di prima sulla soglia di udibilità di un secondo tono, detto tono di test. Quello che emerge è che avvicinandoci sia da sinistra che da destra al tono maschera, dobbiamo alzare il volume del tono test per riuscire a distinguerlo. Oltre i 4 Khz e al di sotto degli 0.5 le cose tornano a posto, però notiamo che nell'intorno di 1KHz i due toni sono praticamente indistinguibili a meno di non alzare pesantemente il volume del tono test.

In sostanza, una frequenza "debole" può essere benissimo mascherata, cioè risultare inudibile, da una frequenza anche lontana qualche centinaio di Hz, se quest'ultima è bella forte, cioè con una intensità alta. Se abbiamo più toni tenuti fissi a volumi belli alti, per esempio a 60 dB e a frequenze fisse di 0.25, 1 , 4 e 8 KHz, notiamo che la risoluzione del nostro orecchio peggiora sempre più, perchè per avvisare il segnale del tono test a ben 1KHz di lontananza dal segnale tenuto fisso a 4 KHz, il segnale del tono test deve raggiungere i 40dB! Se non vi fosse stato il tono maschera a 4 KHz sarebbero bastati un paio di dB.

Anche il fenomeno appena descritto ci viene incontro ed è possibile eliminare componenti spettrali che, essendo troppo vicine a suoni forti, non risultano udibili all'orecchio umano.
Finora abbiamo parlato del mascheramento in frequenza . Esiste però un altro tipo di mascheramento, ed è quello temporale . Supponiamo di avere al solito due toni, uno forte e l'altro, che gli è vicino in frequenza, piuttosto debole. Dall'analisi vista prima sappiamo già che il nostro orecchio sente solo il tono più forte che si comporta così da tono maschera. Ora, se improvvisamente questo tono maschera cessa di esistere, avvertiamo subito il tono più debole o impieghiamo un pò di tempo per avvertirlo? Chiaramente la seconda, perchè la membrana del nostro timpano deve assestarsi.....il problema è : quanto tempo impieghiamo? Dipende dal volume del tono maschera e da quello del tono test. Se il tono maschera ci assorda, il nostro povero orecchio impiegherà un bel pò prima di riuscire a sentire il tono più debole anche dopo che il tono forte è morto.

Al solito, c'è chi queste misurazioni le ha già fatte

Il tono test, di 1KHz, viene disattivato all'istante zero: esso manteneva un valore fisso di 60dB. Se il nostro test tone ha un'ampiezza di una quarantina di dB, bastano 5 ms per avvertirlo; se è di soli 20dB, ne occorrono quasi 20 di millisecondi perchè risulti avvertibile. Cosa succede se abbiamo più toni a diverse frequenze e alcuni di questi muoiono? in altri termini, come si fondono le maschere temporali e quelle in frequenza? La figura sottostante è molto chiarificatrice:

In conclusione l' effetto complessivo del mascheramento è che molti toni non saranno mai udibili perchè collocati nel dominio della frequenza e del tempo troppo vicino a toni forti. Tenendo conto della sensibilità dell'orecchio e del fenomeno del Masking Audio è quindi possibile eliminare dallo spettro del segnale una quantità molto alta di informazioni inutili, perchè non udibili dall'orecchio umano.
Questi sono i fenomeni Psico-Acustici su cui si basana i moderni algoritmi di compressione audio come MP3, MP3Pro, Atrac-3, AAC, etc...
Chiarito cos'è il mascheramento , passiamo finalmente alla codifica MPEG.

Capitoli

  1. La compressione audio
  2. La compressione
  3. Classificazione degli algoritmi di compressione
  4. Timbro e Pitch
  5. Approcio psico-acustico alla compressione
  6. Il mascheramento audio
  7. L'mp3 in specifico
  8. L'mp3 in specifico
  9. Conclusione