MAURO UBERTI

Psicoacustica

Mentre i meccanismi per i quali le vibrazioni acustiche dell'ambiente aereo esterno vengono tradotte in impulsi nervosi sono discretamente conosciuti, così come quelli della conduzione di questi dai recettori periferici al cervello, non altrettanto si può dire dei meccanismi che trasformano gli impulsi in sensazioni coscienti. Il carattere della presente trattazione impone comunque di circoscrivere il discorso agli aspetti più tipicamente musicali della percezione sonora e, cioè, alle modalità secondo le quali il sistema uditivo umano valuta le grandezze acustiche. Tale campo di indagine, che si riferisce al comportamento dei meccanismi fisiologici e psicologici che intervengono nella percezione uditiva, prende il nome di psicoacustica ed è un capitolo della psicofisica.

Il dominio della psicoacustica si può suddividere in due diversi campi di osservazione: a) la capacità dell'udito di valutare le caratteristiche fisiche dei suoni: b) quella di coglierne le variazioni. Sia in un caso che nell'altro è fondamentale il concetto di soglia, termine coi quale in biologia e psicologia si intende genericamente il valore minimo di intensità di stimolazione necessaria perché si verifichi una certa risposta biologica o psicologica. Quando, in psicofisica, l'interesse è rivolto a determinare la differenza tra stimoli percepibili e stimoli non percepibili si parli di soglia assoluta; quando, invece si vuole determinare la minima variazione apprezzabile, si parla di soglia differenziale. Nella pratica, tuttavia, più che il valore assoluto della variazione interessa il rapporto percentuale di questa con il valore dell'intensità dello stimolo iniziale, come, del resto, enunciato dalla legge di Weber: "uno stimolo deve essere aumentato di una frazione costante del suo valore perché la differenza cominci a diventare percepibile".

Come in tutti i fenomeni dell'ambito biologico, i valori ottenuti dai rilevamenti hanno significato statistico. Sono, in questo caso, la media delle risposte di un gruppo d'ascolto costituito da un certo numero di soggetti scelti col criterio dell’omogeneità (soprattutto per quanto riguarda l'età) e posti nelle medesime condizioni sperimentali.

Nell’intento di ottenere risultati più agevolmente quantificabili, nelle ricerche di psicoacustica vengono usati prevalentemente suoni puri, in tale accezione chiamati toni, così come rumori opportunamente calibrati come, per es., il rumore bianco.



Fig. 1. Campo di udibilità. È determinato dai valori limite di intensità e di frequenza. Il limite inferiore per l'intensità (rappresentata in ordinate) è costituito dalla curva di soglia di udibilità (b); quello superiore dalla curva di soglia del dolore (a). I limiti per la frequenza (rappresentati in ascisse) sono dati, invece, da un valore inferiore, che oscilla fra i 15 e i 20 Hz e da superiore uno che si aggira sui 20. 000 Hz (pari a 20 kHz).

Il campo di udibilità. Sottoponendo un numero sufficiente di volte e nelle condizioni sperimentali opportune i singoli componenti di un gruppo di ascolto all'audizione successiva di toni diversi è possibile stabilire la soglia di udibilità per ciascuna frequenza. Segnando poi su di un piano cartesiano la media dei valori ottenuti e collegando i punti fra di loro si ottiene la curva della soglia di udibilità, che rappresenta la sensibilità dell'udito alle diverse frequenze. Da essa si ricava che la sensibilità dell'udito varia alle diverse frequenze, come appare dalla fig. 1, è massima fra i 2000 e i 5000 Hz mentre è nulla sotto dei 16-20 Hz e al di sopra dei 16.000-20.000 Hz (l'interpretazione del diagramma sarà più intuitiva se l'altezza delle ordinate verrà letta come numero di decibel [dB] necessari perché il suono raggiunga la soglia di udibilità). Le frequenze inferiori ai 16-20 Hz costituiscono gli infrasuoni; quelle superiori ai 16.000-20.000 Hz gli ultrasuoni. La sensibilità uditiva alle alte frequenze cala progressivamente col progredire dell'età e questo fenomeno, affatto fisiologico, viene detto presbiacusia ( = audizione senile).

Se l'intensità dei toni viene aumentata progressivamente, si raggiunge un livello al quale la sensazione uditiva si trasforma, in corrispondenza dell'orecchio esterno, in una specie di sensazione tattile. Tale livello si soglia di sensazione fisica. A livelli più alti la sensazione fisica si trasforma in fastidio (soglia del fastidio) e, finalmente, in dolore (soglia del dolore).

L’ambito di esistenza dei suono, compreso fra gli infrasuoni, gli ultrasuoni, la soglia di udibilità e quella del dolore viene chiamato campo di udibilità.


Fig. 2. Curve di isofonia. Rappresentano l'intensità necessaria alle diverse frequenze per ottenere una sensazione sonora in dB (scala a sinistra) corrispondente a quella che si ottiene dalla frequenza di riferimento (1000 Hz). La scala interna dà il livello della sensazione sonora in fon.

Il livello di sensazione sonora o di intensità soggettiva. Riassumendo quanto sopra esposto si può dire che il comportamento psicoacustico dell'orecchio cambia al variare della frequenza. Altrettanto si può dire per quanto riguarda l'intensità. Se, invece di limitarci ad osservare il comportamento dell'orecchio ai valori più bassi di questa grandezza, estendiamo lo studio a tutto il campo di udibilità prendendo come riferimento i 1000 Hz, otteniamo un diagramma come quello della fig. 2. Infatti sottoponendo i soggetti in esame all'ascolto degli stessi toni della scala delle frequenze usata per la definizione della soglia di udibilità, ma, questa volta, ad intensità aumentata ogni volta, per es., di 5 o di 10 dB e chiedendo loro di indicare i livelli che vengono percepiti con intensità uguale a quella di riferimento (1000 Hz), le curve di isofonia o isofoniche (uguale sonorità) che si ottengono sono quelle del diagramma.

Poiché il livello di sensazione sonora (o livello di intensità soggettiva) non coincide necessariamente, come è evidente, con il livello di intensità oggettiva e il dB (che serve a misurare questo rispetto ad un valore costante di riferimento) non può servire per esprimere i valori della sensazione sonora, si rese necessario adottare per quest'ultima un'unità di misura specifica: il fon o phon. Si stabilì, pertanto, che la sensazione sonora, indotta da un tono di 1000 Hz avente un livello di intensità pari a un certo numero di dB, abbia un livello in fon espresso dallo stesso numero. In base a tale assunto, per es., mentre a 1000 Hz, per dare i fon di intensità soggettiva occorrono esattamente 50 dB di intensità oggettiva, a 100 Hz, per ottenere lo stesso numero di fon (= la stessa sensazione di intensità) occorrerà una decina di dB in più e, a 4000 Hz, una decina in meno. Il comportamento uditivo descritto spiega perché la stessa registrazione musicale, ascoltata dalla stessa apparecchiatura ad alta fedeltà, a basso volume appaia meno fedele che ad alto: poiché, a bassa intensità, l'orecchio è meno sensibile alle basse ed alte frequenze, queste componenti sonore, che pure sono presenti nella riproduzione oggettiva, non vengono percepite e la loro assenza o riduzione danno luogo ad un’audizione insoddisfacente Per questo motivo le apparecchiature ad alta fedeltà sono dotate del comando loudness che, inserito, introduce un circuito di compensazione avente il compito di esaltare in modo opportuno le frequenze estreme e migliorare la fedeltà dell'ascolto a basso volume.

La variazione dell’intensità. Altro campo di osservazione è quello che ha come oggetto la capacità di apprezzamento delle variazioni di valore delle caratteristiche fisiche dei suoni.

Le valutazioni della minima variazione di intensità percepibile dal sistema uditivo (soglia differenziale di intensità) danno luogo a risposte un po' variabili a seconda dei metodi di rilevamento usati. Sostanzialmente, però, esse danno come risultato valori oscillanti fra 0,5 e 1 dB, almeno nell'intervallo fra 125 e 6000 Hz, mentre, quando ci si avvicina ai limiti delle frequenze di udibilità, la capacità di discriminare le piccole variazioni di intensità diminuisce sensibilmente. I livelli di intensità ai quali le variazioni avvengono sono alquanto indifferenti nel determinare il comportamento del sistema uditivo che, sostanzialmente, mantiene la stessa capacità di discriminazione sia ai bassi che agli alti livelli. Piuttosto è fondamentale, nella percezione di una variazione di intensità ai limiti della soglia, la velocità, alla quale essa avviene. I dati or ora esposti si riferiscono a variazioni istantanee mentre variazioni di valore doppio ma lente ingannano facilmente anche orecchi esercitati.

La misura del livello di sensazione sonora o di intensità soggettiva. L'espressione del livello di sensazione sonora in fon permette di correlare abbastanza bene il mondo psicoacustico con la realtà oggettiva. Dire cioè che un tono della frequenza di 100 Hz e dell'intensità oggettiva di 60 dB dà una sensazione, sonora di 50 fon equivale a dire, in base a quanto precedentemente esposto, che quel suono appare all’udito di intensità pari a quella di un tono di 50 fon a 1 000 Hz.

Se però ci si aspetta che un tono di 100 fon a 1000 Hz (100 dB) dia un livello di sensazione sonora doppia di quella data dal tono di 50 fon a 1000 Hz (50 dB) l'attesa rimane delusa perché la sensazione di intensità ottenuta è molto maggiore. L'effetto di raddoppio di sensazione sonora, infatti, è ottenuto già a soli 60 fon (60 dB). Il rapporto fra l'intensità dello stimolo e la risposta psicoacustica lungo la scala delle grandezze oggettive, cioè, non è costante. Di qui la necessità di introdurre un'altra grandezza soggettiva, adatta alla quantificazione della sensazione sonora o intensità soggettiva, il son, correlata, tuttavia, alle grandezze oggettive con un assunto convenzionale: un tono di 1000 Hz e di 40 dB induce una sensazione sonora di 1 son. Aumentando l’intensità oggettiva del tono fino a ottenere il raddoppio dell'intensità soggettiva (cosa che avviene a circa 50 dB), si dirà che quest’ultimo livello è di 2 son. Procedendo sperimentalmente per la medesima strada è stato possibile identificare la relazione reale esistente tra l'intensità dello stimolo e la sensazione indotta e istituire una scala di multipli e sottomultipli, che corrisponde molto bene ad un'altra scala teorica, derivata da una certa equazione, per mezzo della quale si è cercato di definire la legge che regola i rapporti tra intensità oggettiva e intensità soggettiva. Ora, per convenzione, si è stabilito che, nell’intervallo dei livelli compresi fra 20 e 120 fon (ad esclusione, quindi, dei valori estremi del campo uditivo) il raddoppio della sensazione sonora in son corrisponde esattamente all'aumento di 10 fon nel livello di sensazione sonora, qualunque sia la frequenza dei tono di stimolazione. Se ci si rifà alla definizione di decibel, che è una unità di misura logaritmica, si può osservare come il raddoppio dell'intensità o oggettiva si verifichi ogni tre dB. Considerando ora che il raddoppio della sensazione sonora si avverte ogni 10 fon, si possono comprendere le ragioni della grande capacità di discriminazione dell’orecchio umano nel dominio delle intensità.


Fig. 3. Relazione fra sensazione di altezza e frequenza. Il sistema uditivo, come appare dalla figura, comprime la gamma delle frequenze che è in grado di percepire. L'ambito di frequenza fra 20 e 20.000 Hz è compresso in un campo di soli 3500 mel di sensazione di altezza.

La sensazione dell’altezza e la sua misura. Le misure musicali usuali degli intervalli di altezza sono, come è ben noto, l'ottava e il semitono temperato. La prima è identificata dai raddoppio della frequenza del tono di riferimento mentre il secondo, che divide l'ottava in 12 parti uguali, sta col tono di riferimento nel rapporto di 1,05946 ().

Altra unità di misura usata nella misurazione degli intervalli musicali è il cent, pari ad un centesimo di semitono temperato e a 1/ 1200 di ottava. Altro modo ancora di rappresentare gli intervalli tonali è quello di indicarli come variazioni percentuali. Un tono di 125 Hz, es., è più alto del 25% rispetto ad un altro di 100 Hz. Tali unità di misura, però, si riferiscono alla frequenza reale dei suoni. Poiché la sensazione psicoacustica di altezza, che viene indotta (sensazione di altezza o altezza soggettiva) non è legata alla frequenza con un rapporto costante, è stato necessario istituire anche per essa un’unità di misura: il mel. Per convenzione un tono di 1000 Hz a 40 dB induce una sensazione di altezza pari a 1000 mel (fig. 3). Una sensazione di altezza doppia di quella di riferimento (ottava superiore) corrisponde a 2000 mel; una sensazione di altezza pari alla metà (ottava inferiore), 500 mel. La verifica sperimentale, però, dimostra che l’effetto di ottava superiore, anziché da 2000 Hz è indotto da circa 3100 Hz mentre quello di ottava inferiore è indotto da una frequenza di circa 400 Hz. Procedendo sperimentalmente e sempre al livello convenzionale di 40 fon (40 dB a 1000 Hz), si può così constatare come al cambiare dell'intensità del tono di stimolazione, mantenuto a frequenza costante, cambia anche la sensazione di altezza, per cui è possibile tracciare sperimentalmente delle curve di isoaltezza (identica sensazione di altezza) che dicono come sia necessario variare in più o in meno l'altezza reale dei tono di stimolazione perché l’udito conservi la sensazione di una nota costante variandone l'intensità.

Allargando l'indagine a tutto il campo uditivo si scopre che il comportamento psicoacustico del sistema uditivo per quanto riguarda la sensazione di altezza al variare dell'intensità è molto complesso. Soltanto le frequenze della regione tonale compresa fra 1000 e 3000 Hz sono relativamente insensibili alle variazioni di intensità. I toni di frequenza inferiore tendono a indurre una sensazione di altezza più bassa quanto più alta è la loro intensità, con effetto tanto più accentuato quanto più bassi essi sono; quelli di frequenza superiore tendono invece a indurre sensazioni di altezza più alte quanto l'intensità è più alta esse pure con effetto accentuato quanto più alte sono. Al crescere dell'intensità, cioè, le frequenze al disopra e al disotto di una certa fascia centrale (1000-3000 Hz) tendono ad esasperare nella sensazione indotta, le loro caratteristiche di acutezza o di profondità.


Fig. 4. Soglia differenziale di frequenza: soglia differenziale normale (linea continua), soglia differenziale nella pratica musicale (linea tratteggiata).

La variazione dell’altezza. La sensibilità del sistema uditivo alle variazioni di frequenza è definita dalla soglia differenziale di frequenza. Anche in questo caso occorre tener conto sia dell'altezza sia dell'intensità dei toni messi a confronto. Mentre alle bassissime frequenze la capacità discriminatoria dell'orecchio è decisamente cattiva (all'altezza del do di 32,7 Hz l'incertezza supera abbondantemente il semitono) essa migliora. sensibilmente a mano a mano che ci si avvicina al cosiddetto campo di corretta udibilità (800-3000 Hz) nel quale si mantiene costante per poi tornare a peggiorare leggermente verso l'acuto (fig. 4). La soglia differenziale di frequenza è indipendente dalla loro intensità per valori superiori a 30 dB al di sopra della soglia di udibilità mentre al disotto di questo livello la capacità di discriminazione dell'orecchio diminuisce sensibilmente.

Come nel caso dell'intensità, la valutazione delle variazioni di frequenza è fortemente influenzata dalla velocità di queste e i valori dati si riferiscono a valutazioni istantanee mentre variazioni lente possono ingannare anche orecchie esercitate.

Si deve qui sottolineare che i risultati esposti sono quelli ottenuti in condizioni sperimentali (toni puri e assenza di riverberazione). Nella pratica musicale, essendo le condizioni affatto diverse, la curva della soglia differenziale di frequenza assume invece l’andamento che appare nella fig. 4.

La somma di più suoni e della loro intensità. Nella realtà quotidiana i toni puri usati per semplicità nelle sperimentazioni descritte, sono praticamente assenti; è quindi del massimo interesse indagare sul comportamento verso i suoni complessi, che sono invece quelli realmente esistenti in natura. L’aumento dei fattori in gioco, però, moltiplica in misura enorme le difficoltà di indagine, motivo per cui le acquisizioni sicure in questo campo sono ancora poche. Una di queste è l'andamento del livello di intensità soggettiva al sommarsi di più toni puri.


Fig. 5. Relazione tra larghezza della banda critica e sua frequenza centrale. La larghezza della banda critica cresce al crescere della frequenza. (In ascisse è indicata la frequenza centrale, in ordinate la lunghezza della banda critica.)

Come si è visto precedentemente, il livello di intensità sonora non dipende soltanto dall’intensità dei toni di stimolazione, ma anche dalla loro frequenza. Questa interdipendenza psicoacustica fra i due tipi di grandezze persiste ovviamente anche nel caso in cui i toni in gioco siano più di uno. Nel caso più semplice, costituito da due toni di frequenza diversa ma ognuno dell'intensità oggettiva necessaria per indurre la stessa sensazione sonora (misurata in son) la somma delle intensità dei due toni dà risultati psicoacustici diversi a seconda dell'ampiezza dell'intervallo di frequenza che li separa. Qui occorre introdurre la nozione di banda critica, che è il campo di frequenze in relazione al quale è possibile valutare la somma dell’intensità soggettiva dei due toni. Le bande critiche che dividono l’ambito delle frequenze udibili sono state stabilite sperimentalmente m numero di 24 e hanno varia larghezza. Ora se l'intervallo fra i due toni è superiore ad una determinata banda critica la sensazione sonora indotta dalla stimolazione contemporanea da parte di essi è doppia; pari, cioè, alla somma delle sensazioni che verrebbero indotte separatamente da ciascuno. Se invece l'intervallo di frequenza scende al disotto di quella determinata banda critica, l’intensità della sensazione sonora risulta inferiore alla somma e il risultato è abbastanza predicibile applicando di volta in volta la formula della legge di potenza, detta di Stevens. La larghezza della banda critica cambia col cambiare della regione di altezza. Un modo comodo per rappresentarla è quello di indicare sulle ordinate di un piano cartesiano la frequenza centrale di essa (fig. 5). Si vede cosi, per es., che, quando la frequenza centrale della banda critica si aggira sui 200 Hz, la sua larghezza è di circa 100 Hz mentre, quando la frequenza centrale è sui 5000 Hz la larghezza giunge a 1000 Hz.

Effetto di mascheramento. L’effetto ben noto, per il quale due o più suoni prodotti assieme si "disturbano" reciprocamente, si chiama effetto di mascheramento o, semplicemente, mascheramento. Il caso più evidente è quello in cui suoni forti coprono suoni deboli, ma anche l'ascolto di un suono forte può essere disturbato dalla presenza di uno meno intenso. In ogni caso il suono disturbatore viene chiamato suono mascherante e quello disturbato, suono mascherato. Dal punto di vista psicoacustico l'effetto di mascheramento consiste nell’innalzamento della soglia di udibilità (diminuzione di sensibilità) a scapito dei suono mascherato e si misura dal numero di dB dei quale si deve aumentare la sua intensità perché esso - sempre in presenza del suono mascherante - torni ad essere udibile. Se, per esempio, un suono è coperto da un altro più forte ed è necessario aumentarne l'intensità di 10 dB perché torni ad essere udibile, si dice che esso subisce un mascheramento di 10 dB.

Il fenomeno tende a manifestarsi con regolarità alle diverse intensità e, scelta a piacere una coppia di suoni, possiamo constatare che, aumentata l'intensità del suono mascherante di un certo numero di dB, il numero di dB del quale è necessario aumentare l'intensità del suono mascherato perché esso torni ad essere udibile è uguale o, comunque, poco diverso.

È importante anche la relazione reciproca di altezza tra frequenze superiori ed inferiori: i toni di frequenza inferiore mascherano più facilmente i toni di frequenza superiore di quanto non accada nel rapporto inverso. L’effetto di mascheramento, ad ogni modo, diminuisce con l’allargarsi dell'intervallo tra la frequenza mascherante e quella mascherata, mentre è più sensibile se l’intervallo è contenuto all’interno di una delle bande critiche. Il massimo dell'effetto si verifica quando i due toni hanno la stessa frequenza.

Nel caso, poi, in cui il mascheramento venga effettuato da un rumore, si osserva che l’effetto mascherante è dato prevalentemente da una ristretta banda di questo, banda la cui ampiezza sta in un determinato rapporto con la banda critica di pertinenza.

Riassumendo possiamo dire che, in presenza di un suono mascherante, le soglie di udibilità di un suono mascherato da una diventano infinite e dipendono da più fattori: altezza ed intensità dei due suoni e relazioni reciproche di altezza e intensità fra i due. Nella realtà pratica, poiché la composizione armonica dei suoni naturali è complessa, i fattori in gioco diventano moltissimi; si pensi al caso di due persone dialoganti in un ambiente affollato o ad uno strumento nell’orchestra.

Suoni di combinazione. Il terzo suono di Tartini non è che il più appariscente dei fenomeni di generazione di nuovi suoni derivati dalla combinazione di più frequenze diverse: nella fattispecie, si tratta del suono differenziale, ossia del suono la cui frequenza corrisponde alla differenza fra quelle dei due suoni emessi contemporaneamente. Se, però, ci si pone nelle condizioni favorevoli di produzione e di ascolto di più suoni scelti opportunamente per numero e per frequenza ed emessi simultaneamente, è possibile udire, assieme ai suoni differenziali anche suoni di frequenza pari alla somma e persino al prodotto delle frequenze intonate.

Sulla oggettività o soggettività di tali suoni di combinazione la questione è controversa, annosa ed ancora aperta. È possibile, infatti, realizzare esperienze diverse e fra loro contraddittorie a prova e disprova della loro oggettività mentre, di contro, la struttura dei timpano dell'orecchio, per es. è tale da consentire, sotto stimolazione, la formazione di nuovi suoni aventi sede esclusivamente auricolare.

Fra le due ipotesi opposte dell'oggettività e della soggettività dei suoni di combinazione ve ne è una terza che ammette una certa esistenza oggettiva di tali suoni, facilitata all'ascolto dalla capacità di integrazione dell’udito.

I fenomeni psicoacustici di ordine temporale. Il sistema uditivo è caratterizzato anche da una certa inerzia che si manifesta sia all’inizio (durata di attacco) che alla fine (durata di estinzione) di una eccitazione. Nella generazione del suono, cioè, vi è sempre un tempo di transizione necessario per vincere l'inerzia della sorgente sonora e portarla dallo stato di riposo al suo regime normale di vibrazione (transitori, d’attacco), e viceversa (transitorio di estinzione). La dinamica di tali fenomeni è coerente con la natura e la meccanica della sorgente sonora, ed essi accadono in un tempo molto breve. Agli effetti psicoacustici, al disotto dei 30 ms tutti i transitori di attacco appaiono di durata uguale, e altrettanto quelli di estinzione nell'ambito fra i 100 e i 300 ms a seconda che si tratti di deboli o forti intensità.

La durata dei suoni influisce sulla valutazione dell'intensità e dell'altezza. Perché un suono venga percepito, esso deve avere una durata minima che può essere tanto più breve quanto più alta è la sua intensità. Riducendo, però, la durata si riduce anche la sensazione più forte.

Perché l'altezza del suono venga percepita è necessario che esso abbia, indipendentemente dalla sua altezza, una durata minima di 10 ms. Al di sotto di questo valore la sensazione è quella di un impulso di rumore. È pure verificato che la sensazione di suono persiste per circa 150 ms anche dopo che l'eccitazione sonora è cessata. Inoltre si tende a sopravvalutare la durata dei suoni brevi e sottovalutare quella dei suoni lunghi.

I fenomeni psicoacustici di ordine spaziale. L'identificazione spaziale di una sorgente sonora prende il nome di stereofonia. Il riconoscimento della direzione di provenienza di un suono è dovuto all'esistenza dei due apparati uditivi, destro e sinistro, che possono ricevere lo stesso segnale da due posizioni diverse. Quando la fonte sonora si trova in posizione frontale rispetto all'ascoltatore, l'onda sonora perviene alle due orecchie nello stesso tempo, con la stessa fase e la stessa intensità e l'uguaglianza dei due treni di impulsi nervosi che hanno origine dai due apparati cocleari viene interpretata dai centri corticali come provenienza da direzione centrale. Quando, invece, le due orecchie si trovano in posizione asimmetrica rispetto alla sorgente, lo stesso segnale perviene ad esse in tempi successivi e con fase ed intensità diverse, dando origine a due serie di impulsi nervosi che, integrati a livello cerebrale, vengono interpretati come provenienze da direzioni diverse. La distanza è invece valutata sulla base delle esperienze del soggetto e, più facilmente della direzione, può essere oggetto di errore (si pensi, per es., agli effetti di ascolto di voci in condizioni normali, sopra vento e sotto vento). Anche per la direzionalità esiste una soglia differenziale nel senso che la capacità di cogliere lo spostamento di una sorgente sonora o di individuare le direzioni di due sorgenti sonore puntiformi è nulla al disotto di 6° orizzontali e di 8° verticali circa. Mentre l'intensità non pare influire sull’identificazione della provenienza dei suoni quando la lunghezza delle onde percepite comincia a superare la distanza fra le due orecchie riducendo gli effetti della differenza di fase, la capacità di riconoscimento spaziale diminuisce progressivamente fino alle basse frequenze dove diventa problematica. Grande importanza hanno, nella stereofonia, i fenomeni di riflessione delle onde. Ancora maggiore l’intenzionalità dell'ascolto, che permette, per es., di identificare una persona parlante in mezzo ad una folla, selezionando la sua voce in mezzo a tante altre; operazione che non è possibile, al contrario, con un ascolto monoaurale.