Avec cet article, j’essaie de donner un petit aperçu de l’acoustique psychologique, qui traite de la perception sonore humaine.

Elemente der menschlichen Schallwahrnehmung
Éléments de la perception sonore humaine

Mais avant de se pencher sur l’audio 3D, il faut connaître les éléments de base de la perception sonore humaine. J’espère que cela aidera à mieux comprendre comment fonctionne l’audio 3D.

L’audio 3D (aussi : audio immersif) signifie les sons provenant de TOUTES les directions qui se produisent autour de l’auditeur. Cela veut dire de l’avant et de l’arrière, à gauche et à droite et surtout du haut et du bas. Cette perception est notre état normal d’audition naturelle dans un environnement réel.

La signification du concept d’immersion dans l’audio et l’acoustique se fait référence à la sensation psychologique d’être entouré et complètement enveloppé par certaines sources sonores et bruits ambiants.

L’écoute binaural

Binaural signifie littéralement „deux oreilles“. Avec l’audition binaurale, les humains peuvent déterminer avec précision la direction et l’origine des sons. Mais avant de regarder de plus près les caractéristiques des signaux qui pénètrent nos oreilles, nous faisons une courte excursion dans l’anatomie de l’oreille humaine.

L’oreille humaine

Éléments de l’oreille externe humaine

L’oreille externe se compose du pavillon et du conduit auditif. Le pavillon de l’oreille sert à focaliser le signal sonore et fait changer le son en fonction de sa direction. Le conduit auditif dirige le son concentré vers le tympan, où une vibration mécanique est convertie en impulsion électrique.

Le conduit auditif mesure environ 2,3 cm de long et est une cavité résonnante. Un tel résonateur est un tube fermé d’un côté. Si un quart de longueur d’onde correspond à la longueur du conduit auditif, des résonances se produisent, c’est-à-dire une augmentation d’une certaine fréquence. Cela permet d’augmenter une certaine gamme de fréquences, ce qui est particulièrement important pour la perception des sons naturels et l’intelligibilité de la parole. A cette longueur exacte, une résonance à 3728,26 Hz exactement est générée (Lien vers le convertisseur : https://campus.hofa-college.de/pages/tipps-und-tricks/hofa-tools/wellenlaenge-frequenz.php). C’est la raison pour laquelle la courbe de Fletcher-Munson montre la plus grande sensibilité de l’audition humaine.

Les signaux différents

Signaux binauraux

Un signal binaural nous aide à comprendre la différence entre les signaux reçus de chaque oreille. Les trois paramètres binauraux les plus importants sont le niveau et la différence de temps entre les différentes fréquences de deux signaux. Ces valeurs sont la différence de niveau interauriculaire (ILD) et la différence de temps interauriculaire (ITD). Le troisième facteur pour l’analyse directionnelle est le timbre différent des sons. Les signaux binauraux sont importants pour détecter la direction du son dans le plan horizontal („azimut“). Par exemple, s’il y a une source sonore du côté droit de la tête, l’oreille droite reçoit le son directement, l’oreille gauche, c’est-à-dire l’oreille opposée, le reçoit seulement après un certain temps. Cette différence est due à la distance entre les deux oreilles. De plus, l’oreille gauche reçoit le son avec plus d’ombre sur la tête, car le signal est dévié et réfléchi par la tête, le torse, l’oreillette, etc. Essentiellement, l’oreille humaine reconnaît la direction du son sur un plan horizontal par la différence de temps (ITD) et la différence de niveau (ILD).

Les signaux monauraux

Les signaux binauraux ne donnent pas une image complète de l’emplacement du son car l’oreille humaine est parallèle au plan horizontal. En plus des repères binauraux, les humains utilisent également des repères monauraux pour déterminer la position et l’origine d’un son dans l’espace. Plus précisément, un signal monophonique est utilisé pour capturer le niveau sonore, puisque les caractéristiques de fréquence d’un signal d’entrée varient avec l’angle des aigus. Par exemple, un son à la même hauteur que l’oreille et un autre son au-dessus de l’oreille ont des fréquences de résonance différentes avec des réflexions différentes sur le pavillon de l’oreille, ce qui entraîne des pics ou des encoches différents dans le spectre des fréquences.

Écoute spatiale et localisation sonore

La perception auditive est un phénomène complexe qui ne peut être traité ici dans son intégralité. Comme je l’ai dit, la perception est déterminée par la physiologie de l’organe auditif. Mais les phénomènes cognitifs, c’est-à-dire la capacité de percevoir les signaux de l’environnement, de les traiter dans le cerveau et d’apprendre leurs caractéristiques sonores variables, ont également une influence.

Laissez-moi résumer : La position d’une source sonore est décrite par sa direction et sa distance. La perception spatiale de l’ouïe et de la direction distingue le plan horizontal („azimut“), le plan vertical („élévation“) et le plan frontal („distance“). Les différences d’intensité, de durée et de tonalité sont déterminantes pour une localisation précise. La position des sources sonores résulte à la fois de l’audition binaurale – dans le plan horizontal – et de l’audition monophonique – dans le plan médian.

le plan horizontal

Les différences de l’intensité

Les différences d’intensité sonore (ILD) dans le plan horizontal sont causées par une ombre acoustique de la tête. Pour une exposition latérale des sons à 90°, une atténuation de 7 dB est enregistrée de l’autre côté de l’oreille. Selon la fréquence, la perception de la musique est inférieure de 7 à 10 dB.


Les différences de temps

Les différences de temps (ITD) sont dues au fait que le son doit parcourir une distance supplémentaire. Cela signifie que le son atteint l’oreille tournée vers la source sonore plus tôt que l’autre oreille. Mesuré à partir d’un angle de 90°, cela fait environ 65 ms. La plus petite différence perceptible est de 0,03 ms. Cela correspond à un changement de direction de 3°. La différence de temps en tant que critère de localisation n’est importante que dans la fourchette de fréquences comprise entre 100 Hz et 1600 Hz.

le plan vertical

Entre 300 Hz et 1,6 kHz, les différences de temps et les différences d’intensité sonore sont prises en compte, de sorte qu’à partir de 2 kHz seules les différences d’intensité sont importantes pour la localisation d’une source sonore.

Les différences de timbre

Les différences de tonalité caractérisent le phénomène que le son de l’autre côté de la source est plus mat. Cela peut s’expliquer par le fait que la tête est un obstacle naturel au son de fréquence plus élevée. A ces fréquences, le son est réfléchi par la tête. Les basses fréquences sont incurvées autour de la forme de la tête, mais arrivent toujours de l’autre côté.

L’indicateur le plus important avec lequel l’oreille humaine détermine la hauteur d’une source sonore est le spectre monophonique. C’est-à-dire le changement du contenu en fréquence du son correspondant. Elle est déterminée par son interaction avec la forme du pavillon. Son absence par contre, et l’absence de ses indications influencent la précision de la perception de la position.

le plan frontal

Ecoute via casque ou haut-parleurs

Comparé aux casques, les haut-parleurs ne sont pas une option souhaitable lorsqu’il s’agit de transducteurs pour des applications audio immersives. Si vous l’écoutez via des haut-parleurs, les caractéristiques de la pièce sont toujours perçues. Cela rend le potentiel immersif d’une expérience audio 3D beaucoup plus difficile.

Les casques, en revanche, bloquent complètement le son du monde extérieur, empêchent la perception des artefacts dans l’espace local et permettent d’être „pleinement présents“ dans le monde virtuel. En plus, la configuration d’un haut-parleur virtuel est limitée par la taille de la pièce où se trouvent les haut-parleurs, tandis que l’utilisation du casque permet une espace virtuel illimité. Plus important encore, les écouteurs permettent l’interactivité, qui est un élément central de l’expérience 3D. Les utilisateurs doivent pouvoir se déplacer dans l’espace et les haut-parleurs fixes rendent le suivi de leurs mouvements extrêmement difficile.

Écoute par casques

Le son émis par les enceintes du casque est transmis directement à l’oreille affectée sur la coque du casque et non à la tête et aux deux oreilles, comme dans l’audition naturelle. Avec les oreillettes intra-auriculaires, l’effet de filtre acoustique causé par l’anatomie du conduit auditif est également éliminé. Cela signifie que le cerveau ne dispose pas des informations nécessaires à une évaluation correcte du son. En particulier, l’information directionnelle essentielle à la localisation acoustique des sources sonores n’est pas disponible. Au lieu d’une position frontale naturelle, la séparation stricte des deux signaux stéréo à travers du casque donne lieu à une position non naturelle. L’image sonore semble exister complètement à l’intérieur ou au bord de la tête et non à l’extérieur.

Cet effet est évité lors de l’enregistrement binaural et de la reproduction !

Toutefois, si vous souhaitez optimiser les mixages avec des objets pour une lecture naturelle au casque, vous devez introduire les fonctions HRTF (Head Related Transfer Functions) dans la chaîne de la reproduction. Ils servent à simuler mathématiquement les fonctions de filtrage du pavillon de l’oreille.

L’estimation de la distance dans le plan frontal est basée essentiellement sur trois facteurs. Tout d’abord, les différences de volume signifient que le signal est d’autant plus éloigné qu’il est silencieux. Deuxièmement, plus la distance à la source sonore est grande, plus la réverbération et les réflexions s’ajoutent au son direct. Et troisièmement, les différences sonores sont perçues lorsque la source sonore est éloignée. Plus la distance est grande, moins les hautes fréquences atteignent l’oreille.

error: Content is protected !!