Chapitre 4

CARACTERISTIQUES DU SON ET EFFICACITE DE LA SPATIALISATION

 

Problème posé: pour quels types de son le contraste entre "omnidirectionnel" et "bidirectionnel" sera-t-il le plus spectaculaire ?

 


1. Préliminaires : termes employés

On choisit de caractériser un son par deux propriétés fondamentales - spectre et dynamique.

*Spectre : la figure 1 montre en traits continus un spectre large et constant. Les pointillés représentent une résonance positive puis négative. La figure 2 représente, elle, un spectre que l'on dira étroit.

figure 1
figure 2

 

*Dynamique : un son sera dit de "dynamique faible" quand, comme le montre la figure 3, son intensité moyenne prise sur des intervalles très petits - de l'ordre de quelques millisecondes - sera du même ordre de grandeur (définition très approximative).

figure 3

 


2. Expérience 1 (spectre):

 

Lieu : studio 4 - champ proche

A partir d'une voix parlée, on procède à l'expérience suivante: à l'aide de GRM Tools Band Pass, on fabrique quatre nouveaux sons.

1. 20Hz -> 300Hz (filtré passe-bas)
2. 300Hz -> 1,4kHz
3. 1,4kHz -> 6,2kHz
4. 3kHz -> 20kHz (filtré passe-haut)

L'outil GRM Band Pass permettant des pentes de 96dB/oct, on est à peu près sûr d'avoir dans chaque fichier les fréquences voulues.

Puis on spatialise chaque son de la manière suivante : bidirectionnel horizontal, rotation un tour par 4 ou 5 secondes.

On définit trois critères : "largeur", "évidence", "précision de localisation".

1. "largeur"
Le "diamètre" du cercle virtuel parcouru peut être plus ou moins grand.

2. "évidence"
Est-il facile de percevoir cette extra-largeur, ou alors a-t-on l'impression que le son sort du cube, à moins de se concentrer ?

3. "précision de localisation"
Une fois qu'on a bien réussi à percevoir cette extra-largeur, peut-on localiser précisément une position virtuelle de source, ou alors est-ce que tout ceci reste bien flou ?

 

On note les résultats dans un tableau… que voici :

 

largeur

évidence

précision

Non filtré

+++

+++

+++

LPF 300Hz

++

+

+

BPF 300-1k4

++

++

++

BPF 1k4-6k2

++

++

++

HPF 3k

+

++

+++

 

On peut donc donner les conclusions suivantes :

1. un son de spectre large est plus propice à la spatialisation qu'un son à spectre étroit
2. les BF seules donnent une image virtuelle plus large
3. …mais cette image ne sera pas très évidente à entendre (on aura souvent l'impression que le son sort du cube)
4. les HF seules donnent une image étroite, mais évidente et précise

 

Ces conclusions seraient à prendre avec prudence, pour 2 raisons :

1. le test systématique n'a été réalisé qu'avec un seul son
2. influence de la pente 96dB/oct ??

Mais en pratique, elles corroborent tout à fait ce qui se passe à l'usage en général, lors d'essais portant sur tout autre chose, ou lors de réalisations plus musicales.

Même si cela n'a pas été vérifié de manière systématique, il est par ailleurs utile de noter que toute résonance positive du spectre - cf préliminaire - nuit immédiatement aux trois critères en même temps. Ce n'est par contre pas le cas des résonances négatives.

 


3. Expérience 2 (dynamique):

Lieu : studio 4 - champ proche

 

Avant toute expérience, une constatation de la première évidence s'impose rapidement : plus le volume est élevé, plus on a de succès au niveau des critères "évidence" et "précision".

On peur en déduire qu'un son de dynamique élevée, comportant donc des parties fortes et des parties faibles, ne donnera pas les résultats les plus uniformément spectaculaires.

Une expérience simple est donc réalisée : même spatialisation que lors de l'expérience 1, avec d'une part, un son dit "de dynamique faible" - voir préliminaire - et, d'autre part, le même son, modifié de la façon suivante:

Dans ProTools, on dessine une automation très accidentée, la distance séparant les "pics" et les "creux" étant d'environ 50 à 300ms.

Le résultat est évidemment prévisible : le son d'origine donne une belle image, et le son transformé, une image à peu près aussi incompréhensible que le son lui-même.
Exprimé avec plus de rigueur : l'"évidence" est largement meilleur dans le cas du son d'origine, la "précision" également.
Quant à la "largeur", c'est difficile à dire étant donnée la différence de morphologie entre les deux sons, mais elle semble inchangée.


4. Conclusion :

 

Spectre large et plat, faible dynamique : un son muni de tels caractéristiques sera à coup sûr facile à spatialiser.
Conclusion annexe, le cube est très indiqué pour diffuser Scoop ou SkyRock - ou toute musique masterisée de manière abusive.

Ces conclusions ne doivent cependant pas nous faire croire qu'hors ces trois critères remplis, point de salut. Trois raisons à cela :

1. Même si c'était le cas, on peut toujours se servir de ces conclusions pour créer plus facilement des contrastes…

2. Ces conclusions sont surtout là pour qu'on ne confonde pas problèmes de méthode et problèmes de son, donc pour savoir juger, dans un résultat, ce qui est imputable au patch ou autre, et ce qui est imputable au son. Qui plus est, ces conclusions sont assez précieuses quand on a déjà obtenu des résultats prometteurs à l'aide d'une bonne direction de recherche, et qu'on souhaite mettre celle-ci en valeur.

3. Un son de spectre étroit et de forte dynamique peut fort bien se spatialiser, sous certaines conditions…