Chapitre 8

NOTES SUR LE SON ET LES OUTILS UTILISES

 

Problème posé:

Lors des expériences et des réalisations, on a utilisé un certain nombre d'outils, et de manière centrale, Max MSP. Voici, à propos de ce logiciel et de ses caractéristiques, quelques observations que l'on a pu faire au cours des travaux, sous l'angle du son et de la perception.



1. Complexité des patchs et rapport signal / bruit

On sait, d'une manière générale, qu'il n'est jamais très judicieux de cascader des traitements, qu'ils soient réalisés dans le domaine numérique ou analogique, sans prêter une attention particulière aux éventuelles dégradations du son que ces traitements pourraient apporter.

Ca problème, dans le cas de l'utilisation de Max MSP, est particulièrement important. En effet, la nature même de ce logiciel incite tout naturellement l'utilisateur à emboîter patchs et sous-patchs pour obtenir le résultat escompté.

Ceci peut résulter en une importante dégradation du signal, autant au niveau du critère perceptif "transparence du son" que, surtout, au niveau du rapport signal / bruit.

 

A titre d'exemple, si l'on compare ce qu'on entend en jouant un son avec un lecteur basique, comme SoundHack, et en jouant le même son avec un des patchs classiques utilisés pour le cube, comme TheRevCube3r, on constate une différence de rapport signal / bruit, qui, à vue de nez, doit avoisiner les 6dB.

Ce, bien sûr, en configurant le patch pour qu'il soit théoriquement "transparent" (gain nul, position omni…).

Cette différence nous incite donc à simplifier au maximum les patchs, en enlevant tout ce qui n'est pas indispensable.

Autre conséquence, ne serait-il pas judicieux, lors de la construction d'un patch Max, de ne pas tant se focaliser sur l'élégance architecturale et conceptuelle du projet, mais plutôt de prendre un peu de temps, à chaque étape, pour écouter attentivement le résultat en terme de son ?

 


2. Différent types de filtres

Max MSP donne la possibilité d'intégrer au patch différents types de filtres que l'on aura calculé soi-même.

Afin de juger dans quelle mesure il est judicieux d'utiliser des filtres définis de cette manière, il n'est pas inutile de faire un détour par le domaine de l'audio en général, en examinant un peu ce qu'on peut trouver sur le marché des appareils audio en la matière.

 

*Récit d'une "expérience théorique"

En électronique analogique, il est très facile de réaliser un filtre passe-bas simple. Un ampli op, un condensateur, une résistance. Il y en a pour 3 minutes et quelques francs. Si l'on veut un filtre de bonne qualité, on paiera un peu plus cher des composants de tolérance plus serrée.

Après cela, on peut réaliser de la même manière un passe-haut, un passe-bande, un correcteur paramétrique à facteur de qualité réglable, etc… En utilisant de bons composants et de bons schémas, on peut très bien arriver à fabriquer un filtre dont les caractéristiques suivront exactement une courbe de transfert théorique qu'on aura déterminée par calcul.

Une fois qu'on a conçu ce filtre "parfait" - très bonne concordance avec les courbes théoriques, excellent rapport signal / bruit, on le fabrique en série, et le problème des correcteurs audio est réglé une fois pour toutes.

Malgré cela, à l'heure actuelle, on trouve sur le marché des appareils analogiques dont l'unique rôle est la correction spectrale. Ces machines, très utilisées dans les studios professionnels, sont le fruit d'un très long travail de la part de leurs concepteurs, ceux-ci refusant généralement d'expliquer comment ils s'y sont pris.

Comparons maintenant notre filtre parfait avec une tel appareil. Une constatation va rapidement s'imposer : le filtre parfait, quoique numériquement irréprochable, va dégrader le son de manière très désagréable pour peu qu'on l'utilise de manière un peu radicale, alors que la machine "imparfaite" va être à l'origine d'une correction quantitativement fantaisiste, mais va par contre modifier le son d'une manière très satisfaisante pour l'oreille.

 

*Conclusion de cette "expérience théorique" / une tentative d'explication.

On voit donc que dans ce cas, l'oreille humaine préfère ce qui n'est pas rigoureux, ou plutôt ce qui n'est pas que rigoureux. Il semble qu'il soit nécessaire, lors de la conception d'un filtre, de prévoir, au delà d'un simple calcul de caractéristiques, un aspect d' "adaptation" à l'oreille, ce que semble entériner l'expérience suivante :

A l'aide d'instruments d'analyse appropriés, on règle nos deux appareils pour qu'ils aient la même courbe de transfert ; un bruit rose, un analyseur de spectre, et le tour est joué.

De nouveau, on compare l'aspect perceptif des corrections effectuées par chacune de ces deux machines. La confrontation tourne de nouveau à l'avantage de la machine "imparfaite", dans la mesure, bien entendu, où celle-ci a été bien conçue.

D'où provient donc la différence ?

Sans chercher à être exhaustif, on peut suggérer deux pistes.

 

1°) La correction spectrale de la machine imparfaite en question s'accompagne probablement de distorsions temporelles.

On ne parle pas ici de la partie imaginaire de la transformée de Fourier de la réponse impulsionnelle du filtre, à l'origine de déphasages ; le problème est différent.

Cette distorsion temporelle correspondrait plutôt au temps d'attaque lié à un phénomène de compression associé au filtrage. Ce phénomène est par exemple très naturel dans le cas de correcteurs basés sur la technologie des lampes.

Les caractéristiques de ce phénomène de compression, et en particulier le temps d'attaque, varieraient suivant les caractéristiques du filtrage.

Pour une raison assez floue, une telle compression, associée à une distorsion harmonique modérée dont le taux varie parallèlement à la modification du gain due à la compression, convient tout à fait à l'oreille humaine.

Par exemple, si l'on augmente le gain autour de 3-8 kHz, l'épiphénomène en question va perceptivement rehausser les fréquences voulues de manière beaucoup plus efficace et beaucoup plus satisfaisante pour l'oreille que ne le ferait un filtrage "pur".

 

2°) Quand on parle de la fonction de transfert d'un filtre, on en parle généralement au sens "macroscopique".

Revenons à nos deux courbes de transfert en apparence identiques. Utilisons maintenant des appareils de mesure d'une extrême précision. Il est à parier qu'au niveau "microscopique", les deux courbes sont fondamentalement différentes.

En ce sens, la différence subjective au niveau de l'efficacité des deux filtrages proviendrait de l'aspect microscopique, du "grain" de la courbe de transfert.

Ceci est à mettre en parallèle avec la faculté que possède l'oreille humaine à reconnaître une voix, ou un instrument dont on a complètement transformé le timbre. Elle s'appuierait sur des informations existant à très petite échelle.

Etant donné un certain filtrage, on peut donc supposer qu'il existe des composantes à petite échelle qui participeraient à ce que nous percevons comme une modification d'une large bande de spectre, et qui rendent un traitement plus efficace, ou plus satisfaisant subjectivement, et qui de fait rendraient homogène à la perception une transformation qu'on a conçue théoriquement.

 

*Retour au domaine numérique / remarques sur l'expérimentation.

Revenons à Max MSP et à ses filtres calculés a priori. On comprend mieux maintenant toutes les réserves que l'on peut exprimer au sujet de l'utilisation de tels filtres.

Il existe pour Macintosh des plug-ins de filtrage très corrects, même si relativement onéreux. Si l'on cherche à comparer une transformation effectuée par l'un de ces plug-ins avec une transformation similaire, effectuée par exemple à l'aide du module de filtrage du Spat, on arrive aux mêmes conclusions que précédemment : tout simplement, il y en a un qui "sonne" mieux que l'autre. Et cette fois, la conclusion se base sur l'expérimentation.

Le problème n'est pas anecdotique : les filtres mis en œuvre dans le module du Spat ne sonnent vraiment pas bien. Lors de l'utilisation de patchs Max, en particulier ceux que l'on utilise pour le cube, on les met en cascade. Il est bien difficile,d'obtenir alors un résultat perceptivement satisfaisant.

Lors de la réalisation de la séquence de quelques minutes réalisée en Juin 2000, on a veillé à enlever systématiquement tous les filtres présents dans les patchs utilisés : il est probable que cela ait grandement favorisé le résultat en termes de son.

 

Une question se pose néanmoins : souvent, y compris donc dans les activités liées au cube, on a besoin d'un filtrage particulier, paramétrable d'une certaine manière, et il est extrêmement pratique d'utiliser alors un filtre calculé à l'avance, et par nature facile à intégrer dans le patch.

Par exemple, dans le cas du cube, pour le filtre permettant de compenser la distorsion spectrale induite par les différences de rayonnement de la source - cardio, pente de 6dB / octave sur tout le spectre en théorie.

 

--> Il y a alors deux solutions :

1°) Calculer un filtre théoriquement pour compenser cette pente, en fonction du coefficient de cardioicité

2°) Se servir d'un plug-in VST, l'intégrer au patch, et le paramétrer empiriquement - perceptivement, plutôt - pour qu'il adopte le comportement souhaité.

 

--> Avantages et inconvénients de chaque méthode, dans le cadre de ce raisonnement :

1°) Elégance conceptuelle (pourquoi pas, après tout…)

mais

Dégradation du son au sens perceptif
Difficultés d'adaptation de la modélisation à la réalité

( A preuve, le premier essai en ce sens ne fonctionnait pas du tout, et si l'on cherche à être rigoureux et à intégrer des paramètres tels que directivité des HP,distance entre ceux-ci, effet de proximité… on risque de ne jamais pouvoir être exact de toutes façons, et de finir par adapter empiriquement un calcul à une réalitétrop complexe pour être modélisée précisément )

2°) Bonne qualité de son au sens perceptif

mais
Temps d'expérimentation élevé

 

Le choix semble donc assez évident.

 


3. Différents types de reverb

Une fois encore : de manière encore plus flagrante que dans le cas des filtres, toutes les reverbs ne sont pas identiques, loin s'en faut.
Quelques arguments dans ce sens, qui montrent au passage l'existence d'aspects communs dans la conception d'une reverb et celle d'un filtre.

 

1°) dans le cas des reverbs, l'aspect microscopique ( voir le raisonnement mené au sujet des filtres ) est extrêmement important, infiniment plus que précédemment

2°) les modèles du genre (Lexicon surtout), utilisent un paramétrage de leur reverb qui a bien plus à voir avec le bidouillage qu'avec une modélisation "linéaire" et maîtrisable (paramètres "spin" et "wand" de la Lexicon 300, par exemple ), ce qui nous rappelle ce qu'on a dit au sujet des filtres - nécessité d'introduire un aspect décorrélé des principes de départ, dont le but est la "mise en forme" du résultat brut qui adaptera celui-ci empiriquement afin de la rendre perceptivement intéressant.

3°) un des derniers perfectionnements théoriques en matière de reverb, utilisé là encore par Lexicon, se base sur le phénomène de sensibilité aux conditions initiales, propriété des systèmes dynamiques liés au chaos déterministe, une théorie par sa nature très liée aux problèmes d'échelle

… mais une fois les aspects théoriques oubliés, il reste ce qu'on entend lorsque l'on écoute la qualité du son.

 

Et, à l'usage, la reverb du Spat pose des problèmes, en particulier lorsqu'on souhaite un résultat réaliste, ce qui est le cas pour l'utilisation du cube - cf chapitre sur la reverb. Même si cette reverb reste correcte, ce qui n'est pas le cas des filtres généralament développés pour Max.

 

Notons que ce manque de réalisme pourrait provenir soit d'une modélisation insuffisamment précise, soit justement d'un problème au niveau de cette "mise en forme" perceptive.

 

Il serait alors une bonne idée d'acquérir et d'utiliser d'autres reverbs, comme la Waves VST pour intégrer à Max, ou la Lexiverb en format TDM, en sachant ceci dit que les meilleures reverb sont de toutes façons hardware.