Effets sonores

Introduction

Les effets sonores sont inclus dans la partie synthèse sonore, essentiellement parce que certaines utilisations musicales les utilisent tels quels pour sortir du champ des possibles, c'est-à-dire, soit comme un élément du discours musical, soit pour rajouter de l'expressivité à un instrument naturel - dans ce cas, nous parlons d'hyper-instruments - (la trompette de Jon Hassel, le saxophone de Jan Garbareck, mais on peut également parler de guitare électrique, de violon électrifié...).

Un effet consiste à modifier un son existant. En général, le schéma qui s'applique au cas des effets est le suivant, avec la condition que si aucun contrôle n'est appliqué sur le son, celui-ci n'est pas modifié :

(son original + contrôle) - effets - son modifié

Description d'un rack d'effets

Les termes adoptés pour qualifier les effets couramment utilisés sur un rack d'effets sont empruntés de l'anglais sans qu'aucun effort n'ait jamais été poursuivi pour les franciser.

Contrôle de la dynamique

expansion/compression:

Historiquement, le contrôle de la dynamique a été développé comme une solution à l'enregistrement de sources sonores dont la dynamique dépassait facilement les 80dB, sur un support magnétique qui n'en supportait pas plus de 50. Dans ces conditions, la solution ad-hoc adoptée fut la suivante : baisser le volume sonore quand le niveau sonore est trop fort, augmenter le niveau sonore quand la source est trop faible. Cette étape s'appelle la compression. L'opération inverse est connue sous le nom d'expansion.

Un mécanisme de compression ou d'expansion est entièrement décrit par la méthode choisie pour mesurer le niveau sonore et par la courbe mettant en relation le niveau d'amplification en fonction du niveau sonore observé.

Globalement, le Dolby (NR pour noise reduction) connu sur les cassettes magnétiques est une forme élaborée de compresseur/expanseur. Le principe est un peu différent : le bruit du support magnétique est uniformément réparti dans les graves et dans les aigus alors que l'on constate que les signaux enregistrés ont en moyenne une pente spectrale de -6dB/octave. Cela a pour conséquence d'exhiber le bruit nuisible du support (le souffle de la cassette par exemple) dans les aigus, là où aucun signal musical ne peut le cacher. Une solution au problème consiste à développer un filtre de compression/expansion qui amplifie (de façon adaptative avec le niveau sonore) les aigus à l'enregistrement, et les atténue à la restitution.

La technique de compression est couramment utilisée sur les stations de radios commerciales, et pendant les pauses publicitaires sur les chaînes de télévision. En effet, cette réduction de la dynamique permet d'augmenter artificiellement le niveau sonore : le niveau maximal ne change pas, tandis que le niveau minimum augmente! Or, actuellement, la loi française ne réglemente que les niveaux maxima admissibles. Donc en réduisant la dynamique, on augmente le niveau moyen sans augmenter le niveau maximum.

Le noise-gate est un autre système agissant sur la dynamique. En fonction du niveau sonore constaté, le noise-gate décide soit de couper complètement le signal entrant quand le niveau sonore est trop faible, soit de le laisser inchangé. Cela a pour effet d'atténuer la nuisance des bruits (bruit de souffle, bruit d'enregistrement...) en présence de blancs sur la bande.

fade-in / fade-out / crossfade :

Cette technique consiste à éviter que le son n'apparaisse ou ne disparaisse trop brusquement. Un fade-in consiste par exemple à monter progressivement le volume sonore de 0 jusqu'au niveau nominal dans un intervalle d'une seconde pour éviter que la musique ne brise trop rapidement le silence. Le fade-out est l'opération inverse, et consiste donc à réduire progressivement le volume sonore. Enfin, un cross-fade (ou fondu enchaîné) consiste à mixer deux sources sonores afin de passer progressivement de la première à la seconde en gardant approximativement le même volume sonore.

Effets temporels

Chorusing/Harmonizer :

Le chorusing est un effet qui permet de multiplier virtuellement une source sonore. À partir d'un seule voix chantée, il est donc possible artificiellement de créer l'impression d'un choeur.

L'harmoniseur procède de façon complètement différente. À partir d'un signal original, il fabrique un signal à l'octave, à la quinte... permettant ainsi d'obtenir un accord harmonique à partir d'une seule source sonore.

Réverbérations :

Actuellement, en production audio, toutes les sources sonores sont enregistrées en milieu acoustiquement neutre (dans un studio) sur des pistes séparées. L'opération de mixage consiste alors à regrouper toutes les sources sonores ensemble, et à leur appliquer séparément, un effet de salle différent (concert hall, cathedral, ...). On maîtrise ainsi assez précisément les facteurs de présence pour chacune des sources sonores. En d'autres termes, les effets de salle ne sont quasiment plus jamais naturels (sauf pour les enregistrements de concerts de musique classique... encore que...). Les dispositifs qui simulent ces effets de salle sont les réverbérateurs (réverbs).

Parmi tous les effets de réverbération, l'écho est très largement utilisé pour induire une rythmique binaire. À chaque impulsion (par exemple de batterie ou de guitare basse), l'écho renvoie une autre impulsion moins forte quelques dixièmes de secondes plus tard et ainsi de suite périodiquement.

Modulation en anneau:

Le modulateur en anneau tire son nom du montage électronique utilisé pour multiplier deux signaux analogiques. Autant, l'opération de multiplication est simple dans le domaine des signaux numériques (si 23 est la valeur de l'échantillon du premier signal, 8 la valeur de l'échantillon du second signal, alors 8*23=184 est la valeur de l'échantillon du signal résultant de la multiplication des deux signaux), autant l'opération est délicate en électronique analogique. Le montage consiste en un pont de diodes que tous les électroniciens connaissent sous le nom de modulateur en anneau.

Quand les deux signaux multipliés sont quelconques, le signal résultant est du bruit, sans grand intérêt.

Si un des signaux est une sinusoïde (la modulante ou la porteuse), alors de la modulation résulte un signal dont toutes les fréquences se trouvent décalées à gauche et à droite (vers les graves et les aigus) d'un montant correspondant à la fréquence de la modulante. En conséquence, si le signal original était périodique (harmonique), alors le résultat à toutes les chances de ne plus l'être (et donc de devenir inharmonique). Ce peut être un moyen de rajouter de l'inharmonicité, ou de la rugosité dans un son.

Si la modulation concerne un signal original et un signal très basse fréquence (une enveloppe temporelle), alors le résultat aboutit à une modulation en amplitude, c'est-à-dire au rajout d'une enveloppe temporelle, qui peut induire des effets sonores intéressants, comme par exemple une rythmique...

Effets fréquenciels

Égaliseur :

Un égaliseur (ou équaliseur) consiste en un dispositif (un banc de filtres) qui permet d'amplifier ou d'atténuer sélectivement des gammes de fréquences. Sur les égaliseurs graphiques, chaque curseur correspond au niveau d'amplification pour un intervalle de fréquences précis. Un égaliseur n'est rien d'autre qu'un filtre dont le gain en fréquence est réglable graphiquement.

Ce dispositif équipe un certain nombre d'équipements HIFI de salon. Professionnellement, un égaliseur permet de corriger certaines résonances, certaines colorations que des salles de diffusion induisent sur le son. Ce dispositif permet donc d'obtenir le même rendu sonore dans des salles différentes par égalisation de la réponse sonore.

La résolution des égaliseurs est qualifiée en général d'octave, de demi-octave ou de tiers d'octave. Un égalisateur en tiers d'octave possède par exemple trois filtres différents pour le réglage du gain dans la bande de fréquence 400 - 800Hz. Des trois résolutions, l'égalisateur en tiers d'octave est celui qui a la plus fine.

Flaging/Phasing :

Il semble qu'historiquement, le flanging ait été mis en oeuvre par des DJs, en tentant de synchroniser deux mêmes disques vynils sur des platines différentes. Pour des raisons mécaniques, la synchronisation parfaite n'est pas possible. En plus de cette dé-synchronisation, il existe toujours un jitter, car les vitesses de rotation des deux platines ne sont pas stables. L'un dans l'autre, le son résultant du mixage des deux platines étaient qualifié de phasy, et intéressait énormément les DJs. Depuis lors, l'effet peut être reproduit artificiellement très simplement par un flanger.

Le flanging et le phasing consistent à colorer artificiellement un son en sommant deux versions déphasées du même signal. Un effet assez étrange de rotation résulte de la modification périodique du déphasage.

Il est plus facile de colorer les sources sonores qui ne possèdent pas de hauteur sonore clairement définie. L'utilisation la plus courante consiste donc à appliquer le flanging, exclusivement, aux pistes de batterie et de percussion. L'effet était très prisé en musique pop-rock au début des années soixante-dix.

Effets non-ordinaires

Au delà des effets ordinaires, banals, courants, que tout le monde utilise depuis une trentaine d'années se rajoutent à présent des techniques plus sophistiquées transformant la nature même du son. Souvent, ces techniques s'appuient sur des modèles de signaux dont nous parlerons au chapitre suivant.

Vocoders

En principe, un vocodeur est un dispositif générique permettant de coder puis de re-synthétiser la voix, dans le but d'une transmission efficace. Toutefois, les premiers dispositifs déformaient considérablement la voix, lui donnant une texture particulièrement robotique. Aussi, les premiers dispositifs furent-ils utilisés dans des applications musicales, profitant ainsi des effets apportés au timbre de la voix.

Vocodeurs en sous-bande :

Ces vocodeurs résultent directement du modèle source-filtre (ou soustractif) décrit au chapitre suivant. Ce dispositif permet de décorreller complètement la prosodie de la voix (la mélodie du langage) des phonèmes prononcés. L'effet consiste donc en une voix de robot, dont la hauteur peut-être contrôlée indépendamment du locuteur, par exemple par un clavier.

Vocodeurs de phase :

La technologie des vocodeurs de phase est beaucoup plus subtile. Elle permet un certain nombre d'effets, tels que la synthèse croisée, la dilatation temporelle, le changement de hauteur...

Dilatation temporelle

Cet effet, connu également en anglais sous le nom de time stretching, est délicat à mettre en oeuvre, tant il est difficile de clairement définir ce que chacun attend d'une dilatation temporelle.

En principe, sur les magnétophones à bande, ou sur les platines disques, ralentir le rythme de défilement de la bande devant la tête de lecture, permet certes de ralentir la cadence du signal original, mais au prix d'un décalage vers les graves quand on ralentit, ou vers les aigus quand on accélère. Autrement dit, la hauteur et la cadence de la bande sont intimement liées. La dilatation temporelle consiste alors à ralentir un signal original, sans pour autant porter atteinte à ces caractéristiques fréquencielles.

En fait, le problème est bien plus délicat, car nous n'attendons pas que tous les sons soient dilatés de la même façon. Prenons par exemple le cas de la voix. Les voyelles peuvent en effet être prononcées plus ou moins rapidement, mais ce n'est pas le cas des plosives ([p], [k], [t]...), dont la vitesse d'exécution ne peut pas être modifiée. Cela indique, dans un premier temps, que les sons ne doivent pas être rallongés uniformément, et que le résultat d'une dilatation temporelle uniforme n'a pas forcément d'équivalent naturel ou réaliste. En fait, le changement de cadence d'un son peut rapidement devenir une opération très complexe.

Changement de hauteur

Les mêmes réflexions que précédemment sont encore valables pour le changement de hauteur à savoir :

a priori, cadence et hauteur sont indissociables,
dans le cas de la voix, les consonnes n'ont pas (à proprement parler) de hauteur, donc, il n'y a guère de sens à changer « la hauteur » des consonnes,
le résultat du changement uniforme de hauteur n'est pas forcément réaliste.

En pratique, les techniques de dilatation temporelle alliées à celles de changement de hauteur, permettent, à partir d'un signal original par exemple de parole, d'en changer complètement, et à volonté, la prosodie et l'évolution temporelle.

Changement de timbre

Les techniques simples de changement de timbre consistent par exemple à utiliser la sortie d'un harmonizer, associée à un égaliseur spécialement réglé pour renforcer certaines fréquences. On aboutit alors à une voix plus grave, ou plus caverneuse, ou plus nazillarde...

Changement de hauteur de la voix et consistance de la position des formants.

Toutefois, les arguments précédents concernant les transformations du signal de parole restent encore valables ici. En particulier on ne transforme pas de la même façon en parole les consonnes plosives, les voyelles, les consonnes fricatives... Pour faire des transformations de haute qualité, il faut segmenter le signal, c'est-à-dire à marquer la position des voyelles, des fricatives, des plosives... et appliquer différentes transformations à chacun des segments. Ce n'est pas encore (malheureusement) une tâche entièrement automatisable.

Page remise à jour le
Ven 26 Déc 1997 15:37:14

Tassart Stéphan
IRCAM

Ce document a été formaté par htmlpp.