Effets sonores
Introduction
Les effets sonores sont inclus dans la partie synthèse sonore,
essentiellement parce que certaines utilisations musicales les
utilisent tels quels pour sortir du champ des possibles,
c'est-à-dire, soit comme un élément du discours musical, soit pour
rajouter de l'expressivité à un instrument naturel - dans ce cas, nous
parlons d'hyper-instruments - (la trompette de Jon Hassel, le
saxophone de Jan Garbareck, mais on peut également parler de guitare
électrique, de violon électrifié...).
Un effet consiste à modifier un son existant. En général, le schéma
qui s'applique au cas des effets est le suivant, avec la condition que
si aucun contrôle n'est appliqué sur le son, celui-ci n'est pas
modifié :
(son original + contrôle) - effets - son modifié
Description d'un rack d'effets
Les termes adoptés pour qualifier les effets couramment utilisés sur un
rack d'effets sont empruntés de l'anglais sans qu'aucun effort n'ait
jamais été poursuivi pour les franciser.
Contrôle de la dynamique
expansion/compression:
Historiquement, le contrôle de la dynamique a été développé comme une
solution à l'enregistrement de sources sonores dont la dynamique
dépassait facilement les 80dB, sur un support magnétique qui n'en
supportait pas plus de 50. Dans ces conditions, la solution ad-hoc
adoptée fut la suivante : baisser le volume sonore quand le niveau
sonore est trop fort, augmenter le niveau sonore quand la source est
trop faible. Cette étape s'appelle la compression. L'opération
inverse est connue sous le nom d'expansion.
Un mécanisme de compression ou d'expansion est entièrement décrit par
la méthode choisie pour mesurer le niveau sonore et par la courbe
mettant en relation le niveau d'amplification en fonction du niveau
sonore observé.
Globalement, le Dolby (NR pour noise reduction) connu sur les
cassettes magnétiques est une forme élaborée de
compresseur/expanseur. Le principe est un peu différent : le bruit du
support magnétique est uniformément réparti dans les graves et dans
les aigus alors que l'on constate que les signaux enregistrés ont en
moyenne une pente spectrale de -6dB/octave. Cela a pour conséquence
d'exhiber le bruit nuisible du support (le souffle de la cassette par
exemple) dans les aigus, là où aucun signal musical ne peut le
cacher. Une solution au problème consiste à développer un filtre de
compression/expansion qui amplifie (de façon adaptative avec le niveau
sonore) les aigus à l'enregistrement, et les atténue à la restitution.
La technique de compression est couramment utilisée sur les stations de
radios commerciales, et pendant les pauses publicitaires sur les
chaînes de télévision. En effet, cette réduction de la dynamique
permet d'augmenter artificiellement le niveau sonore : le niveau
maximal ne change pas, tandis que le niveau minimum augmente! Or,
actuellement, la loi française ne réglemente que les niveaux maxima
admissibles. Donc en réduisant la dynamique, on augmente le niveau
moyen sans augmenter le niveau maximum.
Le noise-gate est un autre système agissant sur la
dynamique. En fonction du niveau sonore constaté, le noise-gate décide
soit de couper complètement le signal entrant quand le niveau sonore
est trop faible, soit de le laisser inchangé. Cela a pour effet
d'atténuer la nuisance des bruits (bruit de souffle, bruit
d'enregistrement...) en présence de blancs sur la bande.
fade-in / fade-out / crossfade :
Cette technique consiste à éviter que le son n'apparaisse ou ne
disparaisse trop brusquement. Un fade-in consiste par
exemple à monter progressivement le volume sonore de 0 jusqu'au niveau
nominal dans un intervalle d'une seconde pour éviter que la musique ne
brise trop rapidement le silence. Le fade-out est l'opération
inverse, et consiste donc à réduire progressivement le volume
sonore. Enfin, un cross-fade (ou fondu enchaîné)
consiste à mixer deux sources sonores afin de passer progressivement
de la première à la seconde en gardant approximativement le même
volume sonore.
Effets temporels
Chorusing/Harmonizer :
Le chorusing est un effet qui permet de multiplier
virtuellement une source sonore. À partir d'un seule voix chantée, il
est donc possible artificiellement de créer l'impression d'un choeur.
L'harmoniseur procède de façon complètement différente. À
partir d'un signal original, il fabrique un signal à l'octave, à la
quinte... permettant ainsi d'obtenir un accord harmonique à partir
d'une seule source sonore.
Réverbérations :
Actuellement, en production audio, toutes les sources sonores sont
enregistrées en milieu acoustiquement neutre (dans un studio) sur des
pistes séparées. L'opération de mixage consiste alors à
regrouper toutes les sources sonores ensemble, et à leur appliquer
séparément, un effet de salle différent (concert hall, cathedral,
...). On maîtrise ainsi assez précisément les facteurs de présence
pour chacune des sources sonores. En d'autres termes, les effets de
salle ne sont quasiment plus jamais naturels (sauf pour les
enregistrements de concerts de musique classique... encore que...). Les
dispositifs qui simulent ces effets de salle sont les
réverbérateurs (réverbs).
Parmi tous les effets de réverbération, l'écho est très
largement utilisé pour induire une rythmique binaire. À chaque
impulsion (par exemple de batterie ou de guitare basse), l'écho
renvoie une autre impulsion moins forte quelques dixièmes de secondes
plus tard et ainsi de suite périodiquement.
Modulation en anneau:
Le modulateur en anneau tire son nom du montage électronique
utilisé pour multiplier deux signaux analogiques. Autant, l'opération
de multiplication est simple dans le domaine des signaux numériques
(si 23 est la valeur de l'échantillon du premier signal, 8 la valeur
de l'échantillon du second signal, alors 8*23=184 est la valeur de
l'échantillon du signal résultant de la multiplication des deux
signaux), autant l'opération est délicate en électronique
analogique. Le montage consiste en un pont de diodes que tous les
électroniciens connaissent sous le nom de modulateur en anneau.
Quand les deux signaux multipliés sont quelconques, le signal résultant
est du bruit, sans grand intérêt.
Si un des signaux est une sinusoïde (la modulante ou la
porteuse), alors de la modulation résulte un signal dont
toutes les fréquences se trouvent décalées à gauche et à droite (vers
les graves et les aigus) d'un montant correspondant à la fréquence de
la modulante. En conséquence, si le signal original était périodique
(harmonique), alors le résultat à toutes les chances de ne plus l'être
(et donc de devenir inharmonique). Ce peut être un moyen de rajouter
de l'inharmonicité, ou de la rugosité dans un son.
Si la modulation concerne un signal original et un signal très basse
fréquence (une enveloppe temporelle), alors le résultat
aboutit à une modulation en amplitude, c'est-à-dire au rajout d'une
enveloppe temporelle, qui peut induire des effets sonores intéressants,
comme par exemple une rythmique...
Effets fréquenciels
Égaliseur :
Un égaliseur (ou équaliseur) consiste en un
dispositif (un banc de filtres) qui permet d'amplifier ou d'atténuer
sélectivement des gammes de fréquences. Sur les égaliseurs graphiques,
chaque curseur correspond au niveau d'amplification pour un intervalle
de fréquences précis. Un égaliseur n'est rien d'autre qu'un filtre
dont le gain en fréquence est réglable graphiquement.
Ce dispositif équipe un certain nombre d'équipements HIFI de
salon. Professionnellement, un égaliseur permet de corriger certaines
résonances, certaines colorations que des salles de diffusion
induisent sur le son. Ce dispositif permet donc d'obtenir le même
rendu sonore dans des salles différentes par égalisation de la
réponse sonore.
La résolution des égaliseurs est qualifiée en général d'octave, de
demi-octave ou de tiers d'octave. Un égalisateur en tiers d'octave
possède par exemple trois filtres différents pour le réglage du gain
dans la bande de fréquence 400 - 800Hz. Des trois résolutions,
l'égalisateur en tiers d'octave est celui qui a la plus fine.
Flaging/Phasing :
Il semble qu'historiquement, le flanging ait été mis en
oeuvre par des DJs, en tentant de synchroniser deux mêmes disques
vynils sur des platines différentes. Pour des raisons mécaniques, la
synchronisation parfaite n'est pas possible. En plus de cette
dé-synchronisation, il existe toujours un jitter, car les
vitesses de rotation des deux platines ne sont pas stables. L'un dans
l'autre, le son résultant du mixage des deux platines étaient qualifié
de phasy, et intéressait énormément les DJs. Depuis lors,
l'effet peut être reproduit artificiellement très simplement par un
flanger.
Le flanging et le phasing consistent à colorer artificiellement un son
en sommant deux versions déphasées du même signal. Un effet assez
étrange de rotation résulte de la modification périodique du
déphasage.
Il est plus facile de colorer les sources sonores qui ne possèdent pas
de hauteur sonore clairement définie. L'utilisation la plus courante
consiste donc à appliquer le flanging, exclusivement, aux pistes de
batterie et de percussion. L'effet était très prisé en musique
pop-rock au début des années soixante-dix.
Effets non-ordinaires
Au delà des effets ordinaires, banals, courants, que tout le monde
utilise depuis une trentaine d'années se rajoutent à présent des
techniques plus sophistiquées transformant la nature même du
son. Souvent, ces techniques s'appuient sur des modèles de signaux
dont nous parlerons au chapitre suivant.
Vocoders
En principe, un vocodeur est un dispositif générique
permettant de coder puis de re-synthétiser la voix, dans le but d'une
transmission efficace. Toutefois, les premiers dispositifs déformaient
considérablement la voix, lui donnant une texture particulièrement
robotique. Aussi, les premiers dispositifs furent-ils
utilisés dans des applications musicales, profitant ainsi des effets
apportés au timbre de la voix.
Vocodeurs en sous-bande :
Ces vocodeurs résultent directement du modèle source-filtre (ou
soustractif) décrit au chapitre suivant. Ce dispositif permet de
décorreller complètement la prosodie de la voix (la mélodie du langage)
des phonèmes prononcés. L'effet consiste donc en une voix de robot,
dont la hauteur peut-être contrôlée indépendamment du locuteur, par
exemple par un clavier.
Vocodeurs de phase :
La technologie des vocodeurs de phase est beaucoup plus subtile. Elle
permet un certain nombre d'effets, tels que la synthèse
croisée, la dilatation temporelle, le changement de
hauteur...
Dilatation temporelle
Cet effet, connu également en anglais sous le nom de time
stretching, est délicat à mettre en oeuvre, tant il est difficile
de clairement définir ce que chacun attend d'une dilatation
temporelle.
En principe, sur les magnétophones à bande, ou sur les platines
disques, ralentir le rythme de défilement de la bande devant la tête
de lecture, permet certes de ralentir la cadence du signal original,
mais au prix d'un décalage vers les graves quand on ralentit, ou vers
les aigus quand on accélère. Autrement dit, la hauteur et la cadence
de la bande sont intimement liées. La dilatation temporelle consiste
alors à ralentir un signal original, sans pour autant porter atteinte
à ces caractéristiques fréquencielles.
En fait, le problème est bien plus délicat, car nous n'attendons pas
que tous les sons soient dilatés de la même façon. Prenons par exemple
le cas de la voix. Les voyelles peuvent en effet être prononcées plus
ou moins rapidement, mais ce n'est pas le cas des plosives ([p],
[k], [t]...), dont la vitesse d'exécution ne peut pas être
modifiée. Cela indique, dans un premier temps, que les sons ne doivent
pas être rallongés uniformément, et que le résultat d'une dilatation
temporelle uniforme n'a pas forcément d'équivalent naturel ou
réaliste. En fait, le changement de cadence d'un son peut rapidement
devenir une opération très complexe.
Changement de hauteur
Les mêmes réflexions que précédemment sont encore valables pour le
changement de hauteur à savoir :
- a priori, cadence et hauteur sont indissociables,
- dans le cas de la voix, les consonnes n'ont pas (à proprement
parler) de hauteur, donc, il n'y a guère de sens à changer « la
hauteur » des consonnes,
- le résultat du changement uniforme de hauteur n'est pas forcément
réaliste.
En pratique, les techniques de dilatation temporelle alliées à celles
de changement de hauteur, permettent, à partir d'un signal original
par exemple de parole, d'en changer complètement, et à volonté, la
prosodie et l'évolution temporelle.
Changement de timbre
Les techniques simples de changement de timbre consistent par exemple
à utiliser la sortie d'un harmonizer, associée à un égaliseur
spécialement réglé pour renforcer certaines fréquences. On aboutit
alors à une voix plus grave, ou plus caverneuse, ou plus nazillarde...
Changement de hauteur de la voix et consistance de la position des
formants.
Toutefois, les arguments précédents concernant les transformations du
signal de parole restent encore valables ici. En particulier on ne
transforme pas de la même façon en parole les consonnes
plosives, les voyelles, les consonnes fricatives... Pour faire des
transformations de haute qualité, il faut segmenter le signal,
c'est-à-dire à marquer la position des voyelles, des fricatives, des
plosives... et appliquer différentes transformations à chacun des
segments. Ce n'est pas encore (malheureusement) une tâche entièrement
automatisable.
Ce document a été formaté par
htmlpp.