Représentations temps et fréquence
Représentation fréquencielle
La représentation fréquencielle n'est pas qu'un simple outil
mathématique dénué de tout fondement perceptif. Mathématiquement, la
représentation fréquencielle consiste à décomposer le signal sur une
base de signaux élémentaires : des sons purs ou sinusoïdes.
Perception de la couleur
À chaque couleur de l'arc-en-ciel (ce sont des couleurs dites
simples) correspond exactement une longueur d'onde (ou
fréquence) et une amplitude (ou intensité). Pour chaque type de
lumière la décomposition à l'aide d'un prisme indique l'amplitude
respective de chacune des couleurs simples de
l'arc-en-ciel. L'ensemble forme le spectre de la lumière. Le
prisme ne fait que révéler des informations qui sont cachées dans la
lumière. On appelle ce domaine, le domaine spectral ou bien
encore, domaine fréquenciel.
La perception que nous avons de la lumière dépend de 3 types
différents de cellules qui tapissent le fond de la rétine
sensibles à trois longueurs d'onde différentes : le rouge, le vert et
le bleu. C'est parce que nous avons à notre disposition 3 types de
cellules différentes qu'il est suffisant de décomposer la lumière sur
la base des 3 couleurs dites primaires afin de donner
l'illusion des lumières et des couleurs non-primaires. En terme
simplifié, l'oeil n'est sensible qu'à trois couleurs primaires (i.e. à
trois fréquences différentes). Tout le reste n'est qu'interprétation
par notre cerveau des stimuli électromagnétiques captés par les
récepteurs visuels.
Perception des sons
Tout comme la lumière, le son cache également en son sein un
spectre et notre oreille est spécialement équipée pour le
révéler. Contrairement à la vision, l'oreille interne est équipée de
plusieurs milliers de cellules, chacune spécialisée dans une gamme
très sélective de fréquences (ce qui correspondait aux couleurs
simples de l'arc-en-ciel dans l'exemple précédent). Symboliquement, un
son peut donc se représenter par une courbe indiquant la degré
d'excitation de chacune des cellules le long de la membrane
basilaire, c'est-à-dire sur l'axe des fréquences : c'est une
représentation fréquencielle ou spectrale du son.
Mise en garde :
Notre présentation semble indiquer que le domaine spectral ne
correspond qu'à des phénomènes perceptifs. Il n'en est rien. La
représentation spectrale a une existence en dehors de tout dispositif de
perception. Elle est définie mathématiquement par la transformée
de Fourier.
Décomposition des sons
Sons purs
On qualifie de son pur l'équivalent en terme sonore des couleurs
simples de l'arc-en-ciel. Le son pur est donc caractérisé entièrement
par son amplitude et par sa fréquence. La représentation fréquencielle
d'un son pur à la fréquence f0
est un pic situé à l'abscisse de sa fréquence. La représentation
temporelle d'un son pur, est une sinusoïde. La représentation
temporelle du son pur fait apparaître une périodicité dans le
signal. Cette période est l'inverse de la fréquence.
Expérience harmonique
On prend un générateur de sinusoïdes, puis on ajoute successivement des
sinusoïdes aux fréquences f0,
puis 2f0,
3f0,
4f0 ...
La première sensation consiste à entendre chacun des partiels
harmoniques entrer séparément dans le son. Mais rapidement, tous les
partiels se fondent pour ne donner plus que la sensation d'un son
complexe, de même hauteur que le son pur original. Il n'est plus
possible de distinguer séparément chacun des partiels du son.
Une façon d'analyser le son original, i.e. de le décomposer en ces
composants élémentaires, consiste à ajouter au fur et à mesure des
sinusoïdes dans le son, jusqu'à ce que le résultat corresponde au
son original. Cette procédure de décomposition/recomposition du son
s'appelle analyse par la synthèse.
Nomenclature et caractéristiques
Tous les sons stables se décomposent en sons élémentaires. Chaque son
élémentaire se nomme partiel du son. Quand le son original
est périodique, les fréquences des partiels sont toutes en rapport
harmonique les unes entre elles. Dans ce cas, les partiels
prennent le nom d'harmoniques du son.
L'écartement fréquenciel entre chaque partiel est caractéristique de
la période du signal temporel, et donc de sa hauteur. L'enveloppe
spectrale que dessine les sommets des partiels est
caractéristique de la forme d'onde et donc du timbre. Dans le cadre
de la parole, les trois premiers maxima locaux de l'enveloppe
spectrale s'appellent des formants et sont caractéristiques de
la voyelle prononcée (et de la forme du conduit vocal).
L'énergie d'un signal peut être localisée dans une zone fréquencielle
n'ayant rien à voir avec sa hauteur (la fréquence fondamentale).
En particulier, la hauteur de la parole varie entre 100 et 200Hz
tandis que l'énergie est transmise essentiellement dans la gamme de
fréquences 800 - 3000Hz. Le téléphone d'ailleurs ne transmet
que la bande de fréquence utile : 800Hz à 8kHz.
Sensibilité
Notre oreille est sensible en première approximation aux fréquences
entre 30Hz et 16kHz. Le maximum de sensibilité se situe aux alentours
de 3kHz, ce qui est en adéquation avec le mécanisme de production
de la voix qui produit de l'énergie essentiellement autour de cette
fréquence.
La réception des signaux se fait par des cellules cillées, qui sont la
terminaison de cellules nerveuses, qui ne sont jamais remplacées. La
destruction des cellules cillées est irréversible. Les cellules se
détruisent avec l'âge, mais aussi avec des expositions trop violentes
ou trop répétées à des stimuli de grande amplitude.
Théorie simplifiée de l'harmonie
Un accord musical sonne d'autant mieux que les sons fusionnent
correctement. On a vu précédemment que des sons purs harmoniques
avaient tendance à fusionner sans que l'on puisse les
distinguer. L'analyse d'un accord se fait en superposant la
représentation fréquencielle des sons constituant l'accord, et à
observer comment se superpose les partiels harmoniques des sons.
Dans le cas d'un accord d'octave (1/2), un partiel sur deux
fusionne. C'est l'accord le plus consonant (par opposition à
dissonant). Dans le cas d'un accord de quinte (2/3),
approximativement un partiel sur trois fusionne. C'est un des accords
le plus consonant après l'accord d'octave.
Quand deux partiels se superposent mal, disons avec un écart de 10Hz,
ils produisent des battements, c'est-à-dire à une modulation
d'amplitude, dans le cas présent, de 10 battements par seconde. Ce
type de battement est trop rapide pour être perçu comme un phénomène
temporel, et trop lent pour être perçu comme un phénomène
fréquenciel. C'est le phénomène de rugosité. La rugosité
entraîne une ambigüité de perception qui induit un stress et une
dissonance de l'accord.
Filtrage
Le filtrage consiste à atténuer ou amplifier sélectivement
chacune des régions du spectre. Un filtre est caractérisé par sa
fonction de transfert (ou gain en fréquence ou
encore réponse fréquencielle) qui décrit le gain de chacune
des régions du spectre.
Conclusion partielle
Tous les signaux, toutes les opérations de filtrage ou de
modification des sons doivent être considérés à la fois dans le
domaine temporel, et dans le domaine fréquenciel. Les deux domaines
sont indissociables et complémentaires. On ne peut prétendre expliquer
un phénomène sonore qu'en l'envisageant simultanément dans les deux
domaines.
Ce document a été formaté par
htmlpp.