Ircam - Centre Georges-Pompidou

Représentations temps et fréquence

Représentation fréquencielle

La représentation fréquencielle n'est pas qu'un simple outil mathématique dénué de tout fondement perceptif. Mathématiquement, la représentation fréquencielle consiste à décomposer le signal sur une base de signaux élémentaires : des sons purs ou sinusoïdes.

Perception de la couleur

À chaque couleur de l'arc-en-ciel (ce sont des couleurs dites simples) correspond exactement une longueur d'onde (ou fréquence) et une amplitude (ou intensité). Pour chaque type de lumière la décomposition à l'aide d'un prisme indique l'amplitude respective de chacune des couleurs simples de l'arc-en-ciel. L'ensemble forme le spectre de la lumière. Le prisme ne fait que révéler des informations qui sont cachées dans la lumière. On appelle ce domaine, le domaine spectral ou bien encore, domaine fréquenciel.

La perception que nous avons de la lumière dépend de 3 types différents de cellules qui tapissent le fond de la rétine sensibles à trois longueurs d'onde différentes : le rouge, le vert et le bleu. C'est parce que nous avons à notre disposition 3 types de cellules différentes qu'il est suffisant de décomposer la lumière sur la base des 3 couleurs dites primaires afin de donner l'illusion des lumières et des couleurs non-primaires. En terme simplifié, l'oeil n'est sensible qu'à trois couleurs primaires (i.e. à trois fréquences différentes). Tout le reste n'est qu'interprétation par notre cerveau des stimuli électromagnétiques captés par les récepteurs visuels.

Perception des sons

Tout comme la lumière, le son cache également en son sein un spectre et notre oreille est spécialement équipée pour le révéler. Contrairement à la vision, l'oreille interne est équipée de plusieurs milliers de cellules, chacune spécialisée dans une gamme très sélective de fréquences (ce qui correspondait aux couleurs simples de l'arc-en-ciel dans l'exemple précédent). Symboliquement, un son peut donc se représenter par une courbe indiquant la degré d'excitation de chacune des cellules le long de la membrane basilaire, c'est-à-dire sur l'axe des fréquences : c'est une représentation fréquencielle ou spectrale du son.

Mise en garde :

Notre présentation semble indiquer que le domaine spectral ne correspond qu'à des phénomènes perceptifs. Il n'en est rien. La représentation spectrale a une existence en dehors de tout dispositif de perception. Elle est définie mathématiquement par la transformée de Fourier.

Décomposition des sons

Sons purs

On qualifie de son pur l'équivalent en terme sonore des couleurs simples de l'arc-en-ciel. Le son pur est donc caractérisé entièrement par son amplitude et par sa fréquence. La représentation fréquencielle d'un son pur à la fréquence f0 est un pic situé à l'abscisse de sa fréquence. La représentation temporelle d'un son pur, est une sinusoïde. La représentation temporelle du son pur fait apparaître une périodicité dans le signal. Cette période est l'inverse de la fréquence.

Expérience harmonique

On prend un générateur de sinusoïdes, puis on ajoute successivement des sinusoïdes aux fréquences f0, puis 2f0, 3f0, 4f0 ... La première sensation consiste à entendre chacun des partiels harmoniques entrer séparément dans le son. Mais rapidement, tous les partiels se fondent pour ne donner plus que la sensation d'un son complexe, de même hauteur que le son pur original. Il n'est plus possible de distinguer séparément chacun des partiels du son.

Une façon d'analyser le son original, i.e. de le décomposer en ces composants élémentaires, consiste à ajouter au fur et à mesure des sinusoïdes dans le son, jusqu'à ce que le résultat corresponde au son original. Cette procédure de décomposition/recomposition du son s'appelle analyse par la synthèse.

Nomenclature et caractéristiques

Tous les sons stables se décomposent en sons élémentaires. Chaque son élémentaire se nomme partiel du son. Quand le son original est périodique, les fréquences des partiels sont toutes en rapport harmonique les unes entre elles. Dans ce cas, les partiels prennent le nom d'harmoniques du son.

L'écartement fréquenciel entre chaque partiel est caractéristique de la période du signal temporel, et donc de sa hauteur. L'enveloppe spectrale que dessine les sommets des partiels est caractéristique de la forme d'onde et donc du timbre. Dans le cadre de la parole, les trois premiers maxima locaux de l'enveloppe spectrale s'appellent des formants et sont caractéristiques de la voyelle prononcée (et de la forme du conduit vocal).

L'énergie d'un signal peut être localisée dans une zone fréquencielle n'ayant rien à voir avec sa hauteur (la fréquence fondamentale). En particulier, la hauteur de la parole varie entre 100 et 200Hz tandis que l'énergie est transmise essentiellement dans la gamme de fréquences 800 - 3000Hz. Le téléphone d'ailleurs ne transmet que la bande de fréquence utile : 800Hz à 8kHz.

Sensibilité

Notre oreille est sensible en première approximation aux fréquences entre 30Hz et 16kHz. Le maximum de sensibilité se situe aux alentours de 3kHz, ce qui est en adéquation avec le mécanisme de production de la voix qui produit de l'énergie essentiellement autour de cette fréquence.

La réception des signaux se fait par des cellules cillées, qui sont la terminaison de cellules nerveuses, qui ne sont jamais remplacées. La destruction des cellules cillées est irréversible. Les cellules se détruisent avec l'âge, mais aussi avec des expositions trop violentes ou trop répétées à des stimuli de grande amplitude.

Théorie simplifiée de l'harmonie

Un accord musical sonne d'autant mieux que les sons fusionnent correctement. On a vu précédemment que des sons purs harmoniques avaient tendance à fusionner sans que l'on puisse les distinguer. L'analyse d'un accord se fait en superposant la représentation fréquencielle des sons constituant l'accord, et à observer comment se superpose les partiels harmoniques des sons.

Dans le cas d'un accord d'octave (1/2), un partiel sur deux fusionne. C'est l'accord le plus consonant (par opposition à dissonant). Dans le cas d'un accord de quinte (2/3), approximativement un partiel sur trois fusionne. C'est un des accords le plus consonant après l'accord d'octave.

Quand deux partiels se superposent mal, disons avec un écart de 10Hz, ils produisent des battements, c'est-à-dire à une modulation d'amplitude, dans le cas présent, de 10 battements par seconde. Ce type de battement est trop rapide pour être perçu comme un phénomène temporel, et trop lent pour être perçu comme un phénomène fréquenciel. C'est le phénomène de rugosité. La rugosité entraîne une ambigüité de perception qui induit un stress et une dissonance de l'accord.

Filtrage

Le filtrage consiste à atténuer ou amplifier sélectivement chacune des régions du spectre. Un filtre est caractérisé par sa fonction de transfert (ou gain en fréquence ou encore réponse fréquencielle) qui décrit le gain de chacune des régions du spectre.

Conclusion partielle

Tous les signaux, toutes les opérations de filtrage ou de modification des sons doivent être considérés à la fois dans le domaine temporel, et dans le domaine fréquenciel. Les deux domaines sont indissociables et complémentaires. On ne peut prétendre expliquer un phénomène sonore qu'en l'envisageant simultanément dans les deux domaines.
Prev Home Up Next Anglais Page remise à jour le
Ven 26 Déc 1997 15:37:11
Tassart Stéphan
IRCAM

Ce document a été formaté par htmlpp.