II) Expériences

Menu

II.1 Principe

Cinq expériences ont été faites, en deux groupes.

Les expériences 1,2,3

Dans les trois premières expériences, on demandait aux sujets d'estimer la "ressemblance/dissemblance" de sons musicaux égalisés en sonie, de même durée et fréquence fondamentale. Les stimulis de ces trois expériences étaient issus des mêmes sources, seule la fréquence fondamentale variait d'une expérience à l'autre.
A partir des réponses, nous avons obtenu trois espaces de timbre, nommés respectivement espace 1, espace 2, espace3. La comparaison de ces trois espaces permet de dire si la perception du timbre reste stable en fonction de la F0, malgré la variation de hauteur.

Les expériences 1-2,1-3

Ces expériences étaient semblables aux trois précédentes, sauf que les sons à comparer n'avaient pas la même fréquence fondamentale. La différence de F0 était constante afin de faciliter la comparaison des timbres. A partir des réponses, nous avons obtenu deux nouveaux espaces de timbre, nommés 1-2 et 1-3. L'expérience 1-2 comparait des stimuli à une fréquence de F01 avec des stimuli à une fréquence F02plus élevée d'un ton.L'expérience 1-3 comparait des stimuli à cette même fréquence F01 avec des stimuli à une fréquence F03plus élevée d'une septième majeure.
L'obtention d'espaces de timbre cohérents dans ces conditions indiquera que les sujets sont capables de comparer de timbre avec une F0 différente. La comparaison de ces espaces avec ceux obtenus dans les expériences 1, 2 et 3, et l'examen des matrices de dissemblance, permettra alors de dire dans quelle mesure le timbre varie avec la F0.

II.2 Choix des stimulis

Trois ensembles de stimulis ont été créés, constitués chacun de douze sons provenant de douze instruments de musique différents. A l’intérieur d’un ensemble tous les instruments jouaient la même note, à la même intensité. Entre chaque ensemble, les instruments, les interprètes, les conditions d’enregistrement étaient conservées, seule la note jouée variait d’un ensemble à l’autre.
Parmi les douze sons, il y en avait dix provenant d'instruments naturels, et deux sons de synthèse.Les dix sons naturels ont été extraits de la base de données de l’Ircam “Studio On Line” consultable sur le site suivant : http://sol.Ircam.fr. Pour chaque instrument 3 notes ont été choisies, le si2, correspondant à 247 Hz, le do#3, correspondant à 277 Hz, et le sib3, correspondant à 466 Hz, jouées avec une dynamique mezzo-forte. Ils ont été enregistrés avec un microphone stéréo. Les instruments suivants ont été choisis:
2 cuivres
- trompette en Ut, mode jeu normal, notes nommées respectivement trp1 (si2), trp2 (do#3), trp3 (sib3).
- cor en Fa, mode jeu normal, notes nommées respectivement cor1, cor2, cor3.
3 bois
- flûte traversière, mode jeu normal, notes nommées respectivement flt1, flt2, flt3.
- clarinette en si bémol, mode jeu normal, notes nommées respectivement clt1, clt2, clt3.
- hautbois, mode jeu normal, notes nommées respectivement htb1, htb2, htb3.
2 cordes frottées
- violon, mode de jeu non-vibrato, note si2 joué sur la corde de sol, do#3 sur la corde de sol, sib3 sur la corde de ré, nommées respectivement vln1, vln2, vln3
- contrebasse, mode de jeu non-vibrato, notes si2, dod3, sib3 jouées sur la corde de sol, nommées respectivement bas1, bas2, bas3
3 cordes pincées
- harpe, mode jeu normal, notes nommées respectivement hrp1, hrp2, hrp3.
- guitare, mode jeu normal, note si2 jouée sur la corde de mi, do#3 sur la corde de la, sib3 sur la corde de ré, nommées respectivement gui1, gui2, gui3.
- violon, mode de jeu pizzicato, note si2 joué sur la corde de sol, do#3 sur la corde de sol, sib3 sur la corde de ré, nommées respectivement vlp1, vlp2, vlp3.

Il a fallu filtrer légèrement la trompette, le cor, et la harpe pour réduire les hautes fréquences, dans la région de 10 kHz, afin d’éliminer certains bruits parasites dûs aux conditions d’enregistrement. Le violon pizzicato a été étiré pendant sa période de décroissance, à l'aide des outils de traitement du signal de la base SOL, afin d’obtenir un stimulus de durée 1,5s. Les autres sons ont été tronqués au moyen d'une rampe sinusoïdale, commençant 1,3 secondes après le début du stimulus, et finissant 0.2 secondes plus tard.

Les deux sons de synthèse ont été conçus ainsi :
Un son de saxophone alto en mib a été extrait de la base SOL, en mode de jeu normal, avec une dynamique mezzo-forte, et une hauteur de si 2.A l’aide du programme ADDITIVE (site Web de l'équipe Analyse-Synthèse ) la partie harmonique a été séparée de la partie bruitée (le souffle, les bruits de clés). A partir de l'enveloppe spectrale de la partie harmonique, trois sons ont été créés avec le programme ModFormat (site Web de l'équipe Analyse-Synthèse). Ces trois sons possédaient la même enveloppe spectro-temporelle, celle du saxophone de référence. Seule la fréquence fondamentale était différente entre les trois sons, nommés sxA1, sxA2 et sxA3, correspondant aux trois notes si2, do#3 et sib3.
Le son sxA1 était donc la resynthèse par la méthode additive, à la même hauteur, du son de saxophone, le bruit en moins.
Pour obtenir la deuxième série de sons synthétiques, le son sxA1 a été rééchantillonné dans le domaine temps afin d'obtenir une fréquence fondamentale de 466 Hz (sib3). L'enveloppe spectrale de ce nouveau son a été extraite et utilisée pour synthétiser les sons sxB1, sxB2, sxB3, correspondant aux trois notes si2, do#3 et sib3. L'enveloppe spectrale commune aux sons sxB est celle commune aux sons sxA, dilatée en fréquence d'un rapport 466/247. Il en résulte que le son sxB3 est identique à celui qu'on obtiendrait à partir de sxA1 en dilatant son spectre (enveloppe et structure harmonique) de ce rapport. Finalement, ces six sons ont été tronqués à 1,5 secondes de la même manière que les trente sons naturels.

figure 3: schéma des sons de synthèse

Ces deux groupes de trois stimuli avaient un rôle "d'ancre". En effet, la constance de l'enveloppe spectro-temporelle en fonction de F0 pour chaque groupe assure la constance des paramètres physiques comme le centre de gravité spectral et le temps d'attaque Alors que ces paramètres évoluent pour des instruments naturels pour des raisons physiques, ils restent fixes pour ces sons, qui permettant ainsi de garder une référence fixe, par rapport à laquelle on peut juger l'effet perceptif des évolutions spécifiques aux divers instruments.
De plus, la relation particulière entre les enveloppes spectrales des séries sxA et sxB permet, en examinant la distance perceptive entre les sons sxA1 et sxB3, de dire si le timbre d'un son est plus proche d'un autre son dont l'enveloppe spectrale est étirée en même temps que sa structure harmonique, ou au contraire fixe.
Les trois ensembles de sons sont donc: (trp1, cor1, clt1, flt1, htb1, hrp1, gui1, vlp1, bas1, vln1, sxA1, sxB1), (trp2, cor2, clt2, flt2, htb2, hrp2, gui2, vlp2, bas2, vln2, sxA2, sxB2) et (trp3, cor3, clt3, flt3, htb3, hrp3, gui3, vlp3, bas3, vln3, sxA3, sxB3).
Les écarts de fréquence fondamentale entre ensembles 1-2 et 1-3, d’un ton et d'une septième majeure, ont été choisis de façon à avoir un petit écart de tonie et un écart plus important, sans rapport harmonique simple afin d'éviter les ressemblances particulières, par exemple entre octaves. En effet, un son et son octave directe sont proches perceptivement puisqu'ils possèdent le même chroma. On sait par ailleurs qu'il n’est pas toujours aisé d’estimer une différence d’octave entre deux sons issus d’un mode de production différent. Une note chantée et une note sifflée peuvent sembler appariées en hauteur, alors que deux octaves les séparent physiquement (Castellengo 2000). Il était donc souhaitable d'éviter un rapport d'octave, afin d’être certain que les sujets perçoivent réellement une différence de hauteur.

II.3 ) Les sujets

Les sujets etaient composés de vingt-trois personnes, dont onze femmes et douze hommes, entre 20 et 27 ans. Parmi eux figuraient huit étudiants du DEA ATIAM, quinze personnes non musiciennes, et une musicienne professionnelle. Les sujets ont été divisés en trois groupes. Le premier groupe de cinq personnes a passé les trois premières expériences, le deuxième groupe de trois personnes a passé les deux dernières expériences, le troisième groupe de quinze personnes a passé les cinq expériences, avec une semaine d’intervalle entre les trois premières et les deux dernières expériences. Les sujets étaient indemnisés pour leur participation.

II.4 ) Procédure

Les expériences se sont déroulées en mai 2000, au sein de l'équipe Perception et Cognition Musicales de l’Ircam, à l’intérieur d’une cabine audiométrique à double paroi conçue pour les expériences de psychoacoustiques, avec un casque Sennheisner 520 II. L'ensemble des expériences s'étalait sur une période d'environ trois semaines.

II.4.1 ) Groupe 1, les expériences 1, 2, 3.

Ces trois expériences sont similaires. Seuls les ensembles de sons changent. Dix sujets ont passé l’expérience dans l’ordre 1-2-3, et dix autres dans l’ordre 3-2-1.Avant chaque expérience, les sujets écoutaient l’ensemble de sons de l’expérience qu’il allait passer (dans le désordre), afin de se familiariser avec l’ensemble des sons. Puis, à l’aide du logiciel PsiExp (Smith 1995), toutes les paires de sons étaient présentées aux sujets. À chaque paire, le sujet devait estimer le degré de similarité des sons de la paire sur une échelle continue entre "très semblable" et "très dissemblable", à l’aide d’un curseur. L'ordre des instruments dans une paire était aléatoire. Chaque paire n’etait présentée qu’une seule fois, et dans un ordre unique (si la paire trompette-clarinette etait présentée, la paire clarinette-trompette ne l’était pas). De plus, dans chaque expérience quatre paires composées d’un même son choisi aléatoirement etaient présentées afin d'estimer la qualité d’écoute des sujets.
Cela constitue donc 70 paires par expériences (12*11/2 + 4). Chaque expérience durait environ 30 minutes. Les sujets pouvaient prendre une pause entre chaque expérience.
Entre l’écoute des sons de la première expérience, et l’expérience elle-même, les sujets ont jugé dix paires à titre d’exercice. Les données n’étaient pas enregistrées. Ces essais devaient leur donner la possibilité de se créer des critères stables et d'intégrer la notion de 'similarité-différence'.

Les consignes

Les consignes étaient les suivantes:
- Le jugement doit se faire sur le timbre de l’instrument. Le sujet doit faire donc abstraction des différences de hauteur, durée, et sonie qu’il pourrait éventuellement percevoir.
- Si l’instrument est reconnu, le sujet doit en faire abstraction, et se concentrer uniquement, sur le son lui-même.
- Les critères de jugement élaborés lors de l’essai doivent rester les mêmes pour toutes les autres expériences.
A la fin de chacune des expériences, les sujets devaient répondre aux questions suivantes :
- Estimez la difficulté de l’expérience.
- Estimez la difficulté de l’expérience par rapport aux autres expériences déjà faites.
- Quels étaient vos critères utilisés lors de cette expérience ?
Ces questions avaient pour but de mieux comprendre comment la tâche a été comprise et effectuée par les sujets, de savoir si les critères de jugement de dissemblance ont évolué avec la hauteur, ou si un effet d’accoutumance aux expériences pouvait influencer leurs choix.
A la fin des trois expériences, les sujets avaient pour tâche d’essayer de reconnaître les différents instruments utilisés. Cela nous a permis de connaître la capacité de reconnaissance des sujets individuellement. Cela nous a permis également de savoir quels instruments étaient facilement reconnaissables, et si cela dépendait de la note jouée.
II.4.2 ) Groupe 2, les expériences 1-2,1-3.
Les expériences 1-2 et 1-3 suivaient le même protocole. Mais au lieu de présenter deux sons avec une même fréquence fondamentale, les paires etaient présentées avec une différence de F0, par exemple: trp1 et clt2, vln1 et cor3, etc...
L’expérience 1-2 comparait tous les sons de l’ensemble 1 (si 2) avec ceux de l’ensemble 2 (dod3).L’expérience 1-3 comparait tous les sons de l’ensemble 1 (si 2) avec ceux de l’ensemble 3 (sib3).
Chaque expérience comprenait donc 144 paires (12 *12).
Comme pour le groupe 1, les sujets ont d’abord écouté les 24 sons de l’expérience (présentés aléatoirement). Puis avant la première expérience, ils ont effectué un essai de jugement de dissemblance avec dix paires. Entre les deux expériences, ils ont pu effectuer une pause de quelques minutes.
Les consignes étaient les mêmes que pour les expériences 1, 2 et 3. Quatre sous-groupes ont été formés, à partir du groupe 2 et 3, afin de d’alterner le sens des expériences:
Le groupe A a passé l’expérience 1-2 puis l'expérience 1-3. A l’intérieur de chaque paire, le son grave était présenté avant le son aigu, (par exemple vlp1 puis hrp2)
Le groupe B a passé l’expérience 1-3 avant l'expérience 1-2, avec les sons graves en premiers.
Le groupe C a passé l’expérience 1-2 avant l'expérience 1-3, avec les sons aigus en premier, (par exemple flt2 puis sxA1).
Le groupe D a passé l’expérience 1-3 avant l'expérience 1-2, avec les sons aigus en premier.

II.4.3 ) Le groupe 3

Le groupe 3 a effectué les cinq expériences, avec un intervalle d’une semaine entre les expériences (1, 2, 3) et (1-2, 1-3). Aucun commentaire, aucune explication, aucun résultat, ne leur a été communiqué avant que toutes les expériences aient été terminées. Ils avaient également pour consigne de ne pas parler de l’expérience avec d’autres personnes ne l’ayant pas encore fini.

suite