II.1 Principe
Cinq expériences ont été faites, en deux groupes.
Les expériences 1,2,3
Dans les trois premières expériences, on demandait aux sujets
d'estimer la "ressemblance/dissemblance" de sons musicaux égalisés
en sonie, de même durée et fréquence fondamentale. Les stimulis
de ces trois expériences étaient issus des mêmes sources,
seule la fréquence fondamentale variait d'une expérience à
l'autre.
A partir des réponses, nous avons obtenu trois espaces de timbre, nommés
respectivement espace 1, espace 2, espace3. La comparaison de ces trois espaces
permet de dire si la perception du timbre reste stable en fonction de la F0,
malgré la variation de hauteur.
Les expériences 1-2,1-3
Ces expériences étaient semblables aux trois précédentes,
sauf que les sons à comparer n'avaient pas la même fréquence
fondamentale. La différence de F0 était constante afin de faciliter
la comparaison des timbres. A partir des réponses, nous avons obtenu
deux nouveaux espaces de timbre, nommés 1-2 et 1-3. L'expérience
1-2 comparait des stimuli à une fréquence de F01 avec des stimuli
à une fréquence F02plus élevée d'un ton.L'expérience
1-3 comparait des stimuli à cette même fréquence F01 avec
des stimuli à une fréquence F03plus élevée d'une
septième majeure.
L'obtention d'espaces de timbre cohérents dans ces conditions indiquera
que les sujets sont capables de comparer de timbre avec une F0 différente.
La comparaison de ces espaces avec ceux obtenus dans les expériences
1, 2 et 3, et l'examen des matrices de dissemblance, permettra alors de dire
dans quelle mesure le timbre varie avec la F0.
II.2 Choix des stimulis
Trois ensembles de stimulis ont été créés, constitués
chacun de douze sons provenant de douze instruments de musique différents.
A l’intérieur d’un ensemble tous les instruments jouaient la
même note, à la même intensité. Entre chaque ensemble,
les instruments, les interprètes, les conditions d’enregistrement
étaient conservées, seule la note jouée variait d’un
ensemble à l’autre.
Parmi les douze sons, il y en avait dix provenant d'instruments naturels, et
deux sons de synthèse.Les dix sons naturels ont été extraits
de la base de données de l’Ircam “Studio On Line” consultable
sur le site suivant : http://sol.Ircam.fr. Pour chaque instrument 3 notes ont
été choisies, le si2, correspondant à 247 Hz, le do#3,
correspondant à 277 Hz, et le sib3, correspondant à 466 Hz, jouées
avec une dynamique mezzo-forte. Ils ont été enregistrés
avec un microphone stéréo. Les instruments suivants ont été
choisis:
2 cuivres
- trompette en Ut, mode jeu normal, notes nommées respectivement trp1
(si2), trp2 (do#3), trp3 (sib3).
- cor en Fa, mode jeu normal, notes nommées respectivement cor1, cor2,
cor3.
3 bois
- flûte traversière, mode jeu normal, notes nommées respectivement
flt1, flt2, flt3.
- clarinette en si bémol, mode jeu normal, notes nommées respectivement
clt1, clt2, clt3.
- hautbois, mode jeu normal, notes nommées respectivement htb1, htb2,
htb3.
2 cordes frottées
- violon, mode de jeu non-vibrato, note si2 joué sur la corde de sol,
do#3 sur la corde de sol, sib3 sur la corde de ré, nommées respectivement
vln1, vln2, vln3
- contrebasse, mode de jeu non-vibrato, notes si2, dod3, sib3 jouées
sur la corde de sol, nommées respectivement bas1, bas2, bas3
3 cordes pincées
- harpe, mode jeu normal, notes nommées respectivement hrp1, hrp2, hrp3.
- guitare, mode jeu normal, note si2 jouée sur la corde de mi, do#3 sur
la corde de la, sib3 sur la corde de ré, nommées respectivement
gui1, gui2, gui3.
- violon, mode de jeu pizzicato, note si2 joué sur la corde de sol, do#3
sur la corde de sol, sib3 sur la corde de ré, nommées respectivement
vlp1, vlp2, vlp3.
Il a fallu filtrer légèrement la trompette, le cor, et la harpe
pour réduire les hautes fréquences, dans la région de 10
kHz, afin d’éliminer certains bruits parasites dûs aux conditions
d’enregistrement. Le violon pizzicato a été étiré
pendant sa période de décroissance, à l'aide des outils
de traitement du signal de la base SOL, afin d’obtenir un stimulus de durée
1,5s. Les autres sons ont été tronqués au moyen d'une rampe
sinusoïdale, commençant 1,3 secondes après le début
du stimulus, et finissant 0.2 secondes plus tard.
Les deux sons de synthèse ont été conçus ainsi :
Un son de saxophone alto en mib a été extrait de la base SOL,
en mode de jeu normal, avec une dynamique mezzo-forte, et une hauteur de si
2.A l’aide du programme ADDITIVE (site Web de l'équipe Analyse-Synthèse
) la partie harmonique a été séparée de la partie
bruitée (le souffle, les bruits de clés). A partir de l'enveloppe
spectrale de la partie harmonique, trois sons ont été créés
avec le programme ModFormat (site Web de l'équipe Analyse-Synthèse).
Ces trois sons possédaient la même enveloppe spectro-temporelle,
celle du saxophone de référence. Seule la fréquence fondamentale
était différente entre les trois sons, nommés sxA1, sxA2
et sxA3, correspondant aux trois notes si2, do#3 et sib3.
Le son sxA1 était donc la resynthèse par la méthode additive,
à la même hauteur, du son de saxophone, le bruit en moins.
Pour obtenir la deuxième série de sons synthétiques, le
son sxA1 a été rééchantillonné dans le domaine
temps afin d'obtenir une fréquence fondamentale de 466 Hz (sib3). L'enveloppe
spectrale de ce nouveau son a été extraite et utilisée
pour synthétiser les sons sxB1, sxB2, sxB3, correspondant aux trois notes
si2, do#3 et sib3. L'enveloppe spectrale commune aux sons sxB est celle commune
aux sons sxA, dilatée en fréquence d'un rapport 466/247. Il en
résulte que le son sxB3 est identique à celui qu'on obtiendrait
à partir de sxA1 en dilatant son spectre (enveloppe et structure harmonique)
de ce rapport. Finalement, ces six sons ont été tronqués
à 1,5 secondes de la même manière que les trente sons naturels.

figure 3: schéma des sons de synthèse
Ces deux groupes de trois stimuli avaient un rôle "d'ancre".
En effet, la constance de l'enveloppe spectro-temporelle en fonction de F0 pour
chaque groupe assure la constance des paramètres physiques comme le centre
de gravité spectral et le temps d'attaque Alors que ces paramètres
évoluent pour des instruments naturels pour des raisons physiques, ils
restent fixes pour ces sons, qui permettant ainsi de garder une référence
fixe, par rapport à laquelle on peut juger l'effet perceptif des évolutions
spécifiques aux divers instruments.
De plus, la relation particulière entre les enveloppes spectrales des
séries sxA et sxB permet, en examinant la distance perceptive entre les
sons sxA1 et sxB3, de dire si le timbre d'un son est plus proche d'un autre
son dont l'enveloppe spectrale est étirée en même temps
que sa structure harmonique, ou au contraire fixe.
Les trois ensembles de sons sont donc: (trp1, cor1, clt1, flt1, htb1, hrp1,
gui1, vlp1, bas1, vln1, sxA1, sxB1), (trp2, cor2, clt2, flt2, htb2, hrp2, gui2,
vlp2, bas2, vln2, sxA2, sxB2) et (trp3, cor3, clt3, flt3, htb3, hrp3, gui3,
vlp3, bas3, vln3, sxA3, sxB3).
Les écarts de fréquence fondamentale entre ensembles 1-2 et 1-3,
d’un ton et d'une septième majeure, ont été choisis
de façon à avoir un petit écart de tonie et un écart
plus important, sans rapport harmonique simple afin d'éviter les ressemblances
particulières, par exemple entre octaves. En effet, un son et son octave
directe sont proches perceptivement puisqu'ils possèdent le même
chroma. On sait par ailleurs qu'il n’est pas toujours aisé d’estimer
une différence d’octave entre deux sons issus d’un mode de
production différent. Une note chantée et une note sifflée
peuvent sembler appariées en hauteur, alors que deux octaves les séparent
physiquement (Castellengo 2000). Il était donc souhaitable d'éviter
un rapport d'octave, afin d’être certain que les sujets perçoivent
réellement une différence de hauteur.
II.3 ) Les sujets
Les sujets etaient composés de vingt-trois personnes, dont onze femmes
et douze hommes, entre 20 et 27 ans. Parmi eux figuraient huit étudiants
du DEA ATIAM, quinze personnes non musiciennes, et une musicienne professionnelle.
Les sujets ont été divisés en trois groupes. Le premier
groupe de cinq personnes a passé les trois premières expériences,
le deuxième groupe de trois personnes a passé les deux dernières
expériences, le troisième groupe de quinze personnes a passé
les cinq expériences, avec une semaine d’intervalle entre les trois
premières et les deux dernières expériences. Les sujets
étaient indemnisés pour leur participation.
II.4 ) Procédure
Les expériences se sont déroulées en mai 2000, au sein
de l'équipe Perception et Cognition Musicales de l’Ircam, à
l’intérieur d’une cabine audiométrique à double
paroi conçue pour les expériences de psychoacoustiques, avec un
casque Sennheisner 520 II. L'ensemble des expériences s'étalait
sur une période d'environ trois semaines.
II.4.1 ) Groupe 1, les expériences 1, 2, 3.
Ces trois expériences sont similaires. Seuls les ensembles de sons changent.
Dix sujets ont passé l’expérience dans l’ordre 1-2-3,
et dix autres dans l’ordre 3-2-1.Avant chaque expérience, les sujets
écoutaient l’ensemble de sons de l’expérience qu’il
allait passer (dans le désordre), afin de se familiariser avec l’ensemble
des sons. Puis, à l’aide du logiciel PsiExp (Smith 1995), toutes
les paires de sons étaient présentées aux sujets. À
chaque paire, le sujet devait estimer le degré de similarité des
sons de la paire sur une échelle continue entre "très semblable"
et "très dissemblable", à l’aide d’un curseur.
L'ordre des instruments dans une paire était aléatoire. Chaque
paire n’etait présentée qu’une seule fois, et dans un
ordre unique (si la paire trompette-clarinette etait présentée,
la paire clarinette-trompette ne l’était pas). De plus, dans chaque
expérience quatre paires composées d’un même son choisi
aléatoirement etaient présentées afin d'estimer la qualité
d’écoute des sujets.
Cela constitue donc 70 paires par expériences (12*11/2 + 4). Chaque expérience
durait environ 30 minutes. Les sujets pouvaient prendre une pause entre chaque
expérience.
Entre l’écoute des sons de la première expérience,
et l’expérience elle-même, les sujets ont jugé dix
paires à titre d’exercice. Les données n’étaient
pas enregistrées. Ces essais devaient leur donner la possibilité
de se créer des critères stables et d'intégrer la notion
de 'similarité-différence'.
Les consignes
Les consignes étaient les suivantes:
- Le jugement doit se faire sur le timbre de l’instrument. Le sujet doit
faire donc abstraction des différences de hauteur, durée, et sonie
qu’il pourrait éventuellement percevoir.
- Si l’instrument est reconnu, le sujet doit en faire abstraction, et se
concentrer uniquement, sur le son lui-même.
- Les critères de jugement élaborés lors de l’essai
doivent rester les mêmes pour toutes les autres expériences.
A la fin de chacune des expériences, les sujets devaient répondre
aux questions suivantes :
- Estimez la difficulté de l’expérience.
- Estimez la difficulté de l’expérience par rapport aux autres
expériences déjà faites.
- Quels étaient vos critères utilisés lors de cette expérience
?
Ces questions avaient pour but de mieux comprendre comment la tâche a
été comprise et effectuée par les sujets, de savoir si
les critères de jugement de dissemblance ont évolué avec
la hauteur, ou si un effet d’accoutumance aux expériences pouvait
influencer leurs choix.
A la fin des trois expériences, les sujets avaient pour tâche d’essayer
de reconnaître les différents instruments utilisés. Cela
nous a permis de connaître la capacité de reconnaissance des sujets
individuellement. Cela nous a permis également de savoir quels instruments
étaient facilement reconnaissables, et si cela dépendait de la
note jouée.
II.4.2 ) Groupe 2, les expériences 1-2,1-3.
Les expériences 1-2 et 1-3 suivaient le même protocole. Mais au
lieu de présenter deux sons avec une même fréquence fondamentale,
les paires etaient présentées avec une différence de F0,
par exemple: trp1 et clt2, vln1 et cor3, etc...
L’expérience 1-2 comparait tous les sons de l’ensemble 1 (si
2) avec ceux de l’ensemble 2 (dod3).L’expérience 1-3 comparait
tous les sons de l’ensemble 1 (si 2) avec ceux de l’ensemble 3 (sib3).
Chaque expérience comprenait donc 144 paires (12 *12).
Comme pour le groupe 1, les sujets ont d’abord écouté les
24 sons de l’expérience (présentés aléatoirement).
Puis avant la première expérience, ils ont effectué un
essai de jugement de dissemblance avec dix paires. Entre les deux expériences,
ils ont pu effectuer une pause de quelques minutes.
Les consignes étaient les mêmes que pour les expériences
1, 2 et 3. Quatre sous-groupes ont été formés, à
partir du groupe 2 et 3, afin de d’alterner le sens des expériences:
Le groupe A a passé l’expérience 1-2 puis l'expérience
1-3. A l’intérieur de chaque paire, le son grave était présenté
avant le son aigu, (par exemple vlp1 puis hrp2)
Le groupe B a passé l’expérience 1-3 avant l'expérience
1-2, avec les sons graves en premiers.
Le groupe C a passé l’expérience 1-2 avant l'expérience
1-3, avec les sons aigus en premier, (par exemple flt2 puis sxA1).
Le groupe D a passé l’expérience 1-3 avant l'expérience
1-2, avec les sons aigus en premier.
II.4.3 ) Le groupe 3
Le groupe 3 a effectué les cinq expériences, avec un intervalle
d’une semaine entre les expériences (1, 2, 3) et (1-2, 1-3). Aucun
commentaire, aucune explication, aucun résultat, ne leur a été
communiqué avant que toutes les expériences aient été
terminées. Ils avaient également pour consigne de ne pas parler
de l’expérience avec d’autres personnes ne l’ayant pas
encore fini.