On voudrait aborder la problématique du traitement du son sous langle dynamique cest à dire que lon sintéresse plus particulièrement à lévolution temporelle du traitement et de ses paramètres.
Le premier aspect relatif à cette approche concerne le problème du contrôle, au sens général du terme : contrôle manuel, contrôle en référence à des trajectoires prédéfinies, évolution du contrôle
Soit donc au départ une évolution linéaire dun paramètre.
Cette évolution est linéaire ou comporte un aspect linéaire important si elle est dessinée a priori ou réalisée en temps réel par un utilisateur, qui aura naturellement tendance à lui donner une forme linéaire, en tous cas une forme qui ne sera pas forcément " perceptivement adaptée ", ou, disons " perceptivement optimisée ".
Par ailleurs, si lon se réfère aux outils de traitement que lon trouve dans le commerce et qui comportent un aspect dynamique, comme les plug-ins GRM Tools ou le logiciel ProTools (automation des effets ), on constate que lévolution des paramètres de traitement se base toujours sur des forme à caractère linéaire une exception : la version 5 de ProTools, mais la méthode utilisée, en plus dêtre très sommaire, nest pas un succès.
Cette évolution est donc quantitativement linéaire.
La première étape consiste à lui donner un aspect perceptivement linéaire, ce qui est un problème de psychoacoustique classique.
Cest ce quon appelle par la suite la " linéarisation à grande échelle " - échelle qui sera en fait notre échelle de référence dans toute la suite
La seconde étape consiste à adapter cette évolution à la perception. Pour cela, il est nécessaire que la forme suivie par cette évolution comporte des informations à plus dune échelle. Comme on parle ici de contrôle, on peut supposer que les formes à léchelle supérieure seront apportées par lutilisateur.
On travaille alors sur les plus petites échelles. Cest ce quon appellera " délinéarisation à petite échelle ".Par ailleurs, on peut souhaiter agir sur plusieurs paramètres en même temps, dans le but de réaliser une transformation plus riche. Il faut donc alors rassembler les paramètres indépendants en un seul paramètre, qui deviendra le paramètre de contrôle de cette nouvelle évolution.
Cest ce quon désignera par " rassemblement des paramètres ".
Mais cet aspect " contrôle "
nest pas le seul aspect en cause.
La problématique est finalement dordre plus général, et peut se résumer ainsi : comment rendre un son plus vivant, plus adapté à la perception, quil ne lest au départ ? On utilise alors les trois mêmes méthodes : linéarisation à grande échelle, délinéarisation à petite échelle, rassemblement des paramètres.
Si lon souhaite pratiquer la " délinéarisation
à petite échelle ", il convient de mettre au point un
générateur de formes. Ces formes seront ensuite, dune manière
ou dune autre, associées à la transformation ou lévolution
du son à petite échelle.
Voici quatre formes que lon utilisera couramment ; par ordre de périodicité
croissante :
* Forme 1 : tirage aléatoire avec probabilités uniformes (random simple)
Note concernant la forme 3 : le système de Lorenz possède un comportement de type " chaos déterministe " - il est défini par un système de 3 équations différentielles :
X(t) = a(X(t) Y(t)) Y(t) = -X(t)Z(t) ReynoldsNumberX(t) Z(t) = X(t)Y(t) bZ(t)
Résultats de lexpérience :
Etape 1 (rassemblement des deux évolutions en une seule = rassemblement des paramètres) : Malgré la différence de nature des deux évolutions, on ne perçoit plus chaque évolution en tant que telle, mais on perçoit une évolution unique. Dans ce cas là au moins, la notion de rassemblement des paramètres sapplique fort bien. Par contre, lévolution elle même nest pas du tout progressive : on passe brutalement dun état à un autre, sans bien comprendre la transition.
Etape 2 (linéarisation à grande échelle) : On résout le problème précédent en modifiant la forme chacune des évolutions individuelles. La fonction de transfert est, dans le cas du paramètre individuel lié à GRM bandpass, de type exponentielle, tandis que dans le cas de la directivité du la source, elle est de plutôt de type logarithmique.
Etape 3 (délinéarisation à petite échelle) : Une fois l " évolution rassemblée " régulière, on applique à ce paramètre une délinéarisation à petite échelle réalisée avec la forme 4 du générateur de forme. On finit par trouver un " taux de délinéarisation " pour lequel on nentend plus cette perturbation en tant que telle, mais pour lequel on entend la même évolution globale, mais daspect plus " naturel " : on la perçoit comme une évolution , certes, mais plus comme un glissendo de paramètres à laspect rectiligne.
Conclusion : Lapplication des principes évoqués lors du paragraphe 1 du même chapitre semble donc, au moins pour ce cas relativement simple, un succès.
Penchons nous maintenant de manière plus détaillée sur la délinéarisation à petite échelle.
Lexpérience :
Prenons un son, apparemment de synthèse, ressemblant à un son de triangle. Ce son est essentiellement formé dune attaque, et dun decay très peu riche à léchelle des 100ms. A laudition, ce decay sonne " linéaire " et perceptivement peu intéressant.
Lexpérience consiste à appliquer différents vibratos de hauteur à ce decay, afin de déterminer le seuil à partir duquel on nentend plus cette modulation en tant que vibrato, cest à dire à partir duquel on entend le son dorigine, enrichi perceptivement à petite échelle.
Ce vibrato de hauteur est réalisé à partir du générateur de formes. Les quatre illustrations ci dessous montrent, en bleu, lenveloppe RMS du son. Les points rouges sur laxe des temps représentent les secondes. En noir, les formes qui ont été utilisées, à différents taux, pour la modulation.
forme 1
|
forme 2
|
forme 3
|
forme 4
|
Voici, exprimés en demi-tons crête à crête, puis en rapport de fréquence crête à crête, lamplitude des différents vibratos appliqués pour chaque groupe de mesures, on peut voir que lamplitude diffère dune forme à lautre ; ces ajustements, réalisés sur la base dexpériences antérieures, ont pour but datténuer les différences concernant lamplitude de la perturbation perçue lors de lapplication dune même valeur numérique.
Groupe 1 F1 1.2054 1.0723 F2 1.1997 1.0712 F3 1.2630 1.0802 F4 1.1992 1.0718 |
Groupe 2 F1 0.533 1.0339 |
Groupe 3 F1 0.205 1.0120 |
Groupe 4 F1 0.1085 1.0063 |
Groupe 5 F1 0.0553 1.0032 |
Résultats de lexpérience / conclusions : A lécoute, on constate les phénomènes suivants :
Remarque : A la lumière des principes exposés lors du chapitre 1, on peut constater que les formes qui se prêtent bien à une utilisation en tant que composante à petite échelle comportent des informations non immédiatement compréhensibles, cest à dire de forme ni trop forte, ni trop faible, à au moins deux échelles dobservation distinctes : cest à dire des formes considérées, à la lumière des principes du chapitre 1, comme " perceptivement adaptées ".
Prenons un filtre passe-bas de pente 6dB / octave le plug-in VST Prosoniq North Pole, et faisons évoluer sa fréquence de coupure du point le plus bas possible 20Hz, au point le plus haut possible bypass. Puis, linéarisons cette évolution à grande échelle : on utilise pour celà une fonction de transfert de type exponentiel. On obtient alors lévolution suivante mesurée ici à laide un bruit rose:
Cette évolution est perçue comme linéaire. On utilise ensuite les mêmes formes que précédemment, dans le but de délinéariser cette évolution à petite échelle. Le son utilisé pour le test est une trame stable à grande échelle, comportant déjà un certain nombre dinformations à petite échelle, très riche spectralement. Pour chaque forme, on teste donc les valeurs de modulation suivantes mesurées avec un bruit rose.
Rapport de fréquence crête à crête | 1.20 | 1.30 | 1.46 | 2.39 |
en demi-tons | 3 | 4.5 | 6.5 | 15 |
en pourcentage de lévolution totale | 2% | 4% | 6% | 10% |
Conclusions : Première constatation : lors de lexpérience précédente, le rapport de fréquence crête à crête de la modulation correspondant à leffet recherché se trouvait aux alentours de la valeur 1.005, ce qui correspondait à un comma à peine ; ici la valeur typique est plutôt de lordre de 1.3 ou 1.4 , ce qui correspond à un intervalle denviron 5 demi tons. On répète alors la même expérience en utilisant un autre plug-in, la version VST de GRM Band Pass, utilisé en low pass de la même manière cette fois, la pente est de 96dB / oct, donc le filtrage est différent. Lordre de grandeur de modulation correspondant à leffet recherché est sensiblement le même : rapport de fréquence crête à crête 1.2, ce qui correspond à un intervalle denviron 3 demi-tons.
Comment expliquer une telle différence ?
Deux aspects distinguent cette expérience de la précédente : le son utilisé est beaucoup plus complexe, plus riche spectralement, et on soccupe ici de filtrage, non plus de vitesse de playback. Un bref essai dutilisation du son de lexpérience précédente dans le cas présent renvoie des valeurs du même ordre de grandeur que celui que lon obtient en utilisant le son plus complexe : un rapport de fréquence denviron 1.3. La différence serait donc dûe à la nature du traitement lui-même.
La situation est donc la suivante : on a utilisé la délinéarisation à petite échelle dans deux processus tout à fait différents, a ceci près que lunité utilisée pour les mesures est la même dans les deux cas, ce qui nous permet de comparer objectivement les résultats. Et ces résultats sont extrêmement différents.
Cela voudrait dire quil ny a pas de taux " typique " de délinéarisation, et que ceux ci changent du tout au tout suivant la nature de lévolution à plus grande échelle que lon délinéarise. Il conviendrait donc de rester prudent, et avant toute utilisation de ce procédé, de procéder à des tests permettant de déterminer lordre de grandeur convenable.
50
|
100
|
150
|
200
|
On peut constater une grande variété de formes, et une augmentation de la " pseudo fréquence " de ce système " pseudo périodique ". On peut modifier artificiellement la forme prise par la suite de ces valeurs en appliquant une fonction de transfert en sortie du module de calcul. Par exemple, on applique ici une fonction de transfert à X(t) pour la valeur 100 du Reynolds Number :
|
à |
|
à |
|
Lexpérience :
Un son un accord mineur tenu par un groupe de cordes, est traité à laide du plug-in VST Waves Ultrapitch un pitch shifter avec reconnaissance des hauteurs, de la manière suivante : Un " repitchage " - pas une transposition vers le haut autour de 6 demi-tons, et un vers le bas également autour de 6 demi-tons. Le tout est superposé au son original. La sortie X(t) du système de Lorenz est dirigée vers le repitchage haut , et la sortie Z(t) vers le repitchage bas.
Cela donne deux évolutions pseudo périodiques synchronisées, centrés autour de +/- 6 demi tons. On produit donc de cette manière 6 fichiers son, en donnant successivement au nombre de Reynolds les valeurs 25, 50, 100, 150, 200 et 250. Puis on applique différentes courbes de transfert aux sorties X(t) et Z(t), en particulier la courbe suivante, qui provoque un doublement de la pseudo période :
Conclusions :
A lusage, on saperçoit rapidement que leffet principal de loptimisation empirique est de rendre les formes plus fortes. On peut en conclure que le système de Lorenz génère des formes un peu trop faibles pour être, au moins dans certains cas, perceptivement adaptées.
Le troisième point suggère une remarque intéressante : ladaptation perceptive est résistante aux transformations simples. Ceci est finalement normal, si lon songe que linadaptation perceptive lest aussi : en effet, ce nest pas en appliquant une courbe de transfert simple sur un sinus que lon va créer un son intéressant et riche
Une synthèse de ces deux remarques consisterait à dire que le rôle du système de Lorenz, ou de tout autre système susceptible dêtre perceptivement adapté, est en quelque sorte dapporter les éléments de cette adaptation, et pas une forme précise. La forme finale, elle peut être façonnée manuellement. Dans ce sens, le rôle de tels systèmes est dêtre les garants de la richesse perceptive du résultat final.
Note : Au cours de cette expérience, on a essayé de désynchroniser X(t) et Z(t), dans le but de vérifier si cette synchronisation, naturellement apportée par le comportement du système de Lorenz, était importante. Et on sest aperçu que sans synchronisation, les formes devenaient, dun point de vue perceptif, beaucoup trop faibles. Cette synchronisation semble donc indispensable.
On peut par ailleurs en conclure quil est nécessaire dappliquer la délinéarisation à petite échelle sur le paramètre rassemblé, et pas indépendamment sur chaque paramètre individuel ; donc, après le rassemblement des paramètres. Ainsi, on sera sûr dobtenir des délinéarisations synchronisées, et donc des formes à petite échelle suffisamment fortes.
Lidée est de faire vibrer plus ou moins rapidement laxe de projection du son, ce pour tenter dobtenir trois résultats distincts :
*** augmentation de la richesse perceptive, même si on ne sait pas encore quel aspect cette richesse peut prendre dans le cas présent.
*** en approche " réflexions ", une possible meilleure localisation de la source virtuelle du son on sappuie donc sur le principe que le cerveau localise mieux une source animée dun léger mouvement - cf compte rendu Septembre 2000, bas de la page 16.
*** en approche " volume ", un élargissement de la zone de délocalisation, comme illustré sur le schéma suivant :
Rappelons les natures respectives des approches " réflexions " et " volume " :
|
|
Approche " réflexions "
|
Approche " volume "
|
Une demi-période dune valeur élevée, associée à une vitesse de rotation lente, donnera une vibration ample et lente.
Au contraire, une demi-période faible et une vitesse rapide donnera une vibration courte et rapide. Une demi-période élevée associée à une vitesse de rotation donnera une vibration ample et rapide, etc
La demi-période de rotation sera par la suite exprimée en millisecondes. La vitesse de rotation sera exprimée dans lunité propre à la trackball. Equivalence : v = 1 correspond à 0.25 tour/seconde.
Lexpérience : Cette composante à petite échelle est ajoutée successivement à trois composantes à grande échelle :
Dans chacun des trois cas, on utilise le vibrateur avec les paramètres suivants :
Groupe 1 |
Groupe 2 |
Groupe 3 |
*vibration lente :
194ms / v3 *vibration rapide : 82ms / v7 *vibration très rapide : 50ms / v13 |
*vibration lente :
122ms / v10 *vibration rapide : 82ms / v13 *vibration très rapide : 54ms / v17 |
*vibration lente :
286ms / v9 *vibration rapide : 198ms / v13 *vibration très rapide : 82ms / v24 |
ce qui correspond à un angle de vibration " petit " (environ +/- 5°) | ce qui correspond à un angle de vibration " moyen " (environ +/- 10°) | ce qui correspond à un angle de vibration " grand " (environ +/- 20°) |
Résultats de lexpérience :
On écoute les résultats liés à lapplication des valeurs de vibration appartenant aux trois groupes, dans loptique dy trouver leffet " élargissement de la zone de délocalisation ". Le groupe donnant les meilleurs résultats est le groupe 2. En particulier, le couple de valeurs (54ms, v17) donne de bons résultats. Le groupe 3 donne lui aussi de bons résultats, mais au prix de lapparition dun " effet Leslie " très marqué. Si lon écoute les résultats dans loptique dy trouver leffet " augmentation de la richesse perceptive ", ce que entend dans le groupe 3 est intéressant : cet " effet Leslie " est fort curieux, et ajoute à la confusion perceptive inhérente au rayonnement bidirectionnel fixe transversal.
Sans composante à petite échelle, on entend assez clairement, au moins dans le studio 4, une rotation du son autour du cube. Mais, quand on ajoute cette composante à petite échelle, les choses se passent moins bien : si les valeurs liées au groupe 1 napportent rien, les valeurs liées aux groupes 2 et 3 affaiblissent cette impression de rotation, sans rien apporter en retour. On peut en déduire que, dans la cas dun rayonnement mobile en approche volume, lajout dune composante à petite échelle est non seulement inutile mais aussi nuisible.
Les résultats de cette expérience ont été écoutés dans le studio 4, endroit dans lequel lapproche réflexions fonctionne notoirement mal. Il est en effet presque impossible dentendre une réflexion sur une des parois. Si lon ajoute une composante à petite échelle, on peut entendre, notamment en utilisant le couple de valeurs (54ms, v17) du groupe 2, un léger progrès : une délocalisation fugitive pendant moins dune seconde. On pourrait en conclure que lajout dune composante à petite échelle serait susceptible, dans le cadre de lapproche réflexions, daméliorer laspect " meilleure localisation de lorigine virtuelle du son ". Mais il faut impérativement écouter les résultats de cette expérience dans un autre endroit.
Conclusions :
Dans le second cas, lajout dune composante à petite échelle est non seulement inutile, mais encore nuisible. Dans le troisième, on ne peut se prononcer. Reste le premier cas. Dans ce cas-ci, le paramétrage du vibrateur le plus adapté, dans le cadre dune optique " élargissement de la zone de délocalisation ", serait situé juste avant que leffet Leslie commence à se faire entendre.
On peut se demander alors comment " repousser " cet effet Leslie le plus loin possible. Considérons alors la forme de la composante à petite échelle rajoutée : cest une fonction en triangle. Reportons nous maintenant aux conclusions de lexpérience présentée lors du paragraphe 4 du présent chapitre, et aux principes exposés lors du chapitre 1 : les formes trop périodiques ne conviennent pas à une telle utilisation, car on les entend trop en tant que telles.
Il semble alors nécessaire dutiliser, dans le cadre dun tel processus, une composante à petite échelle dont la forme rappelle celle des formes 2 ou 3.
Larchitecture de lobjet Max " trackball " nous interdit pour linstant lapplication de telles formes, mais le problème est en cours de résolution. Il devrait alors être possible délargir la zone de délocalisation de manière très significative.