EQUIPE ANALYSE-SYNTHESE
RAPPORT
D�ACTIVITE 2002
Responsable : Xavier Rodet
Les travaux de lՎquipe Analyse et synth�se des sons sont centr�s sur les probl�matiques de l�utilisation, de l�interpr�tation automatique de l�audio, et, inversement de sa g�n�ration. Le th�me du traitement fond� sur le contenu est relativement nouveau et conna�t une forte croissance dans les centres de recherche et dans les applications. Mais c�est aussi le moyen d�extraire automatiquement de l�information � partir de l�audio pour venir en aide aux musicologues dans l�analyse musicologique, ainsi de nouveaux travaux ont �t� lanc�s dans cette direction. La s�paration de sources �galement participe essentiellement de l�analyse, mais trouvera des applications tr�s int�ressantes dans l�indexation par exemple ou dans des traitements intelligents. Dans le domaine de la synth�se aussi, les m�thodes utilisant de grandes bases de donn�es, comme la s�lection d�unit�s, sont appel�es � de fort d�veloppement [Rodet02a]. Enfin les techniques d�inversion commencent � donner des r�sultats prometteurs pour faciliter l�utilisation de mod�les puissants et donc complexes � contr�ler. De toutes ces recherches d�coulent de nombreuses applications, librairies et autres d�veloppements logiciels pour les musiciens ou pour le grand public comme la transformation de voix.
Les traitements fond�s sur le contenu connaissent en �norme d�veloppement dans le monde en termes de recherche autant que d�implication de grandes compagnies commerciales. Le comit� de normalisation et les conf�rences MPEG-7 et ISMIR sont quelques-uns des lieux o� cette activit� est en pleine croissance. Ainsi, G. Peeters a particip�, entre autres, aux meetings MPEG-7 de Klagenfurt et de Shanghai et y a repr�sent� l�Ircam et Sony avec qui l�Ircam collabore dans CUIDADO. Un nouveau type de repr�sentation des donn�es, le modulationType, y a �t� propos�. Les activit�s de lՎquipe concernent la caract�risation, la classification et l�indexation de l�audio dans le cadre du multim�dia en g�n�ral.
LՎtude de la caract�risation des sons afin d�en permettre la classification automatique a �t� poursuivie [Peeters02b], [Herrera03a]. En particulier de nouveaux descripteurs ont �t� �tudi�s : modulation (d�amplitude et de fr�quence), MFCC, Sonies relatives. Deux proc�dures de s�lection automatique des descripteurs les plus appropri�s pour un sch�ma de classification donn� (sch�ma pizzicato/sustain, sch�ma famille d�instrument, sch�ma instruments) sont propos�es : s�lection sur base de l�information mutuelle, s�lection sur base des axes discriminants. Cette s�lection permet de r�duire le nombre de descripteurs n�cessaires pour la classification et ainsi d�all�ger la mod�lisation et dՎviter la � mal�diction de la dimensionnalit� �. Les descripteurs s�lectionn�s sont ensuite utilis�s pour l�estimation des param�tres des classes (modification par analyse discriminante et mod�lisation de type gaussien multidimensionnel). LՎvaluation de la m�thode compl�te (extraction, mod�lisation et classification) est effectu�e sur un sous ensemble de 1400 sons issus de Studio-Online. Le taux de r�ussite moyen (�valu� sur des ensembles d�apprentissage et de test de 66 % et 33 % de la base de donn�e respectivement) est de 90.5 %.
Le portage de l�ensemble du syst�me (extraction/mod�lisation/classification) en C++ a �t� effectu� et int�gr� dans la version en ligne de la Sound Palette de CUIDADO.
Ces travaux ont �t� pr�sent�s aux meetings MPEG-7 de Klagenfurt et de Shanghai et ont permis de proposer un nouveau type de repr�sentation des donn�es dans MPEG-7: le modulationType.
Participants : G. Peeters
Collaborations internes : �quipe Services en ligne
Collaborations ext�rieures : P. Herrera (UPF, Barcelone), F. Pachet (Sony)
Ce projet est une collaboration
entre l'Ircam, l'Ina-GRM et la soci�t� Digigram sur un financement PRIAM.
L'objectif du projet est de d�velopper des outils, destin�s aux professionnels
de la production sonore, proposant diff�rentes interfaces de navigation �
travers une grande base de donn�es d'�chantillons sonores � partir de
descripteurs de haut niveau (recherche par contenu, �dition, etc.).
L'�tude sur la classification a �t� poursuivie en 2002 [Tisserand02a]. Afin d'am�liorer les r�sultats nous avons choisi de travailler plus profond�ment sur les m�thodes de mod�lisation des �volutions dynamiques [Tisserand02b]. La d�composition en polyn�mes de Legendre a �t� retenue pour la mod�lisation de l'enveloppe temporelle des descripteurs. Les r�sultats de ces �tudes ont permis la cr�ation d'une biblioth�que, �crite en C++, offrant les fonctionnalit�s de la classification automatique � la plate-forme en ligne ECRINS de lՎquipe Service en ligne. Une pr�-�tude sur les outils de mise en forme a �t� conduite [Tisserand02c] et des maquettes impl�ment�es en Matlab.
Participants : P. Tisserand, G. Peeters
Collaborations internes : M. Jacob (�quipe Services en ligne)
Collaborations ext�rieures : P. Herrera (UPF, Barcelone)
Le but de cette th�se est de comprendre les m�canismes qui relient les informations contenues dans les diff�rents m�dias d'un document multim�dia et de les utiliser conjointement pour l�indexation. Dans le contexte d'une base de donn�es multim�dia, on cherche � caract�riser ces relations de fa�on � permettre l'indexation et la recherche des contenus par la fusion d'information multicrit�res, fond�s sur le Son, le Texte et l'Image. Les principaux r�sultats de l�ann�e 2002 sont :
- Elaboration de descripteurs audio (signature) du signal.
- Cr�ation d'une base de donn�e multim�dia.
- Etude des relations entre les contenus des diff�rents m�dias (vid�o, audio et texte) d'un document.
- Cr�ation d'un syst�me de classification prenant en compte la multimodalit� des documents
La base de donn�e audio qui a �t� cr��e comporte des signaux de provenances diverses : musique populaire et classique, journaux t�l�vis�s, films, etc. Un syst�me d'indexation multim�dia a �galement �t� �bauch�. Il comprend un segmenteur audio et vid�o, et une classification de l'audio en trois classes : parole pure, musique et m�lange parole/musique.
Il reste d�sormais � aborder plus particuli�rement l'�tude des possibilit�s li�es � la multimodalit� des documents, afin de mieux comprendre et utiliser les relations entre m�dias (notamment l�audio et la vid�o).
Participants : B. Delezoide
Collaborations ext�rieures : M.M. Pic (CEA)
Le syst�me de reconnaissance d�extraits musicaux dans une large base de donn�es, appel� Web Music Monitoring System (WMMS), d�velopp� dans le cadre du projet CUIDADO, b�n�ficie maintenant d�un syst�me de reconnaissance am�lior� par utilisation de probabilit�s conditionnelles. Ce syst�me a �t� test� sur une large base de donn�e, ce qui permet de faire passer le taux de reconnaissance de 94.5 % � 97 % (97.5 % sur les 5 premiers extraits trouv�s).
Le prototype d�application (�chantillonneur/extracteur/base de donn�e/classifieur) a �t� port� sur plate-forme Windows.
Participants : G. Peeters
Les recherches de l�Institut sur l�analyse musicale se sont traduites durant l�ann�e 2002 par un groupe de travail pluridisciplinaire anim� par G. Assayag et X. Rodet. Un site regroupe des informations, rapports et logiciels r�sultant de ces r�unions
http://bscw.gmd.de/pub/english.cgi?op=rmail
Enfin un rapport final r�sume les conclusions du groupe de travail. Les travaux concernant l�analyse musicale men�s dans lՎquipe Analyse-Synth�se s�appuient sur les recherches orient�es contenu men�es dans les projets ECRIN et CUIDADO, Ainsi les r�sum�s musicaux ont �t� �tudi�s dans CUIDADO, et une th�se a commenc� sur le sujet plus g�n�ral de l�extraction de structures musicales � partir de l�audio en collaboration avec lՎquipe Repr�sentation Musicale. Enfin l�alignement de partitions avec l�audio doit permettre, entre autres, des travaux musicologiques, par exemple sur l�interpr�tation.
Les r�sum�s � construire � partir d�un enregistrement audio doivent constituer une repr�sentation concise mais incluant l�essentiel du contenu d�une �uvre musicale, soit sous forme visuelle, soit sous forme sonore. Dans un premier temps, des caract�ristiques sont extraites du signal sonore de l��uvre. Ces caract�ristiques servent ensuite � l�analyse de son contenu.
Dans le cadre du projet CUIDADO [Peeters02c], l�analyse consiste en une mod�lisation de l��uvre sous forme dՎtats (� titre d�exemple, dans le cas de la musique populaire, les �tats repr�sentent les diff�rentes parties telles que couplets, refrains, etc.). Cette repr�sentation est obtenue par apprentissage non-supervis� (fuzzy-kmeans et mod�le de Markov cach� avec pruning dans les deux cas). Cette repr�sentation est appel�e � approche par �tat � par opposition aux m�thodes dites � approche par s�quence � g�n�ralement utilis�es pour les matrices de similarit�.
L�approche par �tat donne lieu � un r�sum� visuel sous forme d�une repr�sentation visuelle de type � piano-roll �. Un syst�me interactif a �t� d�velopp�, permettant � l�utilisateur d�appr�hender la structure temporelle d�une �uvre par simples clicks.
L�approche par �tat donne �galement lieu � un r�sum� sonore par construction d�un signal sonore constitu� de la concat�nation d�extraits des signaux des diff�rents �tats. Une technique permettant d�am�liorer la qualit� du signal sonore est propos�e : BSOLA (beat-synchronous overlap-add).
Dans le cadre d�un stage du DEA ATIAM [LaBurthe02a], lՎtude des repr�sentations hi�rarchiques de la structure du signal a �t� commenc�e. Pour cela la m�thode de l�� Oracle des facteurs � est appliqu�e aux observations du signal.
Participants : G. Peeters, A. La Burthe (stage)
Collaborations internes : �quipe Services en ligne
Collaborations ext�rieures : P. Herrera (UPF, Barcelone)
Le but de cette th�se, qui vient de commencer, est d'extraire des structures � partir du signal audio d'une pi�ce sonore : la similarit�, les transformations et la discontinuit� sur des �chelles micro- et macro-temporelles sont les constituants de base de la structure cherch�e. L'utilisation du langage de script Python, orient� objet, permet la cr�ation d'un cadre consistant et stable, facile � �tendre et int�grable dans d'autres logiciels. Elle permet aussi la combinaison facile de plusieurs approches d'analyse d'une pi�ce musicale. En stockant les donn�es calcul�es dans des objets persistants, on peut �viter la r�p�tition de calculs co�teux, donc fournir un environnement pour faire des exp�riences rapides, et en m�me temps un environnement d'analyse qui peut contenir beaucoup d'informations diverses de nombreuses pi�ces. Une des approches �tudi�e est une extension des r�sultats de la th�orie de l'information structurelle (SIT) dans le domaine de l'audio, particuli�rement par la modification d'un algorithme g�n�tique d'abord utilis� pour rep�rer les structures dans des formes des s�quences lin�aires.
Participants : K. Souren (th�se)
Collaborations internes : G. Peeters (�quipe Analyse-Synth�se)
L�alignement d�un enregistrement audio et de sa partition consiste � d�terminer les positions temporelles exactes des �l�ments de la partition (notes et accords) dans un enregistrement audio. Les applications de l�alignement de partitions sont nombreuses, par exemple permettre de constituer automatiquement une grande base de donn�e de segments sonores pour la synth�se concat�native par s�lection d'unit�s sonores. Une m�thode d'alignement automatique a �t� d�velopp�e, fond�e sur l'algorithme Dynamic Time Warping (DTW). Elle utilise la structure des pics spectraux, augment�e par un mod�le d'attaque et de silence. La m�thodologie peut traiter des signaux audio consid�r�s difficiles � aligner, comme la musique polyphonique, des trilles, ou des s�quences rapides.
Cet algorithme a �t� implant� en Matlab et am�lior� sur plusieurs points :
� Optimisation de la repr�sentation du chemin d'alignement pour les fichiers sonores volumineux (jusquՈ 2000 notes).
� Accroissement de la r�solution temporelle,
� Diminution du temps de calcul.
� Structure logicielle revue et am�lior�e.
� Meilleures contraintes dans la recherche du chemin.
� Am�lioration de l�analyse du signal.
� Renforcement de la robustesse pour aligner correctement les notes faibles noy�es dans des notes plus fortes et dont les partiels sont difficiles � distinguer.
Ce programme peut traiter maintenant avec peu d�erreurs des morceaux polyphoniques de moins de cinq instruments pouvant m�me comporter de la voix chant�e. LՎvaluation du programme est difficile car il faut constituer des fichiers de test faisant r�f�rence et donc segment�s en notes. En particulier, il est n�est pas simple de trouver des fichiers audio et des fichiers midi correspondants qui ne soient pas entach�s d�erreurs.
Participants : D. Schwarz (th�se), F. Soulez (stage), E. Vincent (th�se)
Collaborations internes : N. Orio (�quipe Syst�mes temps-r�el)
Cette �tude a pour but dՎclaircir les effets acoustiques des principes de la p�dagogie Bel Canto sur le chant choral. Les exp�riences et analyses effectu�es dans ce stage ont fourni des mesures acoustiques objectives de l'effet de cette m�thode. Les exp�riences ont eu lieu dans l'Espace de Projection � l'Ircam � Paris. Dans un premier temps, le chef de ch�ur a fait chanter douze exercices par son ch�ur. Ensuite, un travail a �t� fait pendant 90 minutes sur plusieurs principes centraux de la m�thode Bel Canto. Les m�mes exercices ont �t� enregistr�s � nouveau pendant ce travail. Finalement, la comparaison acoustique de ces deux versions des m�mes exercices a conduit aux r�sultats. Pour ces mesures acoustiques sur les enregistrements, des programmes existants (additive, F0, XSpect, etc.) ont �t� utilis�s ainsi que de nouveaux programmes d�velopp�s � cette occasion. Les principes centraux de la m�thode Bel Canto �tudi�s sont les suivants.
La Vibration :
La mesurer de lՎnergie dans la bande du formant des chanteurs montre bien l'efficacit� acoustique sup�rieure que la vibration donne � la voix.
La r�sonance chiaroscuro (claire-obscure, brillant-riche) :
Pour changer de voyelle le conduit vocal doit changer de forme. Ce mouvement peut entrainer une alt�ration importante de la fa�on dont la r�sonance influence la justesse du chant. Le lien entre changement de r�sonance et changement de vibration des cordes vocales (fr�quence) peut �tre tr�s fort. Cependant, nous avons trouv� que cette influence p�jorative peut �tre r�duite, voir supprim�e, lorsque le principe de r�sonance Bel Canto de chiaroscuro est appliqu�.
La nota mentale :
Apr�s avoir travaill� le principe de la nota mentale, nous voyons qu�un ch�ur poss�de beaucoup plus d'�nergie dans les hautes fr�quences, surtout dans les r�gions des formants.
Messa di voce :
Ce principe assure une consistance d'�nergie vocale et de justesse lorsqu'un ch�ur chante doucement ou effectue un decrescendo � l'int�rieur d'une phrase musicale. Le d�tail des exp�riences et des r�sultats est publi� dans [Fagnan02a]
Participants : L. Fagnan (stage), X. Rodet
Collaborations ext�rieures :Universit� d�Alberta, Edmonton
Le traitement des signaux est fondamental pour l�analyse, la modification et la synth�se des sons musicaux. Dans ce domaine, la s�paration de source est l�un des probl�mes les plus difficiles et les plus int�ressants. Des r�sultats prometteurs ont �t� obtenus lorsque le probl�me est restreint, par exemple par des connaissances sur l�une des sources ou s�il s�agit seulement de modifier la balance d�une voie dans un mixage relativement simple. La recherche des fr�quences fondamentales dans les enregistrements polyphoniques est un probl�me apparent�, sur lequel lՎquipe a bien avanc� en 2002, car s�parer les sources et trouver les diff�rentes notes sont deux points de vue fortement reli�s. Enfin les repr�sentations en partiels, mod�le dit additif, et par enveloppe spectrale, mod�le dit source-filtre, continuent � �tre d�velopp�es car ce sont parmi les plus importants pour les musiciens.
En r�ponse � des besoins internes et � des demandes externes, une �tude a �t� men�e sur la s�paration d�une source de bruit et d�un signal utile (par exemple une source de radio et une voix) � partir d'un enregistrement st�r�o o� un canal contient un fort niveau de la source de bruit (radio).
Plusieurs algorithmes de
s�paration ont �t� �tudi�s. Le premier impl�mente la s�paration des sources
convolu�es sans connaissance sur le contenu des canaux. Cet algorithme est
proche de l'algorithme de Murata, Ikeda et Ziehe. Il utilise une transformation
de Fourier � court terme et applique une d�composition en composantes
ind�pendantes (ICA) � chaque canal de l'analyse. Les composantes ind�pendantes
sont trouv�es par diagonalisation conjointe de plusieurs matrices de
corr�lation (avec plusieurs retards). A la place de l'algorithme en deux pas
propos� par Murata et al., c�est l'algorithme de Pham qui est utilis� ici. Il
pr�sente l'avantage d'avoir une objective function directement li�e � une maximisation de vraisemblance. Pour
le regroupement des composantes ind�pendantes (probl�me des permutations) un
nouvel algorithme a �t� d�velopp�.
Un deuxi�me algorithme de s�paration a �t� d�velopp� qui consid�re qu�un canal seulement est un m�lange et que le deuxi�me canal contient la source de bruit. Le probl�me de regroupement ne se pose alors plus et la s�paration des sources se fait simplement par estimation de la matrice de corr�lation.
L'�tude a montr� que l'algorithme le plus g�n�ral souffre d'un temps de calcul beaucoup plus grand. Les r�sultats de s�paration obtenus sont similaires. La qualit� de la s�paration a �t� jug�e tr�s bonne par le correspondant externe.
Participants : A. Roebel
Ce travail a pour but d'extraire dans un enregistrement mono ou st�r�o m�langeant plusieurs instruments, la partie jou�e par chaque instrument, sous forme de partition ou sous forme sonore.
E. Vincent a poursuivi son travail de th�se en appliquant la mod�lisation de Markov cach�e (HMM) et l'analyse en sous-espaces ind�pendants (ISA) � la d�tection de zones correspondant � chaque instrument dans le spectrogramme de l'enregistrement. L'alignement de partitions a �t� utilis� pour l'apprentissage supervis� des HMM. L'�tude des d�fauts et des avantages de ces deux mod�les a conduit � concevoir une combinaison HMM+ISA actuellement � l'�tude.
Une Action Jeunes Chercheurs du GdR ISIS a d�but� en mars 2002 avec l'IRISA (REnnes) et l'IRCCyN (Nantes). Les r�sultats de l'Action (rapports internes, routines MATLAB, base de donn�es d'�valuation) sont disponibles sur http://www.ircam.fr/anasyn/ISIS/
T. Foirien a particip� � la cr�ation d'une petite base de donn�es d'apprentissage et d'�valuation.
Participants : E. Vincent (th�se), T. Foirien (stage)
Collaborations internes : D. Schwarz, N. Orio, F. Soulez (groupe de travail sur l'alignement de partitions)
Collaborations ext�rieures : S. Dubnov (universit� Ben Gourion, Isra�l), F. Bimbot (�quipe METISS, IRISA Rennes) et C. F�votte (IRcCYN, Ecole Centrale de Nantes)
Dans les travaux poursuivis sur
l'estimation de la fr�quence fondamentale dans lՎquipe Analyse-Synth�se, un
r�sultat central obtenu est que la fonction de distance qui servait pour
s�lectionner les fr�quences fondamentales, utilisant la divergence de
Kullback-Leibler, pas assez souple, ne pouvait pas �tre adapt�e suffisamment au
probl�me [Prudham02a]. Une nouvelle �valuation
des f0 candidats a �t� con�ue, fond�e sur trois �l�ments clefs qui
caract�risent le spectre observ� et le mod�le :
- La distance entre les maxima du mod�le et leurs correspondants du spectre observ�.
-
La r�gularit� de l'enveloppe
spectrale du mod�le.
-
La partie du spectre observ�
expliqu�e par le mod�le.
Ces trois �l�ments (normalis�s et pond�r�s suivant leur
importance) comme arguments de la fonction de distance ont permis d�am�liorer
consid�rablement la qualit� et la robustesse de
l'estimation. LՎvaluation de l'algorithme a �t� faite sur les bases de donn�e
fournies par A. de Cheveign�. Pour la base fda de Bagshaw l'erreur totale est
de 2.23 % ce qui est �gal � l�erreur obtenue par la meilleure m�thode, Yin
de A. de Cheveign�. Si on prend comme r�f�rence les valeurs obtenues par Yin
sur le signal du laryngophone, l'erreur du mod�le Yin est plus faible que
l'erreur de notre mod�le. Comparant avec additive-f0, le taux d'erreur est
r�duit de 30 %. Pour la base de donn�e Atake, l'erreur passe de 2.4 %
pour additive-f0 � 0.7 % (en comparaison, Yin a un taux d'erreur de
0.3 % seulement).
Participants : A. Roebel, B. Prudham (stage)
Collaborations internes : A.
de Cheveign� (�quipe Perception et cognition musicales)
Les travaux sur le mod�le additif [Wright02a] concernent les signaux non stationnaires. Pour le cas de faible changement d'amplitude, une estimation de la pente fr�quentielle a �t� �tablie en utilisant la m�thode de r�allocation. La m�thode utilise cinq transform�es de Fourier avec diff�rentes fen�tres. A cause de la forme de ces fen�tres, la r�solution fr�quentielle est r�duite. Mais un m�canisme simple permet de d�tecter les cas probl�matiques et d�utiliser alors la m�thode standard.
La nouvelle m�thode [Roebel02a] a �t� compar� avec d'autres m�thodes d'estimation fr�quentielle notamment la m�thode utilisant une fen�tre Gaussienne. Les r�sultats obtenus par la nouvelle m�thode sont plus pr�cis dans la majorit� des cas sp�cialement si l'amplitude ne change pas fortement.
Pour les r�gions transitoires, une d�tection a �t� mise en place. Elle permet de traiter les r�gions transitoires diff�remment. La recherche avec notre mod�le adaptatif (pbench) et les r�sultats obtenus avec r�allocation (m�thode Loris) ont montr� que le mod�le additif peut �tre am�lior� consid�rablement dans les r�gions transitoires sans quitter le formalisme additif. Le probl�me avec la m�thode r�allocation est que les transitoires sont meilleurs subjectivement mais que le r�siduel est forc�ment dՎnergie plus grande. Le mod�le adaptatif permet une erreur plus petite, mais le temps de calcul est lourd. Dans cette situation, une nouvelle approche a �t� �tudi�e qui r�duit le co�t d'optimisation � la r�solution d�une �quation lin�aire en utilisant une sinuso�de et un cosinuso�de de fr�quence fixe et amplitude variable. Apr�s r�solution, les r�sultats sont port�s dans le formalisme additif standard. La m�thode permet une r�duction du r�siduel dans les r�gions transitoires de 20 % environ. Une difficult� est le probl�me de d�tection des transitoires qui sՎtend par erreur � des r�gions � forte modulation (souvent des r�gions bruit�es). Ces erreurs de classification sont g�nantes parce que le temps de calcul est accru sans que le r�sultat soit am�lior�. Il faut donc trouver une d�tection plus robuste. Le deuxi�me probl�me de l'algorithme actuel vient de ce que les valeurs des param�tres devraient s'adapter localement (comme avec la r�allocation) pour permettre une r�duction d'erreur plus forte.
Participants : A. Roebel
Dans des travaux pr�c�dents men�s � l�Universit� de Navarre, I. Arroabarren avait analys� des voix chant�es en partiels en utilisant la fr�quence et l�amplitude instantan�es. De forts artefacts apparaissaient sur ces r�sultats. Au cours d�un stage nous avons cherch� � comprendre ces artefacts et � �tendre l�analyse � l�enveloppe spectrale [Arroabarren02a]. Le premier r�sultat est que la fr�quence instantan�e n�est pas une bonne repr�sentation lorsque les partiels sont fortement modul�s car sa valeur peut, localement, devenir extr�mement �loign�e de la valeur approximative du partiel, d�o� les artefacts observ�s. D�ailleurs ces artefacts apparaissent en particulier � cause de la r�verb�ration de la salle qui module les partiels. Sur des enregistrements an�choiques, ces artefacts disparaissent et les fr�quences et amplitudes instantan�es sont alors pratiquement identiques aux valeurs fournies par les analyses additive les plus pr�cises (programme additive et pbench), ce qui, de plus, valide r�ciproquement les deux types d�algorithmes (instantan� et additif).
Dans un deuxi�me temps, les trajets de partiels ainsi obtenus ont �t� utilis�s pour essayer d�obtenir une enveloppe spectrale tr�s pr�cise de voyelles chant�es. Ceci est fait en utilisant le balayage des formants par les partiels lors du vibrato. Divers mod�les ont permis de s�approcher de mieux en mieux d�une enveloppe spectrale tr�s pr�cise (en particulier valeurs de largeur de bande des formants aussi exactes que possible). De tr�s bons r�sultats ont �t� obtenus et compar�s � ceux d�autres m�thodes d�estimation de l�enveloppe spectrale, Cepstre Discret et Discrete All Pole Modelling en particulier. Ils montrent clairement que les m�thodes en question fournissent des valeurs fort �loign�es de celles que l�on peut supposer les bonnes au vu des r�sultats obtenus � partir du balayage. Ceci est tr�s important pour la voix chant�e [Rodet02b], en particulier pour obtenir une bonne forme d�onde glottale par filtrage inverse.
Participants : I. Arroabarren (stage), X. Rodet, A. Roebel
Collaborations ext�rieures : A. Carlosena (Universit� Publique de Navarre, Pampelune, Espagne)
Diverses classes d�instruments entretenus ont �t� mod�lis�es � l�Ircam. La classe des anches doubles est la derni�re en cours de mod�lisation. Ainsi la voie sera ouverte pour que les musiciens puissent disposer de mod�les de base de l�ensemble des instruments entretenus. Mais, pour bien utiliser ces mod�les physiques, il faut pouvoir les contr�ler. C�est pourquoi nous �tudions l�inversion des mod�les physiques, mod�les non-lin�aires qui posent de difficiles probl�mes. Dans ce domaine, la th�se de T. H�lie soutenue en 2002 repr�sente une avanc�e remarquable.
Les instruments � anche double, comme le hautbois, qui pr�sentent des difficult�s particuli�res pour la mod�lisation de leur fonctionnement physique sont �tudi�s dans le cadre d'une th�se conjointe de l'�quipe Analyse-Synth�se et de l'�quipe Acoustique des instruments. Dans la premi�re ann�e de th�se, un mod�le a �t� con�u en utilisant une hypoth�se th�orique, de pertes de charge dans l'anche, propos�e par A. Hirschberg. Ce mod�le math�matique a �t� appliqu� en 2002 � des r�sonateurs cylindriques et coniques id�aux pour mieux le comparer avec les r�sultats exp�rimentaux.
Pour le mod�le physique proprement dit, les principaux travaux sont :
- Impl�mentation d�un mod�le physique d�instrument � anche double, avec r�sonateur cylindrique et dynamique, en Matlab puis post�rieurement en C.
- Portage du code C dans l�environnement temps r�el jMax, ce qui permet d'�tudier plus facilement l�ensemble des param�tres.
- Adaptation de ce mod�le pour un r�sonateur conique id�al, avec pertes ind�pendantes de la fr�quence.
Une bouche artificielle permet de souffler dans l'instrument avec des param�tres bien contr�l�s et des valeurs bien connues.
Des exp�riences ont �t� faites sur l'utilisation d'une bouche artificielle pour des mesures de l�ouverture de l�anche � l�aide d�un stroboscope, une cam�ra et un algorithme de traitement et analyse d�images d�velopp� en Matlab par A. Almeida.
Les observations essentielles sont :
- Le mouvement des anches est sym�trique.
- L�aire de la section d�entr�e de l�anche est une fonction presque lin�aire de son ouverture. Ce r�sultat est important puisque les mod�les jusqu'� pr�sent consid�raient l'aire comme une fonction quadratique de l'ouverture de l'anche.
- Validation entre les mesures faites par vibrom�trie laser et celles faites sur les images.
- Les comparaisons entre les mesures exp�rimentales et les simulations sur la variation de l'ouverture de l'anche sont encourageantes. Elles semblent pr�dire des effets caract�ristiques des anches doubles tels que la transition soudaine entre anche ouverte et anche ferm�e et l'allure du mouvement de l'anche ouverte.
Par ailleurs, une collaboration est poursuivie avec le groupe de m�trologie du LIMSI – Orsay, dans le but de construire une anche en mat�riau synth�tique transparent pour effectuer des mesures de champ de vitesse dans l�anche double. Une premi�re version de l�anche transparente, a �t� construite, mais elle doit �tre am�lior�e pour pouvoir �tre utilis�e dans les mesures
Une nouvelle version de la bouche artificielle est en pr�paration, avec l�vres en latex, dans le but de r�aliser des mesures comparatives entre clarinette et hautbois et de mesurer la caract�ristique d�bit / pression.
Ces travaux ont �t� pr�sent�s dans deux publications [Almeida02a], [Almeida02b].
Participants : A. Almeida (th�se)
Collaborations internes : �quipe Acoustique instrumentale
Collaborations ext�rieures : C.Vergez (LMA), ? ? ? (LIMSI)
La mod�lisation physique a un grand int�r�t pour la synth�se sonore puisqu'elle permet non seulement de g�n�rer le son mais aussi le comportement de l'instrument (attaques, transitoires, fausses notes, etc...). Cependant, les instruments virtuels et r�els s'av�rent aussi difficiles � jouer. Cette difficult� de contr�le am�ne la question de l'inversion : � comment dois-je contr�ler mon mod�le pour obtenir ce son cible que ce musicien a obtenu avec son instrument ?� Ce travail doctoral vise � obtenir des mod�les math�matiques aussi simples et r�alistes que possibles, poss�dant des propri�t�s adapt�es � l'inversion, avec comme applications type les cuivres et la production de la voix. Le probl�me de l'excitateur (e.g. l�vres, glotte, anche, etc...) a �t� trait� pendant un DEA. Celui du r�sonateur (d�crire la propagation dans un tube � section variable et son rayonnement) est l'objet de cette th�se. En premi�re partie, nous �tablissons un mod�le 1D nouveau de propagation acoustique dans les tubes axisym�triques qui n'impose pas de g�om�trie fig�e aux fronts d'onde. Ce mod�le permet de consid�rer la mobilit� des parois (cas adapt� au conduit vocal), ou encore la pr�sence de pertes visco-thermiques. Pour ce dernier cas, un guide entier peut �tre construit en concat�nant des tron�ons de tubes � courbure quasi-constante, chaque �l�ment �tant repr�sentable par des fonctions de transfert calculables analytiquement. Nous approchons alors chaque �l�ment par des syst�mes diff�rentiels lin�aires d'ordre fini � retard, plus simples, en nous appuyant sur deux m�thodes : les s�ries divergentes tronqu�es et les repr�sentations diffusives d'op�rateurs pseudo-diff�rentiels. En deuxi�me partie, nous d�veloppons un mod�le nouveau de rayonnement acoustique tenant compte de la courbure du front d'onde sortant, utilisable comme condition � la fronti�re de l'instrument. Nous fournissons l� encore des approximations satisfaisantes repr�sent�es par des syst�mes lin�aires � retard. La th�se de T. H�lie a �t� soutenue � la fin de l�ann�e 2002 [Helie02a].
Participants : T. H�lie (th�se)
Collaborations ext�rieures : C.Vergez (LMA), D. Matignon (ENST)
L'objectif de ce stage est d'�laborer une mod�lisation du conduit vocal adapt�e � une �quation des ondes developp�e au sein de l'I.R.C.A.M [Gaullier02a]. Pour une paroi immobile rep�r�e par ses coordonn�es curvilignes, cette �quation prend la forme de l'�quation de Webster bien connue des acousticiens. Tout d'abord, un mod�le polynomial est utilis� pour d�crire le profil du conduit. Pour contr�ler l'articulation, nous d�veloppons un outil permettant d'apparier les param�tres de S.Maeda (position de la langue, etc.) et les coefficients polynomiaux, le mod�le de Maeda faisant r�f�rence. Une �tude num�rique de l'�quation de Webster est ensuite effectu�e en vue de sa simulation. Devant l'instabilit� des sch�mas classiques, une recherche de variable d'�tats mieux adapt�es � la discr�tisation est engag�e. Un syst�me �quivalent � l'�quation de Webster, constitu� de deux �quations de transport coupl�es est �tabli pour ces nouvelles variables. L'�tude de la stabilit� num�rique pour des sch�mas appliqu�s � ce syst�me a donn� satisfaction. La conservation d'une �nergie est prouv�e dans le cas de coefficients constants pour un C.F.L. �gal � 1. L'algorithme d�velopp� va � terme �tre utilis� sur des donn�es issues de l'Imagerie � R�sonance Magn�tique et pourra donner lieu � de la synth�se sonore.
Participants : G. Gaullier (stage), T. H�lie (th�se)
Collaborations ext�rieures : C.Vergez (LMA)
Le contr�le de la synth�se joue un r�le tout � fait essentiel dans le succ�s de la synth�se pour des applications musicales. Il appara�t donc n�cessaire d�offrir aux compositeurs des moyens de contr�le exploitant r�ellement la puissance des processeurs, des syst�mes (Bases de donn�es par exemple) et des logiciels d�aujourd�hui. C�est l�objectif qui est vis� dans la technique de s�lection d'unit�s sonores comme dans les m�thodes d�apprentissage. D�autre part, la puissance de la synth�se additive et le formalisme des fichiers SDIF permettent de novelles applications, telles que des sampleurs intellligents.
Les diff�rents aspects de ce travail sont l'estimation, la classification et la structuration de param�tres, et l'utilisation d'une base de donn�s h�t�rog�nes de sons et de caract�ristiques. Dans les syst�mes de "synth�se de la parole � partir du texte", une nouvelle technique, nomm�e "s�lection d'unit�s", conna�t un grand succ�s : en effet, les techniques pr�c�dentes, malgr� des dizaines d'ann�es de recherches intensives n'ont jamais permis d'obtenir une qualit� acceptable ; un accroissement de qualit� consid�rable a �t� obtenu au contraire par cette m�thode. Il est donc int�ressant de chercher comment la m�thode de "s�lection d'unit�s" peut �tre �galement appliqu�e � la synth�se sonore et musicale de haute qualit�. La m�thode utilise une large base de donn�es h�t�rog�nes de sons choisis (soit des notes s�par�es, soit des phrases compl�tes) et de caract�ristiques, class�s et segment�s suivant des param�tres estim�s sur le signal sonore. Le segment qui ressemble le mieux - au sens d'un crit�re donn� - au r�sultat d�sir�, est trouv� par des m�thodes efficaces de recherche et d'extraction utilis�es par l'algorithme de s�lection d'unit�s. Pour r�pondre aux exigences concernant les param�tres de synth�se n�cessaires, le segment sonore trouv� est transform� par des techniques temporelles ou fr�quentielles de re-synth�se telles que PSOLA, re-synth�se additive, vocodeur de phase et filtrage. Le segment sonore est encha�n� avec les segments trouv�s pour les autres parties du signal � construire, en appliquant des techniques d'interpolation pour former les transitions, et des transformations de niveaux plus �lev�s. L'ann�e 2002 a vu l'int�gration du calcul des descripteurs d�velopp�s pour les projets europ�ens ECRINS et CUIDADO, utilisant le standard de format de fichier SDIF, et la finalisation du calcul des caract�ristiques des unit�s.
Participants : D. Schwarz (th�se)
Collaboration interne : P. Tisserand, G. Peeters (�quipe Analyse-Synth�se)
Dans le contexte de la recherche sur l'estimation des param�tres de contr�le pour un mod�le physique de trompette [D'haes02d], la recherche pendant l'ann�e 2002 a port� sur les algorithmes de recherche des K plus proches voisins (KPPV) et sur les contraintes physiques de l'instrument.
Algorithme de KPPV, comparaison avec autres m�thodes et optimisation :
L'efficacit� des algorithmes de s�paration-�valuation (branch and bound) pour le calcul des KPPV a �t� �tudi�e. Les aspects les plus importants qui influencent cette efficacit� sont :
- M�thode de d�composition.
- M�thode d'�limination.
- M�thode de d�composition
- Ordre de parcours
- Niveau de d�composition.
Une d�rivation th�orique d'une m�thode de d�composition a �t� propos�e, fond�e sur l'analyse en composantes principales. Diff�rentes m�thodes d'�limination ont �t� combin�es ce qui aboutit � 10 algorithmes diff�rents. Comme l'efficacit� est fortement influenc�e par le niveau de d�composition, celui-ci est optimis� par un mod�le statistique qui exprime le co�t de calcul total en fonction du co�t de parcours d'un n�ud et du co�t de calcul d'une distance. Les algorithmes ont �t� compar�s pour leur efficacit� [D'haes02b] [D'haes02a].
Contraintes physiques :
Un probl�me observ� pendant l'estimation des param�tres est que les contraintes physiques de l'instrument n'�taient pas respect�es. Afin de r�soudre ce probl�me, un "mod�le de contr�le" pour l'instrument a �t� d�fini. A partir d'une d�rivation th�orique, des conditions ont �t� d�riv�es pour lesquelles la r�sonance du mod�le physique est maximale (r�sonance d'un mode). Ceci nous a permis d�identifier des relations approximatives entre les param�tres de contr�le et les caract�ristiques du son, et de d�finir des contraintes physiques [D'haes02c].
Participants : W. D�Haese (th�se)
Collaborations ext�rieures : D. van Dyck (Universit� d�Anvers)
En parall�le � la construction de l'orgue du Palais des Beaux-Arts de Bruxelles par G. Westenfelder et la soci�t� Syncordia, l'IRCAM a �t� charg� de concevoir le prototype d'un syst�me de synth�se sonore pouvant s'adjoindre � l'orgue (de facture classique).
Ce projet n�cessite des comp�tences en analyse-synth�se des sons et en diffusion dans l�espace. Il est donc men� en collaboration entre les �quipes Acoustique des salles et Analyse-Synth�se.
Suite au travail effectu� en 2001, une premi�re exp�rimentation du syst�me a �t� effectu�e en grandeur r�elle (dans l�Espace de Projection de l�Ircam) en janvier 2002.
En mars 2002 des contacts ont �t� pris au Conservatoire National de Musique de Paris. Avec l�autorisation du facteur d�orgue, un �chantillonnage partiel de l�orgue du CNSMDP a �t� effectu� en juillet 2002 avec l�assistance de M. Deschamps. Les analyses de ces �chantillons ont alors pu �tre lanc�es en ao�t pour produire les fichiers SDIF. Le principal r�sultat est un orgue virtuel sous forme d�un sampleur SDIF offrant de tr�s int�ressantes possibilit�s sonores et musicales.
La pr�sentation finale du projet s�est d�roul�e le 5 novembre 2002 dans l�Espace de Projection de l�Ircam. Deux rapports ont �t� r�dig�s [Rioux02b], [Rioux02c] ainsi qu�un article de conf�rence [Rioux02a].
Participants : V. Rioux, M. Deschamps, M. Poletti
Collaborations internes : �quipe Acoustique des salles
Les activit�s de d�veloppement ont repr�sent� une part relativement importante du travail de lՎquipe. En premier lieu, il s�agit du d�veloppement d�outils logiciels pour le Forum des utilisateurs, compositeurs et musiciens, tels que SuperVP, AudioSculpt et analyse-psola. Par ailleurs, certains d�veloppements ont �t� effectu�s pour r�pondre � des contrats ext�rieurs nous permettant de valoriser notre connaissance et notre savoir-faire. Enfin des outils internes comme des biblioth�ques ou XSpect sont les moyens de travail quotidiens indispensables aux avanc�es de lՎquipe.
Ce stage a eu pour but le portage en langage C++ de l'analyse PSOLA �crit par G. Peeters en Matlab dans le cadre de sa th�se. La librairie MatMTL (Cf. MatMTL ci-dessous) a grandement facilit� ce portage. De plus des am�liorations ont �t� apport�es avec notamment diff�rentes options propos�es � l'utilisateur ainsi que les fichiers de sortie �crits en SDIF.
Le programme analyse_psola en C++ tourne sous Linux. La documentation d�veloppeur est en ligne � l'adresse : http://iii/analyse_synthese/documentation/psola_analyse/index.html
Participants : E. Joseph (stage), G. Peeters
Collaborations internes : A. Roebel (�quipe Analyse-Synth�se)
Le projet VoxIntox a �t� demand� et financ� par MobiStation, une soci�t� de jeux t�l�phoniques. Pour le service VoxIntox MobiStation a demand� � l'IRCAM de leur proposer des algorithmes pour la transformation des voix en temps r�els. Plusieurs algorithmes ont �t� �tudi�s. L'impl�mentation de ces algorithmes a �t� con�ue sur la base de SuperVP. La cr�ation d'un biblioth�que dynamique qui pourrait �tre utilis�e dans AudioSculpt pour remplacer l'appel d'un application externe a �t� d�j� �tudi�e. Le projet VoxIntox a permis de financer la cr�ation de cette biblioth�que. Elle permet d'utiliser SuperVP avec tous les algorithmes accessibles en mode ligne commande, en rempla�ant seulement les modules E/S qui sont redirig�s vers une E/S m�moire. L'efficacit� en calcul de SuperVP a permis de g�rer 60 voix en parall�le sur un processeur � 1.8GHz, gr�ce au niveau tr�s bas (8kHz) du taux d'�chantillonnage utilis� pour la voix t�l�phonique. Avec un taux d'�chantillonnage pour un traitement de haute qualit�, il serait quand m�me possible de traiter 1 ou 2 voix en temps r�el. La qualit� et la vitesse obtenues ont �t� appr�ci�es favorablement par MobiStation. L'extension de la biblioth�que dite "transformer" (qui impl�mente actuellement deux algorithmes de transformation de voix) pourrait �tre effectu�e en 2003.
Participants : A. Roebel
Collaborations ext�rieure : Soci�t� MobiStation
Le d�veloppement de SuperVP s�est poursuivi en plus de la
biblioth�que "transformer". En premier lieu il est apparu que
beaucoup de fonctionnalit�s de AudioSculpt 1.2beta ne sont bien int�gr�es dans
le fonctionnement g�n�ral. Apr�s les changements � la base des modules de
calcul de SuperVP qui ont �t� n�cessaires pour une haute qualit� de traitement,
plusieurs fonctions ont �t� remises en service correctement : calcul du
cepstre discret, calcul de fr�quence fondamentale, module de mixage avec mixage
mul/cross/add, et module freeze. Concernant la fonction freeze la fonctionnalit� de la version originale �tait tr�s
limit�e, ne permettant de traiter qu�un seul point de freeze. De plus, le freeze n'�tait pas trait� comme un insert dans le son
original. Un nouveau module freeze a
donc �t� con�u qui permet de mettre plusieurs points de freeze dans le fichier et qui ins�re les segments freeze comme une dilatation. La diff�rence du freeze et de la dilatation reste dans le fait que le freeze permet de g�rer une statistique de la variation de
fr�quence pour chaque bin, ce qui
peut �tre utilis� pour �viter de cr�er des sinuso�des fixes donc g�nantes.
Concernant l'impl�mentation du crayon dans AudioSculpt, un mode d'utilisation
important consiste � amplifier fortement certaines r�gions avec le crayon et
supprimer d�autres lors de la normalisation. Dans la version ancienne
d'AudioSculpt, la superposition des filtres �tait g�r�e par AudioSculpt. Avec
la version AudioSculpt 2 qui permet de combiner les filtres plus librement, ce
n'est plus possible et donc la partie filtrage a d� �tre modifi�e pour
permettre de choisir le mode de superposition des filtres. Deux modes de
superposition ont �t� con�us, le mode multiplication pour l'op�ration de filtrage s�riel et le mode maximum qui sert pour le filtrage avec normalisation. La
vitesse du calcul a �t� am�lior�e par l'utilisation d'un nouvelle biblioth�que
pour le calcul de la transformation Fourier, libfft (voir le paragraphe
d�veloppement libfft).
Participants : A. Roebel
Collaborations ext�rieures : A. Lithaud (compositeur)
M. LoCascio a commenc� � travailler � l'IRCAM en juin 2002 sur le d�veloppement d�AudioSculpt-2. La structure et l'organisation de AudioSculpt ont �t� r�examin�s. L�ensemble du projet a �t� converti de CodeWarrior 7 � CodeWarrior 8, et de nombreux bogues ont �t� r�par�s dans l'interface graphique et dans le fonctionnement sous Macintosh OS X. Pour le Forum d'automne, plusieurs nouvelles possibilit�s ont �t� apport�es, am�liorations du "crayon", format binaire pour optimiser les grands fichiers de filtres en Super VP, etc. Apr�s le Forum, le sonagramme d�une s�lection a �t� r�alis� pour permettre le calcul de sonagramme des grands fichiers de son. En fin d�ann�e, le portage de Diphone pour Macintosh OS X a �t� commenc�.
Participants : M. LoCascio, A. Roebel
Collaborations ext�rieures : A. Lithaud (compositeur)
L'analyse du temps de calcul de SuperVP a montr� que la partie FFT est la partie la plus co�teuse. La FFT impl�ment�e dans la biblioth�que UDI utilise un module FFT d�velopp� par R. Mayer. La comparaison affich�e sur plusieurs sites Internet montre que l'impl�mentation de R. Mayer n�est plus la meilleure. Par cons�quent, une nouvelle biblioth�que, libfft, a �t� con�ue en partant du code libre de la FFT split radix de T. Ooura (http://momonga.t.u-tokyo.ac.jp/~ooura/fft.html). Le code a �t� fortement modifi� ; d'une part, il a �t� limit� au type double, d'autre part les fonctions FFT et IFFT ont �t� en �chang�es. La nouvelle biblioth�que a �t� con�ue comme biblioth�que g�n�rique avec une interface d�finie pour les compilations en C. La biblioth�que FFT a �t� compl�t�e avec une fonction pour g�n�rer les fen�tres d�analyse et aussi les fen�tres utilis�es pour la r�allocation d'�nergie dans les spectrogrammes.
Participants : A. Roebel
Avec notre biblioth�que SDIF, la programmation se faisait �
tr�s bas niveau. Toutes les op�rations (correction de la taille de la trame,
alignement des donn�es) �taient � faire � la main. Le projet Easdif a donc �t� pens� pour cr�er une biblioth�que C++ qui
permet de g�n�rer et lire les fichiers SDIF avec un niveau beaucoup plus �lev�
et sans r�duire les possibilit�s d'exprimer toutes les fonctionnalit�s de SDIF
(cr�ation des types adapt�s, NVT, etc.). Nous avons donc d�fini une API de haut
niveau qui permet d�exprimer toutes les fonctionnalit�s SDIF en cachant les
d�tails de stockage des donn�es et de la transformation des types. La gestion
des erreurs a �t� con�ue en utilisant les exceptions. L'API a �t� impl�ment�e
et la fonctionnalit� a �t� v�rifi�e par F. Tisserand. Pour une raison technique
de fonctionnement des exceptions, la biblioth�que Easdif doit contenir toutes les fonctions SDIF. La
biblioth�que est maintenant en test avec une premi�re application,
l�impl�mentation de l'analyse PSOLA en C++. Pour l'avenir, il reste �
impl�menter le m�canisme de configuration et installation avant de publier la
biblioth�que en t�l�chargement libre.
Participants : F. Tisserand (stage) A. Roebel, P.
Tisserand, D. Schwarz
Pour faciliter le portage des fonctions Matlab en C/C++, une biblioth�que a �t� con�ue qui permet de transformer les fonctions avec relativement peu de changement de la syntaxe et en m�me temps permets de diminuer le temps de calcul. Une �tude des biblioth�ques existantes a montr� que les biblioth�ques en programmation g�n�rique sont particuli�rement bien adapt�es pour cette t�che. Parmi les biblioth�ques existantes, la biblioth�que Blitz est sp�cialement int�ressante car elle utilise la programmation g�n�rique pour optimiser les expressions matricielles. Cette technique, baptis�e expressions g�n�riques, permet une syntaxe de tr�s haut niveau et en m�me temps laisse le compilateur organiser le code beaucoup plus proche de l�optimum que toutes les autres biblioth�ques connues. Malheureusement la syntaxe de Blitz n'est pas tr�s proche de la syntaxe Matlab et le projet MatMTL a donc eu comme but d�impl�menter une biblioth�que de programmation g�n�rique avec une syntaxe la plus proche possible de la syntaxe Matlab pour faciliter le portage des fonctions existantes. La biblioth�que MatMTL r�sultant de ces travaux de d�veloppement conna�t la plupart des constructions utilis�es pour la programmation matricielle et en m�me temps arrive � diminuer le temps de calcul en moyenne d'un facteur 10. MatMTL a �t� utilis�e pendant l'ann�e dans l'�quipe pour plusieurs projets, notamment pour r�duire le temps de calcul de fonctions Matlab existantes (projets estimation de F0, additive pbench, s�paration des sources, alignement partition).
Participants : A. Roebel
Les travaux sur le logiciel XSpect ont �t� centr�s sur l�utilisation des diff�rents modes d'analyse spectrale (LPC et CED) qui sont possibles dans SuperVP. Ces deux modes d'analyse spectrale ont �t� mis dans XSpect. Par ailleurs, nous avons int�gr� la lecture des fichiers .wav comprim�, et fix� plusieurs bogues concernant l'utilisation des biblioth�ques X11/Motif et l'utilisation des marques.
Participants : A. Roebel
Articles parus dans une revue � comit� de lecture
[Herrera03a] Herrera, P., Peeters, G., Dubnov, S., � Automatic Classification of Musical Sounds �, Journal of New Musical Research, 2003
[Peeters02a] Peeters, G., � Pourquoi Gerard Depardieu parle anglais sans accent �, La Recherche, Novembre 2002, n� 358, pp. 98-99
[Wright02a] Wright, M., Beauchamp, J., Fitz, K., Rodet, X., Roebel, A., Serra, X., Wakefield, G., � Analysis/Synthesis Comparison �, Organised Sound, 2002, vol. 5, n� 3, pp. 173-189
Actes de congr�s ou de colloque avec comit� de lecture
[Almeida02a] Almeida, A., Vergez, C., Causs�, R., Rodet, X., � Etude des �coulements dans les instruments � vent � anche double, pour application � la Synth�se par Mod�le Physique. �, CFA, Congr�s Fran�ais d'Acoustique, Lille, France, 2002
[Dhaes02a] D'haes, W., van Dyck, D., Rodet, X., � An efficient branch and bound seach algorithm for computing K nearest neighbors in a multidimensional vector space �, Signal Processing, Pattern Recognition and Applications (SPPRA), Crete, 2002
[Dhaes02b] D'haes, W., van Dyck, D., Rodet, X., � An efficient branch and bound seach algorithm for computing K nearest neighbors in a multidimensional vector space �, IEEE Advanced Concepts for Intelligent Vision Systems (ACIVS), Gent, 2002
[Dhaes02c] D'haes, W., van Dyck, D., Rodet, X., � Physical Constraints for the Control of a Physical Model of a Trumpet : wim D'haes, Dirk van Dyck and Xavier Rodet �, International Conference on Digital Audio Effects (DAFx), Hamburg, 2002
[Dhaes02d] D'haes, W., van Dyck, D., Rodet, X., � Control Parameter Estimation for a Physical Model of a Trumpet Using Pattern Recognition : wim D'haes, Dirk van Dyck and Xavier Rodet �, IEEE Workshop on Model Based Processing and Coding of Audio (MPCA), Leuven, 2002
[Peeters02b] Peeters, G., Rodet, X., � Automatically selecting signal descriptors for Sound Classification �, ICMC, Goteborg, 2002
[Peeters02c] Peeters, G., La Burthe, A., Rodet, X., � Toward Automatic Music Audio Summary Generation from Signal Analysis �, ISMIR, Paris, 2002
[Rioux02a] Rioux, V., Poletti, M., � An experimental SDIF-sampler in Max/MSP �, International Computer Music Conference, G�teborg, 2002
[Roebel02a] Roebel, A., � Estimating partial
frequency and frequency slope using reassignment operators �, International
Computer Music Conference, G�teborg, 2002,
pp. 122-125
Actes de congr�s ou de colloque sans comit� de lecture
[Almeida02b] Almeida, A., Vergez, C., Causs�, R., Rodet, X., � Physical study of double-reed instruments for application to sound-synthesis �, International Symposium in Musical Acoustics, Mexico, 2002
Travaux universitaires (th�ses, m�moires) et rapports de
stage
[Arroabarren02a] Arroabarren, I., � On the instantaneous amplitude and instantaneous frequency of vibrato signals in singing voice �, Universit� publique de Navarre, 2002
[Fagnan02a] Fagnan, L., � LES PRINCIPES CENTRAUX DE LA METHODE BEL CANTO ET LEURS EFFETS ACOUSTIQUES PORTES SUR LE CHANT CHORAL �, Universit� de l'Alberta, Edmonton, 2002
[Gaullier02a] Gaullier, G., � Mod�lisation du conduit vocal : mod�le g�om�trique et �tude num�rique de l'acoustique �, Universit� Pierre et Marie Curie, 2002
[Helie02a] H�lie, T., � Mod�lisation physique d'instruments de musique en syst�mes dynamiques et inversion �, Universit� de Paris XI - Orsay, 2002
[LaBurthe02a] La Burthe, A., � R�sum� sonore �, Universit� Joseph Fourier - INPG Grenoble, 2002. [DEA ATIAM]
[Pruham02a] Pruham, B., � Estimation de la
fr�quence fondamentale d'un signal �, Universit� de Besan�on, 2002
Rapports de recherche ou de fin de contrat
[Rioux02b] Rioux, V., � Projet Orgue, Palais des Beaux-Arts (II) : second rapport interm�diaire �, 2002
[Rioux02c] Rioux, V., � Projet Orgue, Palais des Beaux-Arts (III) : rapport final de synth�se �, 2002
[Tisserand02a] Tisserand, P., Rodet, X., � ECRINS: Rapport sur la clasification �, 2002
[Tisserand02b] Tisserand, P., Rodet, X., � ECRINS: Rapport sur l'�volution dynamique �, 2002
[Tisserand02c] Tisserand, P., Rodet, X., � ECRINS: Etude sur les outils de mise en forme �, 2002
Conf�rences invit�es
[Rodet02a] Rodet, X., � Synthesis and Processing of the Singing Voice �, 1st IEEE Benelux Workshop on Model based Processing and Coding of Audio (MPCA-2002), Leuven, 2002
[Rodet02b] Rodet, X., � Present state and future challenges of synthesis and processing of the singing voice �, AES, Helsinky, 2002
Emissions radiophoniques et t�l�vis�es, entretiens journalistiques, animations
Entretiens sur Vox Intox par X. Rodetpour le mensuel Phosphore, Nov 02