Conseil scientifique 97 2.5 Modeles Signaux Ameliorations

Équipe Analyse/Synthèse

2.5 Caractérisation et segmentation des signaux audio

Thèse: S. Rossignol - Collaboration avec Supélec-Metz, Contrat CNET

Motivations

Fournir des éléments de caractérisation et de segmentation des signaux audio pour diverses application comme: traitement, synthèse, codage, constitution de messages multimedia, ...

Marques délimitant des segments temporels suivant certains critères (harmonique, bruit, vibrato, stable, transitoire, etc.)
Segmentation en notes ou en phones.
Segmentation en parties chantées, parties parlées et parties instrumentales.

Procédure

Extraction de caractéristiques du son
- f0, et sa dérivée
- énergie, et sa dérivée
- inharmonicités des partiels
- coefficient de voisement
- flux spectral
- ...
Prise de décision sur chacune des caractéristiques (seuillage...)
Prise de décision finale, fonction de l'application visée

Exemple : pour la voix chantée, segmenter en notes est différent de segmenter en phones.

Page remise à jour le 2 Decembre 1997