2.5 Caractérisation et segmentation des signaux audio
Thèse: S. Rossignol - Collaboration avec Supélec-Metz, Contrat CNET
Motivations
Fournir des éléments de caractérisation et de segmentation des signaux audio pour diverses application comme: traitement, synthèse, codage, constitution de messages multimedia, ...
Marques délimitant des segments temporels suivant certains critères (harmonique, bruit, vibrato, stable, transitoire, etc.)
Segmentation en notes ou en phones.
Segmentation en parties chantées, parties parlées et parties instrumentales.
Procédure
Extraction de caractéristiques du son
f0, et sa dérivée
énergie, et sa dérivée
inharmonicités des partiels
coefficient de voisement
flux spectral
...
Prise de décision sur chacune des caractéristiques (seuillage...)
Prise de décision finale, fonction de l'application visée
Exemple : pour la voix chantée, segmenter en notes est différent de segmenter en phones.