Le signal sonore à analyser, reproduire ou synthétiser consiste en un signal de pression acoustique enregistré à l'aide d'un ou plusieurs microphones et restitué par des haut-parleurs. La technologie actuelle dépend de plus en plus des techniques numériques d'enregistrement, d'archivage, de traitement, de diffusion et de synthèse. Les formats utilisés dans l'industrie audio-musicale consistent actuellement à échantillonner le signal analogique à 32kHz, 44.1kHz ou 48kHz et à quantifier le signal obtenu linéairement sur 16 bits. Cela revient à ne prendre en compte que des signaux audio dont la bande passante est limitée par la demi-fréquence d'échantillonage (théorème de Shannon), et dont la dynamique est contenue dans 92dB.
Il est difficile d'extraire des caractéristiques communes à tous les types de signaux audio et musicaux. En conséquence, les modèles de représentation des signaux sont forcément vagues et généraux. Des modèles plus précis et plus rapides sont disponibles dès lors que la classe des signaux à analyser ou à synthétiser est spécifiée plus précisément (sons de cloches, de parole, d'intruments à vents ...).