Conversion de Voix

Objectif de ce test subjectif

L'objectif de ce test subjectif est d'évaluer différentes méthodes utilisées pour convertir la voix d'un locuteur source vers la voix d'un locuteur cible. La langue utilisée dans le test est le français. Les méthodes utilisées ne transforment que le timbre d'une voix de manière à ce qu'elle ressemble à la voix d'un autre locuteur. Les caractéristiques prosodiques (hauteur, durées...) ne seront pas modifiées.

Dans cette évaluation, nous testerons la conversion de la voix d'un locuteur français vers la voix d'un locuteur français possédant un accent hispanique. 2 tests seront effectués, l'un portant sur la proximité de la voix convertie par rapport à la voix cible et l'autre test portant sur la qualité de la voix convertie.

Il vous faudra entre 5 et 10 minutes pour réaliser ce test.

Veuillez utiliser un casque audio si possible, les différences pouvant être assez fines.

En réalisant ce test, vous contribuez à la recherche sur la conversion de voix menée dans l'équipe Analyse Synthèse de l'IRCAM

Par avance, merci !!!

Pierre


Nous souhaitons évaluer la conversion d' une voix A vers une autre voix B possédant un accent hispanique.

Ici vous pouvez écouter des exemples de phrases prononcées par les deux locuteurs

  • la source : Voix A :
A

  • La cible : Voix B :
B

Veuillez bien les écouter de manière à vous familiariser avec leurs caractéristiques timbrales.

A présent, pour chacun des fichiers audio suivant, indiquez si vous percevez la voix comme étant proche de la voix A ou de la voix B

A Perçu comme étant la voix A
<- Perçu comme étant proche de la voix A
0 Perçu comme étant entre les voix A et B
-> Perçu comme étant proche de la voix B
B Perçu comme étant la voix B
File A <- 0 -> B

A présent, nous vous vous demandons de comparer des paires de fichiers audio suivants et de décider lequel des deux fichiers est perçu comme étant le plus naturel au niveau de sa qualité et présentant le moins de dégradation.

1. Pour chaque ligne du tableau, écoutez attentivement File 1 et File 2. Les deux sons correspondent à la même conversion source-cible mais utilisant 2 méthodes que nous souhaitons comparer.

2. Puis, donnez un score de préférence en vous aidant du tableau suivant:

Beaucoup mieux +3
Meilleur +2
Un peu meilleur +1
Même qualité 0
  • vers la gauche si vous préférez le son File 1
  • vers la droite si vous préférez le son File 2.
File 1 +3 +2 +1 0 +1 +2 +3 File 2

Quelques dernière questions :

  • Etes vous familier avec le traitement de la parole ou avec la conversion de voix ?
                                                                 Oui | Non
  • Avez vous utilisé un casque audio ? Oui | Non
  • Votre langue ? français (langue maternelle) | français (niveau moyen) | autre

Commentaires

S'il vous plaît, veuillez vérifier que vous avez bien répondu à toutes les questions puis pressez le bouton suivant

All recordings are Ircam's property.

Thanks to Gilles Degottex for the php script.