Memoire Online - Préservation de l'enveloppe temporelle pour la compression du signal de parole

L'expérience précédente a montré l'importance de l'enveloppe sur l'intelligibilité et a soulevé le problème de distorsion de l'enveloppe lors de la compression du signal dans les aides auditives actuelles (cf figure 30).

Nous avons ensuite voulu estimer les performances d'un nouveau type de compression ou d'extension du signal de la parole. Des tests d'intelligibilité dans le bruit ont été choisis pour évaluer la qualité de la compression. La technique utilisée pour compresser ou étendre le signal se base sur la modification de l'enveloppe temporelle en préservant sa forme et la structure fine du signal. L'avantage de ce type de technique est d'éliminer tout effet indésirable de distorsion lorsque le signal n'est pas stationnaire.

Lorsqu'un sujet à un recrutement important, il est intéressant d'utiliser cette technique de compression car elle préserve la structure fine et la forme de l'enveloppe du signal. Moore, 1992 montre que pour simuler une surdité avec une audition normale (surdité de perception) l'enveloppe du signal doit être comprimée par sa racine carrée (compression de 1/2).

L'objectif du traitement du signal est de préserver le spectre instantanée et la forme de l'enveloppe temporelle du signal lors d'une compression. Il est donc nécessaire d'extraire séparément l'enveloppe et la structure fine du signal, puis de compresser uniquement l'enveloppe.

Figure 31 : Schéma simplifié du traitement de signal effectué pour compresser
l'enveloppe du signal bruité. Si l'on veut compresser par 1/2 la puissance sera --1/2.

Pour pouvoir compresser l'enveloppe nous avons tout d'abord extrait l'enveloppe du signal (par redressement et filtrage passe bas à 250 Hz). Nous avons ensuite élevé l'enveloppe à une puissance X-1, X étant le facteur de compression. Puis nous avons refiltré l'enveloppe par un filtre passe bas de 250 Hz pour éliminer les fréquence induites par le passage à la puissance. Pour finir nous multiplions le signal d'origine par l'enveloppe traitée (on retrouve donc l'enveloppe à la puissance X-1 +1=X ; cf figure 31)

Figure 32 : fonction entrée sortie de la compression de l'enveloppe
pour des X=1/8, 1/4, 1/2, 1, 2 et 4.

Nous avons choisi les compressions suivantes, X=1/8, 1/4, 1/2, 1, 2 et 4. Les fonctions entré/sortie de la compression sont représentées figure 32. X=1, correspond au signal d'origine, X=2,4 correspond à une extension du signal, X=1/2, 1/4 et 1/8 correspond à une compression du signal.

La figure 33 nous donne un exemple des différents traitement obtenu sur les mots 'le bouchon' prononcé avec un rapport signal sur bruit (S/B) de 12dB (cf X=1). Comme le montre la figure 33 dans cet exemple, la compression du signal diminue le rapport signal sur bruit (pour X=1/2 S/B passe de +12 à +6dB, X=1/4 S/B passe de +12 à +3dB, X=1/2 S/B passe de +12 à +1.5dB). Par contre l'extension du signal augmente le rapport signal sur bruit (pour X=2 S/B passe de +12 à +24dB, X=4 S/B passe de +12 à +48dB). Les modification des rapport S/B devrait influencer l'intelligibilité.

Figure 33 : Exemple du traitement de signal pour le mots 'le bouchon' pour les différents X
pour un rapport signal sur bruit de +12 dB

X	-6	6	12
4	-1.5	1.5	3
2	-3	3	6
1	-6	6	12
1/2	-12	12	24
1/4	-24	24	48
1/8	-48	48	96

Comme le montre le tableau I, le traitement effectue modifie grandement les S/B donc a priori, cela devrait se répercuter sur l'intelligibilité.

Nous avons choisi les mêmes listes que dans l'expérience précédente. Afin de rendre le test plus difficile, pour chaque liste, on surajoute un bruit rose pour masquer en partie le spectre de la parole (cf figure 24). Différents rapports signal bruit sont testés (12, 6, 0 et --6 dB).

Pour chaque sujet testé nous avons passé une liste par condition sur l'oreille droite. L'intensité de stimulation est à environ 30 dB SL

Pour chaque sujet six types de compressions avec quatre rapports signal sur bruit ont été choisies (soit 24 listes) :

Dans cette deuxième expérience seule la population de normo-entendant a été testée. L'objectif étant, dans un premier temps, de vérifier que la compression du signal n'engendre pas de détérioration sur l'intelligibilité en fonction du S/B.

20 sujets normo-entendants ayant une perte auditive sur l'oreille droite inférieure à 10 dB sur les fréquences 125, 250, 500, 1000, 2000, 4000 et 8000 Hz ont participé a cette étude. L'âge des sujets est en moyenne de 28 ans (déviation standart de 5 ans). La population est composée de 10 hommes et 10 femmes.

Figure 34 : Intelligibilité des phonèmes pour différentes compressions à différents rapport
signal sur bruit du signal d'entré sur une population de 20 sujets.

L'exemple figure 33 nous montre que le fait de compresser un signal diminue le rapport signal sur bruit, ce qui est logique si l'on regarde aussi la figure 32. Inversement une extension du signal augmente le rapport signal sur bruit.

Malgré cela les résultats figures 34 et 35 ne montrent pas de différence statistique (par une anova à deux facteurs à mesure répété) de l'intelligibilité en fonction du facteur de compression (ou d'extension). Ce type de compression ne modifie apparemment pas l'intelligibilité dans le bruit pour différent S/B du signal entré.

Comme nous nous y attendions, le traitement du signal utilisé permet de préserver la forme de l'enveloppe ainsi que les structures fines du signal, ce qui se traduit par la stabilité de la compréhension de la parole dans le bruit.

Figure 35 : Intelligibilité des mots pour différentes compressions à différents rapport signal
sur bruit du signal d'entré sur une population de 20 sujets.

Bien qu'artificiellement le rapport signal sur bruit se modifie lors d'une compression (figure 33, table I), l'intelligibilité reste néanmoins identique. L'utilisation de ce type de traitement semble être intéressant pour les aides auditives par rapport aux compressions utilisées actuellement.

Afin de valider ce type de compression, il semble intéressant de poursuivre ces investigations sur des sujets atteints d'une surdité cochléaire. Plusieurs sous-groupes, en fonction du niveau de surdité, doivent être étudiés (de la surdité moyenne à profonde).

Il semble aussi intéressant d'utiliser ce même traitement sur plusieurs canaux fréquentiels.

Préservation de l'enveloppe temporelle pour la compression du signal de parole

COMPRESSION ET EXPANSION PAR L'ENVELOPPE