WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Préservation de l'enveloppe temporelle pour la compression du signal de parole

( Télécharger le fichier original )
par Stéphane GALLEGO
Université Lyon I -  1998
  

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

COMPRESSION ET EXPANSION PAR L'ENVELOPPE

OBJECTIF

L'expérience précédente a montré l'importance de l'enveloppe sur l'intelligibilité et a soulevé le problème de distorsion de l'enveloppe lors de la compression du signal dans les aides auditives actuelles (cf figure 30).

Nous avons ensuite voulu estimer les performances d'un nouveau type de compression ou d'extension du signal de la parole. Des tests d'intelligibilité dans le bruit ont été choisis pour évaluer la qualité de la compression. La technique utilisée pour compresser ou étendre le signal se base sur la modification de l'enveloppe temporelle en préservant sa forme et la structure fine du signal. L'avantage de ce type de technique est d'éliminer tout effet indésirable de distorsion lorsque le signal n'est pas stationnaire.

Lorsqu'un sujet à un recrutement important, il est intéressant d'utiliser cette technique de compression car elle préserve la structure fine et la forme de l'enveloppe du signal. Moore, 1992 montre que pour simuler une surdité avec une audition normale (surdité de perception) l'enveloppe du signal doit être comprimée par sa racine carrée (compression de 1/2).

MATERIEL ET METHODE

TRAITEMENT DU SIGNAL

L'objectif du traitement du signal est de préserver le spectre instantanée et la forme de l'enveloppe temporelle du signal lors d'une compression. Il est donc nécessaire d'extraire séparément l'enveloppe et la structure fine du signal, puis de compresser uniquement l'enveloppe.

Redressement

Filtre passe bas
250 Hz

Puissance
(X-l)

Filtre passe bas
250 Hz

Signal de
Parole

Signal
Traité

Figure 31 : Schéma simplifié du traitement de signal effectué pour compresser
l'enveloppe du signal bruité. Si l'on veut compresser par 1/2 la puissance sera --1/2.

Pour pouvoir compresser l'enveloppe nous avons tout d'abord extrait l'enveloppe du signal (par redressement et filtrage passe bas à 250 Hz). Nous avons ensuite élevé l'enveloppe à une puissance X-1, X étant le facteur de compression. Puis nous avons refiltré l'enveloppe par un filtre passe bas de 250 Hz pour éliminer les fréquence induites par le passage à la puissance. Pour finir nous multiplions le signal d'origine par l'enveloppe traitée (on retrouve donc l'enveloppe à la puissance X-1 +1=X ; cf figure 31)

 

A4 A2 At

A v2 A v4

A"8

20 40 60 80

Intensité d'entrée (dB SL)

0

0

80

U)

o

, 40

-o

Figure 32 : fonction entrée sortie de la compression de l'enveloppe
pour des X=1/8, 1/4, 1/2, 1, 2 et 4.

Nous avons choisi les compressions suivantes, X=1/8, 1/4, 1/2, 1, 2 et 4. Les fonctions entré/sortie de la compression sont représentées figure 32. X=1, correspond au signal d'origine, X=2,4 correspond à une extension du signal, X=1/2, 1/4 et 1/8 correspond à une compression du signal.

La figure 33 nous donne un exemple des différents traitement obtenu sur les mots 'le bouchon' prononcé avec un rapport signal sur bruit (S/B) de 12dB (cf X=1). Comme le montre la figure 33 dans cet exemple, la compression du signal diminue le rapport signal sur bruit (pour X=1/2 S/B passe de +12 à +6dB, X=1/4 S/B passe de +12 à +3dB, X=1/2 S/B passe de +12 à +1.5dB). Par contre l'extension du signal augmente le rapport signal sur bruit (pour X=2 S/B passe de +12 à +24dB, X=4 S/B passe de +12 à +48dB). Les modification des rapport S/B devrait influencer l'intelligibilité.

Figure 33 : Exemple du traitement de signal pour le mots 'le bouchon' pour les différents X
pour un rapport signal sur bruit de +12 dB

X

-6

0

6

12

4

-1.5

0

1.5

3

2

-3

0

3

6

1

-6

0

6

12

1/2

-12

0

12

24

1/4

-24

0

24

48

1/8

-48

0

48

96

Tableau I: S/B après traitement en fonction de X et du S/B avant traitement.

Comme le montre le tableau I, le traitement effectue modifie grandement les S/B donc a priori, cela devrait se répercuter sur l'intelligibilité.

LISTE DE MOTS

Nous avons choisi les mêmes listes que dans l'expérience précédente. Afin de rendre le test plus difficile, pour chaque liste, on surajoute un bruit rose pour masquer en partie le spectre de la parole (cf figure 24). Différents rapports signal bruit sont testés (12, 6, 0 et --6 dB).

EXPERIMENTATION

Pour chaque sujet testé nous avons passé une liste par condition sur l'oreille droite. L'intensité de stimulation est à environ 30 dB SL

Pour chaque sujet six types de compressions avec quatre rapports signal sur bruit ont été choisies (soit 24 listes) :

- compression de 1/8, 1/4, 1/2, 1 et expansion de 2 et 4.

- rapport signal sur bruit de 12, 6, 0 et --6 dB

Pour chaque mot deux mesures d'intelligibilité sont effectués :

1- la reconnaissance du mot (0 ou 100%),

2- le pourcentage de phonèmes reconnus dans la liste de mot (de 0 à 100%).

SUJETS TESTES

Dans cette deuxième expérience seule la population de normo-entendant a été testée. L'objectif étant, dans un premier temps, de vérifier que la compression du signal n'engendre pas de détérioration sur l'intelligibilité en fonction du S/B.

20 sujets normo-entendants ayant une perte auditive sur l'oreille droite inférieure à 10 dB sur les fréquences 125, 250, 500, 1000, 2000, 4000 et 8000 Hz ont participé a cette étude. L'âge des sujets est en moyenne de 28 ans (déviation standart de 5 ans). La population est composée de 10 hommes et 10 femmes.

RESULTATS & DISCUSSION

le,

100

I »

0

-6 0 6 11

dopdodol idedoll/bne (de)

-6 0 4 12

Reopeel 166061/6.ull (0S)

-6 0 6 11

Reooen skreibte (011)

E 0

I

î 40

20

0

I

Id 100

0

-6 0 6 11 Roman signel/Oeu« (011)

Roma sionel/ausi (a)

Figure 34 : Intelligibilité des phonèmes pour différentes compressions à différents rapport
signal sur bruit du signal d'entré sur une population de 20 sujets.

L'exemple figure 33 nous montre que le fait de compresser un signal diminue le rapport signal sur bruit, ce qui est logique si l'on regarde aussi la figure 32. Inversement une extension du signal augmente le rapport signal sur bruit.

Malgré cela les résultats figures 34 et 35 ne montrent pas de différence statistique (par une anova à deux facteurs à mesure répété) de l'intelligibilité en fonction du facteur de compression (ou d'extension). Ce type de compression ne modifie apparemment pas l'intelligibilité dans le bruit pour différent S/B du signal entré.

Comme nous nous y attendions, le traitement du signal utilisé permet de préserver la forme de l'enveloppe ainsi que les structures fines du signal, ce qui se traduit par la stabilité de la compréhension de la parole dans le bruit.

-6 0 6 12

Rommel skpotetwe (OS)

-6 0 6 12

Rommel skpessus os)


·

"

so

4o
20

o

-6 0 6 12

· 4
·
·
·1 sksel/beu11 (OS)

z 100
g6°
60
40
20

1,7 100

160

1 40

I "

--100

6°

4

40

20

0

-6 0 6 12

Ro00so1 es
·olibee (M)

17 100

I

40
20

-5 0 6 12

Roct0o11 t15 oo/W
·1 (dl)

oo

100

4

· "

to

20

-5 0 6 12

1000011 sbeogeewl (te)

Figure 35 : Intelligibilité des mots pour différentes compressions à différents rapport signal
sur bruit du signal d'entré sur une population de 20 sujets.

CONCLUSION

Bien qu'artificiellement le rapport signal sur bruit se modifie lors d'une compression (figure 33, table I), l'intelligibilité reste néanmoins identique. L'utilisation de ce type de traitement semble être intéressant pour les aides auditives par rapport aux compressions utilisées actuellement.

Afin de valider ce type de compression, il semble intéressant de poursuivre ces investigations sur des sujets atteints d'une surdité cochléaire. Plusieurs sous-groupes, en fonction du niveau de surdité, doivent être étudiés (de la surdité moyenne à profonde).

Il semble aussi intéressant d'utiliser ce même traitement sur plusieurs canaux fréquentiels.

précédent sommaire suivant






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"Il faut répondre au mal par la rectitude, au bien par le bien."   Confucius