1 - HISTORIQUE ET ÉTAT DE L'ART

3 - REPRÉSENTATION QUALITATIVE AVEC L'ALGÈBRE DES INTERVALLES D'ALLEN

5 - RÉSULTATS EXPÉRIMENTAUX

6 - CONCLUSION

Bibliographie & annexes

RECHERCHE ET INNOVATION | Réf : RE97 v1

Historique et état de l'art
Paramétrisation qualitative des caractéristiques temps-fréquence pour la reconnaissance du locuteur

Auteur(s) : Nidhal BEN ALOUI, Hervé GLOTIN, Patrick HEBRARD, Odile PAPINI

Date de publication : 10 févr. 2009 | Read in English

Pour explorer cet article
Télécharger l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !

Présentation

Auteur(s)

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

INTRODUCTION

Suite aux travaux réalisés dans le domaine de l'anthropométrie, la biométrie est une technique moderne qui répond à une préoccupation ancienne de prouver l'identité d'une personne de manière indiscutable en utilisant ses caractéristiques physiques ou comportementales. Dans cet article, nous proposons d'étudier une nouvelle approche pour la reconnaissance automatique du locuteur (RAL). Notre méthode consiste à reconnaître une personne à partir d'un certain nombre de paramètres, extraits du signal vocal émis par la personne, et représentés originalement de manière qualitative contrairement aux paramétrisations de l'état de l'art.

Cet article est réservé aux abonnés.
Il vous reste 93% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !

L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.

+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.

De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v1-re97

Cet article fait partie de l’offre

Documents numériques Gestion de contenu

(68 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Lecture en cours
Présentation

Page
suivante

Extraction

1. Historique et état de l'art

Nidhal BEN ALOUI : laboratoire des sciences de l'information et des systèmes (LSIS), CNRS (UMR 6168) ; DCNS, division systèmes d'information et de sécurité (SIS), département DPM/RMS/SSI (Le Mourillon).

Hervé GLOTIN et Odile PAPINI : laboratoire LSIS, CNRS (UMR 6168).

Patrick HEBRARD : DCNS, division SIS, département DPM/RMS/SSI (Le Mourillon).

LSIS :

http://www.lsis.org

DCNS :

http://www.dcnsgroup.com

Les modèles classiques de reconnaissance de la parole intègrent dans des modèles multigaussiens les paramètres acoustiques de dizaines de fenêtres de quelques millisecondes.

Cet article présente une nouvelle approche dans laquelle l'échelle de temps nécessaire pour modéliser l'identité d'un locuteur est plus longue que le segment phonétique étudié.

Sur la biométrie : La biométrie, techniques et usages de B. Dorizzi et coll.

Notre hypothèse de travail est que les phénomènes spectro-temporels de coarticulation de la parole sont propres à chaque locuteur et qu'ils pourraient être capturés par les contours des noyaux vocaliques. D'autre part, il a été établi que la perception phonétique est un processus par sous-bandes (notées SB) . Ceci a inspiré de nombreux algorithmes pour la reconnaissance robuste de la parole

Cet article est réservé aux abonnés.
Il vous reste 95% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !

L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.

+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.

De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

Cet article fait partie de l’offre

Documents numériques Gestion de contenu

(68 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Lecture en cours
Historique et état de l'art

Page
précédentePrésentation

Page
suivante

Extraction

BIBLIOGRAPHIE

(1) - ALLEN (J.F.) - An interval-based representation of temporal knowledge - In Proceedings of 7th IJCAI, IJCAI, p. 221-226 (1981).
(2) - ALLEN (J.F.) - Maintaining knowledge about temporal intervals - Communications of the ACM, 26(11), p. 832-843 (1983).
(3) - ALLEN (J.B.) - How do humans process and recognize speech ? - In IEEE Trans. On Speech and Signal Processing, volume 2, p. 567-576 (1994).
(4) - BERTHOMMIER (F.), GLOTIN (H.) - A new snr-feature mapping for robust multistream speech recognition - In Proc. Int. Congress on Phonetic Sciences (ICPhS), volume 1 of XIV, p. 711-715, Berkeley University Of California, Ed., San Francisco (1999).
(5) - GALLIANO (S.), GEOFFROIS (E.), MOSTEFA (D.), CHOUKRI (K.), BONASTRE (J.-F.), GRAVIER (G.) - The ester phase 2 : Evaluation campaign for the rich transcription of french broadcast news - European Conf. on Speech Communication and Technology, p. 1149-1152 (2005).