Présentation
En anglaisAuteur(s)
Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.
Lire l’articleINTRODUCTION
Suite aux travaux réalisés dans le domaine de l'anthropométrie, la biométrie est une technique moderne qui répond à une préoccupation ancienne de prouver l'identité d'une personne de manière indiscutable en utilisant ses caractéristiques physiques ou comportementales. Dans cet article, nous proposons d'étudier une nouvelle approche pour la reconnaissance automatique du locuteur (RAL). Notre méthode consiste à reconnaître une personne à partir d'un certain nombre de paramètres, extraits du signal vocal émis par la personne, et représentés originalement de manière qualitative contrairement aux paramétrisations de l'état de l'art.
DOI (Digital Object Identifier)
Cet article fait partie de l’offre
Documents numériques Gestion de contenu
(76 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Présentation
3. Représentation qualitative avec l'algèbre des intervalles d'Allen
L'algèbre des intervalles a été introduite par J.F. Allen dans , pour la représentation qualitative du temps. Il s'agit d'une algèbre basée sur 13 relations atomiques entre deux intervalles de temps présentés dans la figure 4 ; ces 13 relations sont : b (before), m (meets), o (overlaps), s (starts), d (during), f (finishes ), eq (equals) et leurs relations inverses bi, mi, oi, si, di, fi.
À partir de notre observation du niveau de voisement par sous-bande (figure 3 b), nous proposons d'appliquer la représentation temporelle de J.F. Allen à chacune des sous-bandes et à chaque région d'activité de voisement. On remarque qu'en faisant glisser l'intervalle de temps X, on obtient progressivement par rapport à l'intervalle Y les 13 relations d'Allen. Nous pouvons ainsi définir une distance qualitative d entre ces deux intervalles : d = 1 pour X b Y, d = 2 pour X m Y,..., d = 13 pour X fi Y. Cette distance permet un codage des relations de Allen par des entiers de 0 à 13. Dans le cas particulier où il n'y a pas de relation entre X et Y d = 0. En effet, lorsque le niveau de voisement, dans une même fenêtre de temps pour une ou deux sous-bandes, n'est pas suffisant, aucun intervalle au sens d'Allen n'est exhibé, d'où la possibilité d'avoir la relation 0.
Nous construisons d'abord la matrice des relations d'intervalles de temps (voir figure 5), puis nous seuillons cette matrice en mettant à 1 les T voisements les plus grands par sous-bande (les autres à 0) (la méthode de seuillage utilisée dans est moins générique). La binarisation est effectuée sur une fenêtre de binarisation locale (FBL) de 64 secondes (durée moyenne de parole d'un locuteur), décalée de 16 secondes.
Nota : les valeurs de FBL et de FVL ont été optimisées sur l'ensemble du développement...
Cet article fait partie de l’offre
Documents numériques Gestion de contenu
(76 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Représentation qualitative avec l'algèbre des intervalles d'Allen
BIBLIOGRAPHIE
-
(1) - ALLEN (J.F.) - An interval-based representation of temporal knowledge - In Proceedings of 7th IJCAI, IJCAI, p. 221-226 (1981).
-
(2) - ALLEN (J.F.) - Maintaining knowledge about temporal intervals - Communications of the ACM, 26(11), p. 832-843 (1983).
-
(3) - ALLEN (J.B.) - How do humans process and recognize speech ? - In IEEE Trans. On Speech and Signal Processing, volume 2, p. 567-576 (1994).
-
(4) - BERTHOMMIER (F.), GLOTIN (H.) - A new snr-feature mapping for robust multistream speech recognition - In Proc. Int. Congress on Phonetic Sciences (ICPhS), volume 1 of XIV, p. 711-715, Berkeley University Of California, Ed., San Francisco (1999).
-
(5) - GALLIANO (S.), GEOFFROIS (E.), MOSTEFA (D.), CHOUKRI (K.), BONASTRE (J.-F.), GRAVIER (G.) - The ester phase 2 : Evaluation campaign for the rich transcription of french broadcast news - European Conf. on Speech Communication and Technology, p. 1149-1152 (2005).
-
...
DANS NOS BASES DOCUMENTAIRES
ANNEXES
Base documentaire Sécurité des systèmes d'information
DORIZZI (B.) - LEROUX LES JARDINS (J.) - LAMADELAINE (P.) - GUERRIER (C.) - La biométrie, techniques et usages - [H 5 530] (2004).
HAUT DE PAGE
LSIS
DCNS
HAUT DE PAGECet article fait partie de l’offre
Documents numériques Gestion de contenu
(76 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive