Présentation
EnglishRÉSUMÉ
Souvent, les humains doivent lire des documents dont les contenus sont complexes et longs à assimiler. L’objectif d’un résumé est de réduire la quantité d’effort nécessaire à l’acquisition des connaissances contenues dans un document. Un résumé peut être défini comme une représentation condensée, intelligible par un humain et non critique du contenu d’un autre document. La génération automatique de résumé (GAR) est utilisée pour répondre à ce besoin, et également plus largement pour synthétiser plusieurs textes. Elle s’applique également à des documents dans d’autres formats que le texte : les images, les sons et les vidéos.
Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.
Lire l’articleAuteur(s)
-
Jean-Yves DELORT : Maître de conférences à l’université de Montpellier-2 , laboratoire d’informatique, de robotique et de microélectronique de Montpellier (LIRMM)
INTRODUCTION
Pour satisfaire leurs besoins en information ou acquérir des connaissances, les humains doivent souvent lire des documents dont les contenus sont complexes et longs à assimiler. L’objectif d’un résumé est de réduire la quantité d’effort nécessaire à l’acquisition des connaissances contenues dans un document. Un résumé peut être défini comme une représentation condensée, intelligible par un humain et non critique du contenu d’un autre document :
-
représentation condensée : un résumé permet de se faire rapidement une idée du contenu du document initial ;
-
intelligible par un humain : un résumé permet de diminuer les efforts nécessaires à un humain pour acquérir les connaissances contenues dans un document. L’humain est l’utilisateur direct d’un résumé. De ce fait, un résumé diffère d’une indexation ou d’une représentation servant à l’extraction ou au raisonnement à partir de connaissances ;
-
non critique : un résumé ne contient pas de commentaires ou de points de vue sur le document initial.
Nous démontrons ici l’intérêt de la génération automatique de résumé de documents avant d’analyser le problème et enfin de donner les principales solutions actuellement utilisées. Nous nous intéressons aux principales applications et aux concepts de la génération automatique de résumé (GAR). Après avoir expliqué le principe de la GAR, nous exposons les différents types d’améliorations qui peuvent être apportées. Les problématiques et les méthodes utilisées pour la GAR peuvent s’appliquer à la synthèse de plusieurs textes. Enfin, nous détaillons les problématiques et les méthodes de GAR de documents dans d’autres formats que le texte : les images, les sons et les vidéos.
DOI (Digital Object Identifier)
Cet article fait partie de l’offre
Documents numériques Gestion de contenu
(76 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Présentation
3. Processus
Nous avons vu qu’il existait des méthodes de GAR pour construire des résumés et des multirésumés de documents textuels, structurés et multimédias. Par ailleurs, ces méthodes peuvent concevoir des extraits ou des abstraits et elles peuvent construire des résumés génériques ou répondant à des besoins particuliers. Nous analysons ici les grandes lignes du processus de GAR qui leur sont communes.
3.1 Principales étapes
Le processus de production automatique de résumé peut être décomposé en quatre étapes visant à résoudre différents problèmes (figure 3).
HAUT DE PAGE
Initialement, le contenu de la ou des cibles est décomposé en petites unités d’informations appelées segments. Par exemple, il est courant que les textes soient segmentés en phrases. Nous verrons pourquoi une segmentation des textes en mots serait bien plus contraignante (§ 4). Une vidéo peut être segmentée en images ou bien en courtes sous-séquences. La segmentation d’une image peut conduire à extraire des segments de bas niveau (segments de droite, polygones…) ou de plus haut niveau (objets, personnes…).
HAUT DE PAGE
Une fois la segmentation réalisée, les segments les plus importants sont sélectionnés en fonction des besoins spécifiés par l’utilisateur. Dans le cas d’un texte, ces besoins peuvent être...
Cet article fait partie de l’offre
Documents numériques Gestion de contenu
(76 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Processus
BIBLIOGRAPHIE
-
(1) - * - Start, Natural Language Question Answering System. http://start.csail.mit.edu
-
(2) - ZHANG (Y.), ZINCIR-HEYWOOD (N.), MILIOS (E.) - World wide web site summarization - . Web Intelligence and Agent Systems, 2, no 1, 39-53 (2004).
-
(3) - RADEV (D.R.), OTTERBACHER (J.), WINKEL (A.), BLAIR-GOLDENSOHN (S.) - NewsInEssence: summarizing online news topics - . Communications of the ACM, 48 (10), 95-98 (2005).
-
(4) - BARD (S.) - Méthodes d’évaluation de la qualité de données géographiques généralisées - . Thèse de doctorat, université Paris-6 (2004).
-
(5) - PASSONNEAU (R.), KUKICH (K.), HATZIVASSILOGLOU (V.), LEFKOWITZ (L.), JING (H.) - Generating summaries of work flow diagrams - . Proceedings of the International Conference on Natural Language Processing and Industrial Applications, 204-210, New Brunswick, Canada (1996).
-
(6)...
Cet article fait partie de l’offre
Documents numériques Gestion de contenu
(76 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive