Génération automatique de résumés : Résumé de documents non textuels

1.1 - Recherche d’informations
1.2 - Veille
1.3 - Autres utilisations

Figure 2 - Interface Web de PDA

2 - CONCEPTS CLÉS

2.1 - Principales caractérisations
2.2 - Résumé automatique de documents non textuels

3 - PROCESSUS

3.1 - Principales étapes

Figure 3 - Étapes de GAR
3.2 - Améliorations de la GAR

4 - TECHNIQUES DE GÉNÉRATION DE RÉSUMÉ POUR LE TEXTE

4.1 - Génération d’extraits
4.2 - Limites du résumé par extraction
4.3 - Génération d’abstraits
4.4 - Conclusion

5 - GÉNÉRATION DE MULTIRÉSUMÉS TEXTUELS

5.1 - Multirésumé thématique
5.2 - Multirésumé temporel
5.3 - Méthodes incrémentales

6 - RÉSUMÉ DE DOCUMENTS NON TEXTUELS

6.1 - Documents sans temporalité
6.2 - Documents avec temporalité

Bibliographie & annexes

Présentation

RÉSUMÉ

Souvent, les humains doivent lire des documents dont les contenus sont complexes et longs à assimiler. L’objectif d’un résumé est de réduire la quantité d’effort nécessaire à l’acquisition des connaissances contenues dans un document. Un résumé peut être défini comme une représentation condensée, intelligible par un humain et non critique du contenu d’un autre document. La génération automatique de résumé (GAR) est utilisée pour répondre à ce besoin, et également plus largement pour synthétiser plusieurs textes. Elle s’applique également à des documents dans d’autres formats que le texte : les images, les sons et les vidéos.

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

Auteur(s)

Jean-Yves DELORT : Maître de conférences à l’université de Montpellier-2 , laboratoire d’informatique, de robotique et de microélectronique de Montpellier (LIRMM)

INTRODUCTION

Pour satisfaire leurs besoins en information ou acquérir des connaissances, les humains doivent souvent lire des documents dont les contenus sont complexes et longs à assimiler. L’objectif d’un résumé est de réduire la quantité d’effort nécessaire à l’acquisition des connaissances contenues dans un document. Un résumé peut être défini comme une représentation condensée, intelligible par un humain et non critique du contenu d’un autre document :

représentation condensée : un résumé permet de se faire rapidement une idée du contenu du document initial ;
intelligible par un humain : un résumé permet de diminuer les efforts nécessaires à un humain pour acquérir les connaissances contenues dans un document. L’humain est l’utilisateur direct d’un résumé. De ce fait, un résumé diffère d’une indexation ou d’une représentation servant à l’extraction ou au raisonnement à partir de connaissances ;
non critique : un résumé ne contient pas de commentaires ou de points de vue sur le document initial.

Nous démontrons ici l’intérêt de la génération automatique de résumé de documents avant d’analyser le problème et enfin de donner les principales solutions actuellement utilisées. Nous nous intéressons aux principales applications et aux concepts de la génération automatique de résumé (GAR). Après avoir expliqué le principe de la GAR, nous exposons les différents types d’améliorations qui peuvent être apportées. Les problématiques et les méthodes utilisées pour la GAR peuvent s’appliquer à la synthèse de plusieurs textes. Enfin, nous détaillons les problématiques et les méthodes de GAR de documents dans d’autres formats que le texte : les images, les sons et les vidéos.

Cet article est réservé aux abonnés.
Il vous reste 92% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !

L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.

+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.

De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v1-h7260

Cet article fait partie de l’offre

Documents numériques Gestion de contenu

(68 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Lecture en cours
Présentation

Page
suivante

Principales applications

6. Résumé de documents non textuels

Nous présentons ici les principales problématiques de la GAR de documents non textuels et nous expliquons quelques stratégies de résolution.

6.1 Documents sans temporalité

HAUT DE PAGE

6.1.1 Résumé d’images

Le résumé automatique d’image est un problème difficile car aucune des étapes (segmentation, sélection, transformation, assemblage) ne peut être réalisée simplement :

segmentation : l’objectif est ici d’identifier les objets tels qu’ils sont perçus par un humain. Le niveau de détail recherché par les humains dans une image est en général le même que dans la vie réelle. De ce fait, l’humain qui regarde une image ne perçoit que certains groupes de pixels représentant quelque chose de significatif, par exemple un visage, un animal, une voiture... Or, les meilleures techniques actuelles de reconnaissance de forme ne sont pas capables d’identifier avec exactitude les groupes de pixels significatifs pour un humain ;
sélection : pour sélectionner les objets importants, il est nécessaire de reconnaître leur type mais aussi leur sens dans l’image. Considérons deux images contenant le même type d’objet, par exemple une « personne ». La première est la photographie d’une foule de personnes, la seconde est la photographie d’une seule personne qui sourit. Les « personnes » n’ont pas le même sens dans ces images et il faut en tenir compte au moment de la sélection ;
transformation : pour pouvoir transformer les objets, on peut utiliser une homothétie. Pourtant, certains objets ne peuvent être réduits au-delà d’un certain degré sans perdre leur sens. Par exemple, si l’on réduit trop un visage, un observateur ne peut plus identifier la personne. Il faut donc connaître ou déterminer la taille minimale des objets ;
assemblage : il s’agit d’un problème classique d’optimisation sous contraintes. On cherche à trouver un groupe important d’objets qui puissent être réduits aux dimensions spécifiées par un utilisateur en tenant compte de la taille minimale de chacun.

Dans la pratique, les techniques de...

Cet article est réservé aux abonnés.
Il vous reste 95% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !

L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.

+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.

De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

Cet article fait partie de l’offre

Documents numériques Gestion de contenu

(68 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Lecture en cours
Résumé de documents non textuels

Page
précédenteGénération de multirésumés textuels

BIBLIOGRAPHIE

(1) - * - Start, Natural Language Question Answering System. http://start.csail.mit.edu
(2) - ZHANG (Y.), ZINCIR-HEYWOOD (N.), MILIOS (E.) - World wide web site summarization - . Web Intelligence and Agent Systems, 2, no 1, 39-53 (2004).
(3) - RADEV (D.R.), OTTERBACHER (J.), WINKEL (A.), BLAIR-GOLDENSOHN (S.) - NewsInEssence: summarizing online news topics - . Communications of the ACM, 48 (10), 95-98 (2005).
(4) - BARD (S.) - Méthodes d’évaluation de la qualité de données géographiques généralisées - . Thèse de doctorat, université Paris-6 (2004).
(5) - PASSONNEAU (R.), KUKICH (K.), HATZIVASSILOGLOU (V.), LEFKOWITZ (L.), JING (H.) - Generating summaries of work flow diagrams - . Proceedings of the International Conference on Natural Language Processing and Industrial Applications, 204-210, New Brunswick, Canada (1996).
(6)...

Cet article est réservé aux abonnés.
Il vous reste 95% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !

L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.

+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.

De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

Cet article fait partie de l’offre

Documents numériques Gestion de contenu

(68 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Résumé de documents non textuels Génération automatique de résumés

RÉSUMÉ

Auteur(s)

INTRODUCTION

Cet article est réservé aux abonnés.Il vous reste 92% à découvrir.

L'expertise technique et scientifique de référence

DOI (Digital Object Identifier)

6. Résumé de documents non textuels

Cet article est réservé aux abonnés.Il vous reste 95% à découvrir.

L'expertise technique et scientifique de référence

BIBLIOGRAPHIE

Cet article est réservé aux abonnés.Il vous reste 95% à découvrir.

L'expertise technique et scientifique de référence

Résumé de documents non textuels
Génération automatique de résumés

Cet article est réservé aux abonnés.
Il vous reste 92% à découvrir.

Cet article est réservé aux abonnés.
Il vous reste 95% à découvrir.

Cet article est réservé aux abonnés.
Il vous reste 95% à découvrir.