Contactez-nous
Traitement automatique de textes : techniques linguistiques
H7258 v1 Archive

Traitement automatique de textes : techniques linguistiques

Auteur(s) : Cécile FABRE

Date de publication : 10 févr. 2001

Logo Techniques de l'Ingenieur Cet article est réservé aux abonnés
Pour explorer cet article plus en profondeur Consulter l'extrait gratuit

Déjà abonné ?

1 - Présentation

  • 1.1 - Besoins en traitement automatique des langues
  • 1.2 - Difficultés du traitement linguistique
  • 1.3 - Des données textuelles formatées mais bruitées

2 - Principales applications

3 - Techniques

4 - Ressources

  • 4.1 - Ressources textuelles : les corpus
  • 4.2 - Ressources lexicales
  • 4.3 - Ressources logicielles

5 - Conclusion

Sommaire

Présentation

Auteur(s)

  • Cécile FABRE : Maître de conférences, université de Toulouse-Le Mirail, équipe de recherche en Syntaxe et Sémantique (UMR 5610)

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

INTRODUCTION

De plus en plus nombreux et de plus en plus facilement accessibles, les documents sous forme électronique constituent une ressource d’informations majeure et suscitent le développement d’applications nouvelles. À l’origine, le traitement automatique des langues (TAL) se fixait pour objectifs la compréhension du langage naturel et la traduction automatique, et visait un dialogue optimal entre l’homme et la machine. Aujourd’hui, l’apparition de nouveaux besoins en traitement de la langue a simultanément augmenté les perspectives applicatives de cette discipline et réduit dans l’immédiat ses ambitions. L’exploitation des textes tout-venant, qu’il s’agisse par exemple des documents produits dans les entreprises ou de l’ensemble des textes transitant sur Internet, est devenue un enjeu majeur de ce domaine. Aux objectifs traditionnels du TAL – traduction et génération automatique de textes, interrogation de bases de données en langage naturel – s’ajoutent ainsi de nouvelles applications qui alimentent le champ plus vaste de l’ingénierie linguistique. Elles sont liées en particulier à la profusion des documents électroniques transitant sur les réseaux : l’usager a besoin de l’aide de l’ordinateur pour les sélectionner, les classer, y repérer l’information qui l’intéresse, les synthétiser, les structurer, etc. Des techniques de traitement des données textuelles ont ainsi fait leur apparition. Elles s’imposent peu à peu comme des composantes spécifiques dans un certain nombre de logiciels commerciaux et prennent place dans notre environnement de travail professionnel sous forme de traducteurs, correcteurs orthographiques et grammaticaux, moteurs de recherche, outils de veille scientifique et d’aide à la décision. L’information stratégique est de nature essentiellement textuelle. Cet article fait le point sur les techniques linguistiques mises en œuvre pour faciliter l’accès à cette information.

Dans ce contexte qui voit l’explosion des échanges de données écrites sous forme électronique, l’accent est mis sur le traitement de l’écrit.

Nota :

D’autres aspects de ce domaine, comme la reconnaissance et la synthèse de la parole ou la consultation de bases de données non textuelles, ne seront pas décrits ici mais font l’objet de développements dans d’autres articles de ce traité (Reconnaissance de la parole et dialogue oral homme-machine [H 3 728], Systèmes à base de connaissance [H 3 740], Synthèse de la parole à partir du texte [H 1 960], Bases de données géographiques .

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 94 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


VERSIONS

Il existe d'autres versions de cet article :

DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v1-h7258

Lecture en cours
Présentation

Article inclus dans l'offre

"Documents numériques Gestion de contenu"

(68 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 94 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


Article inclus dans l'offre

"Documents numériques Gestion de contenu"

(68 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

Sommaire
Sommaire
Logo Techniques de l'Ingenieur

Cet article est réservé aux abonnés.
Il vous reste 94 % à découvrir.

Pour explorer cet article Consulter l'extrait gratuit

Déjà abonné ?


Article inclus dans l'offre

"Documents numériques Gestion de contenu"

(68 articles)

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques.

Des contenus enrichis

Quiz, médias, tableaux, formules, vidéos, etc.

Des modules pratiques

Opérationnels et didactiques, pour garantir l'acquisition des compétences transverses.

Des avantages inclus

Un ensemble de services exclusifs en complément des ressources.

Voir l'offre

Ressources documentaires

Génération automatique de résumés

Souvent, les humains doivent lire des documents dont les contenus sont complexes et longs à assimiler. ...

Reconnaissance en-ligne d'écriture manuscrite

Dans cet article, est exposé un panorama de la recherche sur la reconnaissance de l'écriture manuscrite, ...

Visualisation d'information

Les traces de l'activité du monde socio-économique sont l'objet d'analyse de toutes sortes pour mesurer ...