Présentation
En anglaisRÉSUMÉ
Comme l'environnement est en perpétuelle évolution, la majeure partie des données issues du monde réel est non stationnaire. Cette non-stationnarité modifie le comportement du système affectant la justesse de prédiction de son modèle. Par conséquent, les paramètres et la structure du modèle doivent être mis à jour afin de conserver la justesse de sa prédiction au cours du temps. Dans cet article, le problème d'apprentissage des modèles à partir des données non stationnaires est étudié et des méthodes et techniques adaptés à ce type d'apprentissage sont présentées et analysées.
Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.
Lire l’articleABSTRACT
A considerable body of research has been devoted to the design of classifiers whose operating environments are supposed to be static. However, everything that exists changes over time. Thus, classifiers need to adjust their parameters and structure in order to take into account the changes in their operating environments. This self-adaptation is necessary to preserve the classifier performance. In this paper, the problem of designing classifiers in changing environments will be studied and the methods to design this type of classifiers will be presented and analyzed.
Auteur(s)
-
Moamar SAYED MOUCHAWEH : Professeur de l'Institut Mines-Telecom, École des Mines de Douai, Département informatique et automatique
INTRODUCTION
La Reconnaissance des formes (RdF) regroupe l'ensemble des algorithmes et méthodes permettant la classification des formes dans des classes. Une forme est une observation simplifiée de l'état du système représentée par un ensemble de paramètres. Ces derniers forment l'espace de représentation qui caractérise le fonctionnement ou comportement du système. Chaque classe est associée à un état ou mode caractérisant le comportement ou les conditions de fonctionnement du système. La classification d'une forme est réalisée par un module de classification, appelé classifieur, en utilisant une règle ou fonction de décision. Le problème de la RdF est donc de caractériser le modèle et l'étiquette de chaque classe associée à une forme. Cela requiert le recours à des techniques de classification permettant de regrouper, par apprentissage, les formes similaires.
Les classes peuvent être statiques ou dynamiques. Les classes statiques sont basées sur des données stationnaires. Ce qui signifie que les paramètres et la structure du modèle de chaque classe demeurent inchangés au cours du temps. Toutefois, comme l'environnement est en perpétuelle évolution, la majeure partie des données issues du monde réel est non-stationnaire. La non-stationnarité est définie comme une évolution dans le temps des paramètres et de la structure du modèle ou classifieur due par exemple à l'usure ou au vieillissement de la machine ou encore aux changements temporels des caractéristiques de l'environnement du système. Cette non-stationnarité modifie le comportement statique ou dynamique du système affectant la performance (la justesse de prédiction) de son modèle ou classifieur. Les classes dans ce cas sont dynamiques. Les paramètres et la structure du modèle ou classifieur doivent être mis à jour afin de conserver sa performance au cours du temps.
Dans cet article, le problème d'apprentissage des modèles ou classifieurs dans un environnement non-stationnaire est étudié. Des méthodes et techniques adaptées pour l'apprentissage des classifieurs efficaces pour ce type d'environnement sont présentées et analysées. La prédiction de l'occurrence des défauts, le filtrage d'informations (documents, courriels), la classification des documents et la modélisation du profil des utilisateurs et le suivi de son évolution au cours du temps sont quelques uns des domaines d'application de ce type de méthodes.
MOTS-CLÉS
apprentissage automatique classification dynamique détection de dérives environnement non-stationnaire Informatique Automatique intelligence artificielle reconnaissance de formes
KEYWORDS
automatic learning | dynamic classification | drift detection | non-stationary environment | Information technology | engineerings | artificial intelligence | pattern recognition
DOI (Digital Object Identifier)
Cet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(238 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Présentation
2. Reconnaissance des formes dans un environnement non-stationnaire
Lorsque les données évoluent dans le temps, il est important que le classifieur soit capable de s'adapter en tenant compte de ces évolutions. Ces changements peuvent être dus soit à une variation normale des paramètres et/ou de la structure du système, soit à des dégradations affectant ses caractéristiques intrinsèques et son comportement. Ces systèmes, appelés évolutifs, dynamiques ou non-stationnaires, couvrent un large champ d'applications : électromécanique, chimique, thermique, médical, énergétique, etc. Ils manipulent des données non-stationnaires qui peuvent présenter trois difficultés majeures. La première difficulté réside dans l'énorme quantité de données, constamment générées par des applications diverses au cours du temps. Ces flux de données sont potentiellement infinis, et il est presque impossible de les stocker. Seul un bref résumé de ces données peut être extrait et stocké pour des futures utilisations. La deuxième difficulté est due à la grande vitesse d'arrivée de ces flux de données qui empêche leurs traitements en temps réel. Enfin, la troisième difficulté émerge lorsque la distribution qui génère ces données évolue au cours du temps ; c'est ce qu'on appelle la « dérive du concept ». Formellement, le terme « concept » fait référence à la distribution de la probabilité jointe P (X, w ), où X représente les attributs d'entrée et w représente les classes. Le « concept » peut donc être représenté par le contour ou la frontière de décision délimitant une classe dans l'espace de représentation. Un changement dans un « concept » peut être vu comme un changement de la forme du contour, de sa position ou de sa taille.
La dérive d'un concept peut être présentée par un changement réel ou virtuel dans cette distribution. Une dérive réelle affecte la probabilité a posteriori P (w = wi/X ) ce qui signifie que la classe obtenue pour les mêmes valeurs d'attributs peut changer ; nous notons wi ∈ {1, 2, ..., c } l'ensemble des classes c avec ....
Cet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(238 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Reconnaissance des formes dans un environnement non-stationnaire
BIBLIOGRAPHIE
-
(1) - ANGSTENBERGER (L.) - Dynamic fuzzy pattern recognition. - Dissertation, Fakultät für Wirtschaftswissenschaften der Rheinisch-Westfälischen Technischen Hochschule, Aachen, Germany (2000).
-
(2) - COLOMER (J.), MELENDEZ (J.), GAMERO (F.I.) - Pattern recognition based on episodes and DTW. Application to diagnosis of a level control system. - 16th International Workshop on Qualitative Reasoning QR02, p. 37-43, Sitges, Espagne (2002).
-
(3) - COVER (T.M.), HART (P.E.) - Nearest neighbor pattern classification. - IEEE Transaction Information Theory, vol. IT-13, p. 21-27 (1967).
-
(4) - DAMOULAS (T.), GIROLAM (M.A.) - Combining feature spaces for classification. - Pattern Recognition, vol. 42, p. 2671-2683 (2009).
-
(5) - DIMITRU (V.), LUBAN (F.) - On some optimisation problems under uncertainty. - Fuzzy Sets and Systems, vol. 18, p. 257-272 (1986).
-
(6)...
Cet article fait partie de l’offre
Technologies logicielles Architectures des systèmes
(238 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive