Présentation
En anglaisRÉSUMÉ
Devant l'ampleur croissante de l'utilisation des statistiques et la diversité des moyens informatiques dont l'ingénieur dispose, il a semblé nécessaire de présenter dans cet article les fonctionnalités les plus utilisées en statistique au regard des principaux logiciels disponibles, ceux-ci étant soit sous licence soit libre. Statistique descriptive, tests, analyse de variance, régression ou encore analyse en composantes principales sont présentés sous forme d'exemples traités à l'aide des logiciels Excel, XLSTAT, SAS, JMP IN et R.
Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.
Lire l’articleABSTRACT
Given the growing scale of the use of statistics and the diversity of lT tools at the disposal of the
Engineer, it seemed necessary to present in this article the most used functionalities in statistics in
terms of key software features available, these being either ljcensed or free. Descriptive statistics,
tests, variance analysis, regression analysis or principal components analysis are presented as
examples processed using Excel and XLSTAT software, SAS, J'Pin and R.
Auteur(s)
-
Thérèse PHAN : Professeur agrégée - École Centrale Paris
INTRODUCTION
Les outils informatiques mis à la disposition des ingénieurs ont permis un essor considérable des études statistiques. Les tailles d'échantillons, le nombre de variables observées, la précision des observations ne sont plus un frein à l'utilisation des méthodes statistiques complexes. Des logiciels dédiés aux statistiques ont été développés durant les dernières décennies ; d'autres, à cible plus générale, ont été enrichis de fonctions statistiques. Le présent article vise à mettre en relief leurs fonctionnalités de base au travers d'exemples.
Tout utilisateur est confronté à une logique commerciale : pour les particuliers, le budget est souvent limitatif alors que, pour un cadre d'entreprise, les choix de l'entreprise / organisation sont souvent normatifs. Dans cet esprit, les logiciels utilisés pour illustrer les exemples pratiques ont été retenus en fonction de leur appartenance à l'une des différentes familles ressortissant de ce prisme, sans préjuger d'une quelconque prééminence par rapport aux autres membres de sa famille :
-
Excel : à disposition de toute suite MS-Office (sous Windows ou MacOS), il a ouvert la voie à différents compléments, tel XLSTAT, commercialisés séparément, qui proposent des bibliothèques de « macros » Excel, dédiées aux statistiques : ces compléments demeurent dépendants des stratégies de l'éditeur d'Excel ;
-
SAS : logiciel précurseur très complet, il fait référence auprès de nombreux statisticiens, même s'ils en utilisent d'autres ;
-
JMP IN : version « grand public » de SAS, il s'est placé en concurrence frontale avec des produits d'excellente facture conçus pour PC pendant que SAS régnait sur les grands systèmes (Statistica, StatLab, StatView, SPSS, Systat…) ;
-
la famille « Open source », représentée par le logiciel R, associée avec la gratuité d'utilisation des logiciels (licence GNU) et la collégialité de leur évolution ;
-
enfin, n'ont pas été pris en considération, pour le présent article, les développements « locaux », réalisés dans le cadre d'organisations ou de particuliers. Nous pouvons ainsi citer le logiciel gratuit de modélisation des résultats d’étalonnage M-CARE, mis au point par le Collège français de métrologie.
La présentation des fonctionnalités de ces différents logiciels se concentre sur :
-
les fonctions de base ;
-
les tests d’ajustement et de comparaison ;
-
l'analyse de variance à simple et à double entrée ;
-
l'analyse de régression ;
-
l’analyse en composantes principales.
VERSIONS
- Version archivée 1 de sept. 2006 par Thérèse PHAN
DOI (Digital Object Identifier)
CET ARTICLE SE TROUVE ÉGALEMENT DANS :
Accueil > Ressources documentaires > Génie industriel > Métier : responsable qualité > Méthodes de mesure > Logiciels de statistique - Exemples et applications > Familles de logiciels
Cet article fait partie de l’offre
Instrumentation et méthodes de mesure
(50 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Présentation
1. Familles de logiciels
1.1 Logiciels généraux : exemple Excel
À la différence des logiciels dédiés, les logiciels généraux, tel Excel, se présentent comme des « caisses à outils ». Leur avantage est bien souvent qu'ils sont déjà installés sur les machines et ne requièrent donc pas d'achat supplémentaire.
Certes, ils offrent quelques fonctions de base mais, ainsi que les exemples ci-après l'illustrent, un certain travail de préparation des données s'avère indispensable en préalable à la résolution de besoins un tant soit peu sophistiqués, tels des histogrammes ou fonctions de répartition.
Ces limites ont ouvert la voie à des bibliothèques de « macros » Excel tel XLSTAT dont nous verrons quelques fonctionnalités, commercialisées séparément, par différentes sociétés.
Enfin, il convient de rappeler que Excel ne dispose que de 65 536 lignes : soit l'échantillon ne dépasse pas ce nombre de valeurs, soit l'échantillon volumineux, en base de données, fournit un sous-échantillon réduit en dessous de cette limite, après requête filtrante.
Le logiciel Excel est édité par Microsoft et commercialisé soit séparément, soit intégré à des suites MS-Office ou MS-Office Pro.
Signalons une suite « Open Office » qui présente un large degré de compatibilité avec les formats et les fonctions de base de la suite Microsoft (mais peu de compatibilité dans les macros Excel), développée dans le contexte « Open Source » et téléchargeable gratuitement.
HAUT DE PAGE1.2 Logiciel de référence : SAS
Créé en 1976 aux États-Unis en partenariat avec la société IBM, ce logiciel est spécialisé en statistique et analyse de données. Développé dans un premier temps sur PC, une version pour Linux a été créée ; il est proposé à la location sous forme de modules séparés ; commercialisé en France depuis 1983, une version partiellement francisée a été conçue depuis. Sa prise en main demande un certain investissement mais une interface conviviale, le module « Insight », a été développée...
TEST DE VALIDATION ET CERTIFICATION CerT.I. :
Cet article vous permet de préparer une certification CerT.I.
Le test de validation des connaissances pour obtenir cette certification de Techniques de l’Ingénieur est disponible dans le module CerT.I.
de Techniques de l’Ingénieur ! Acheter le module
Cet article fait partie de l’offre
Instrumentation et méthodes de mesure
(50 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Familles de logiciels
BIBLIOGRAPHIE
-
(1) - PHAN (T.), ROWENCZYK (J.-P.) - « Statistique et Probabilités » - Éditions Dunod (exercices et Problèmes, sciences sup) (2007).
-
(2) - POIRIER (J.) - « Analyse de la variance et de la régression, Plans d'expérience » - Éditions Techniques de l'ingénieur vol R 260 (1993).
-
(3) - SAPORTA (G.) - « Probabilités, Analyse des données et Statistique » - Éditions Technip (1990).
-
(4) - VEYSSEYRE (R.) - « Statistique et Probabilités pour l'ingénieur » - Éditions Dunod (l'Usine Nouvelle) (2001).
-
(5) - * - « Aide mémoire statistique », Éditions CISIA-CERESTA (1995).
-
(6) - * - SAS...
ANNEXES
EXCEL : distributeurs Microsoft
SAS : SAS France, Domaine de Grégy, BP 5 – 77166 Grégy-sur-Yerres
JMP : voir SAS
R : logiciel « freeware » en distribution sur Internet
HAUT DE PAGE
SAS :
États-Unis
France
http://www.sas.com/offices/europe/france/
R :
The R Project for Statistical Computing
JMP :
États-Unis
HAUT DE PAGECet article fait partie de l’offre
Instrumentation et méthodes de mesure
(50 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
QUIZ ET TEST DE VALIDATION PRÉSENTS DANS CET ARTICLE
1/ Quiz d'entraînement
Entraînez vous autant que vous le voulez avec les quiz d'entraînement.
2/ Test de validation
Lorsque vous êtes prêt, vous passez le test de validation. Vous avez deux passages possibles dans un laps de temps de 30 jours.
Entre les deux essais, vous pouvez consulter l’article et réutiliser les quiz d'entraînement pour progresser. L’attestation vous est délivrée pour un score minimum de 70 %.
Cet article fait partie de l’offre
Instrumentation et méthodes de mesure
(50 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive