Présentation
Auteur(s)
-
Thérèse PHAN : Agrégée de Mathématiques - Professeur de Probabilités et Statistique à l’École Centrale de Paris
Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.
Lire l’articleINTRODUCTION
Les outils informatiques mis à la disposition des ingénieurs ont permis un essor considérable des études statistiques. Les tailles d’échantillons, le nombre de variables observées, la précision des observations ne sont plus un frein à l’utilisation des méthodes statistiques complexes. Des logiciels dédiés aux statistiques ont été développés durant les dernières décennies ; d’autres, à cible plus générale ont été enrichis de fonctions statistiques. Le présent dossier vise à mettre en relief leurs fonctionnalités de base au travers d’exemples.
Tout utilisateur est confronté à une logique commerciale : pour les particuliers, le budget est souvent limitatif, alors que pour un cadre d’entreprise, les choix de l’entreprise / organisation sont souvent normatifs. Dans cet esprit, les logiciels utilisés pour illustrer les exemples pratiques, ont été retenus en fonction de leur appartenance à l’une des différentes familles sans préjuger d’une quelconque prééminence par rapport aux autres membres de sa famille :
-
Excel, à disposition de toute suite MS-Office, sous Windows ou MacOS, a ouvert la voie à différents compléments, tel XlStat, commercialisés séparément, qui proposent des bibliothèques de « macros » Excel, dédiées aux statistiques : ces compléments demeurent dépendants des stratégies de l’éditeur d’excel ;
-
SAS, logiciel précurseur très complet, fait référence auprès de nombreux statisticiens, même s’ils en utilisent d’autres ;
-
JMP IN, version « grand public » de SAS, s’est placé en concurrence frontale avec des produits d’excellente qualité conçus pour PC pendant que SAS régnait sur les grands systèmes (Statistica, StatLab, StatView, SPSS, Systat, ...) ;
-
la famille « Open source », représentée par le logiciel R, est associée à la gratuité d’utilisation des logiciels (licence GNU) et à la collégialité de leur évolution ;
-
enfin, n’ont pas été pris en considération, pour le présent dossier, les développements « locaux », réalisés dans le cadre d’organisations ou de particuliers.
La présentation des fonctionnalités de ces différents logiciels se concentre sur :
-
les fonctions de base ;
-
l’analyse de variance à simple et double entrée ;
-
l’analyse de régression.
Pour la définition des termes statistiques, le lecteur se reportera dans ce traité au dossier « Observation statistique » Observation statistique.
VERSIONS
- Version courante de sept. 2014 par Thérèse PHAN
DOI (Digital Object Identifier)
Cet article fait partie de l’offre
Instrumentation et méthodes de mesure
(50 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Présentation
2. Statistique descriptive
Les exemples développés dans le présent paragraphe s’appuient sur l’échantillon de mesures du tableau 1.
2.1 Statistique descriptive avec Excel
Le présent paragraphe fournit des exemples des fonctions préprogrammées d’Excel, et illustre le travail de préparation des données nécessaire à l’emploi de ses fonctions graphiques.
En effet, les fonctions graphiques d’Excel ne sont que des fonctions de dessin : ainsi, elles permettent de reproduire graphiquement un tableau de données en lui conférant l’apparence d’un histogramme ou d’une courbe (d’autres formes sont disponibles), mais ne présente aucune « intelligence » dans le traitement des données.
pour un histogramme, Excel va dessiner un « bâton » pour chaque mesure, dans l’ordre de lecture, sans aucune notion ni d’intervalle ni de cumul. Il appartient donc à l’utilisateur de préparer ses données avant de les « dessiner » avec Excel.
Excel s’accommode des quelques formats les plus généraux de données : .XLS, .CSV, .DBF, .TXT ainsi que des formats concurrents (Lotus, Quattro, ...) : l’importation de données demeure limitée à la capacité de Excel (65536 lignes).
Pour les formats spécialisés (SAS, JMP, bases de données), il faut faire appel aux connecteurs ODBC (Open Data Base Connectivity), distribués avec ces logiciels : mais dès lors que, pour disposer de l’un de ces connecteurs, on a acquis l’un de ces logiciels, mieux vaut le préférer à Excel pour des analyses statistiques, dont les fonctions statistiques sont largement préprogrammées.
HAUT DE PAGE2.1.2 Fonctions préprogrammées
Excel propose un catalogue préprogrammé de fonctions. Appliquées à notre population de mesures, elles apportent, entre autres, les résultats donnés dans le tableau ...
Cet article fait partie de l’offre
Instrumentation et méthodes de mesure
(50 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive
Statistique descriptive
Cet article fait partie de l’offre
Instrumentation et méthodes de mesure
(50 articles en ce moment)
Cette offre vous donne accès à :
Une base complète d’articles
Actualisée et enrichie d’articles validés par nos comités scientifiques
Des services
Un ensemble d'outils exclusifs en complément des ressources
Un Parcours Pratique
Opérationnel et didactique, pour garantir l'acquisition des compétences transverses
Doc & Quiz
Des articles interactifs avec des quiz, pour une lecture constructive