Présentation

Article interactif

1 - FAMILLES DE LOGICIELS

2 - STATISTIQUE DESCRIPTIVE

3 - TESTS STATISTIQUES

4 - ANALYSE DE VARIANCE

5 - RÉGRESSION LINÉAIRE SIMPLE

6 - ANALYSE EN COMPOSANTES PRINCIPALES

7 - CONCLUSION

Article de référence | Réf : R272 v2

Analyse en composantes principales
Logiciels de statistique - Exemples et applications

Auteur(s) : Thérèse PHAN

Relu et validé le 21 juil. 2021

Pour explorer cet article
Télécharger l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !

Sommaire

Présentation

Version en anglais English

RÉSUMÉ

Devant l'ampleur croissante de l'utilisation des statistiques et la diversité des moyens informatiques dont l'ingénieur dispose, il a semblé nécessaire de présenter dans cet article les fonctionnalités les plus utilisées en statistique au regard des principaux logiciels disponibles, ceux-ci étant soit sous licence soit libre. Statistique descriptive, tests, analyse de variance, régression ou encore analyse en composantes principales sont présentés sous forme d'exemples traités à l'aide des logiciels Excel, XLSTAT, SAS, JMP IN et R.

Lire cet article issu d'une ressource documentaire complète, actualisée et validée par des comités scientifiques.

Lire l’article

Auteur(s)

INTRODUCTION

Les outils informatiques mis à la disposition des ingénieurs ont permis un essor considérable des études statistiques. Les tailles d'échantillons, le nombre de variables observées, la précision des observations ne sont plus un frein à l'utilisation des méthodes statistiques complexes. Des logiciels dédiés aux statistiques ont été développés durant les dernières décennies ; d'autres, à cible plus générale, ont été enrichis de fonctions statistiques. Le présent article vise à mettre en relief leurs fonctionnalités de base au travers d'exemples.

Tout utilisateur est confronté à une logique commerciale : pour les particuliers, le budget est souvent limitatif alors que, pour un cadre d'entreprise, les choix de l'entreprise / organisation sont souvent normatifs. Dans cet esprit, les logiciels utilisés pour illustrer les exemples pratiques ont été retenus en fonction de leur appartenance à l'une des différentes familles ressortissant de ce prisme, sans préjuger d'une quelconque prééminence par rapport aux autres membres de sa famille :

  • Excel : à disposition de toute suite MS-Office (sous Windows ou MacOS), il a ouvert la voie à différents compléments, tel XLSTAT, commercialisés séparément, qui proposent des bibliothèques de « macros » Excel, dédiées aux statistiques : ces compléments demeurent dépendants des stratégies de l'éditeur d'Excel ;

  • SAS : logiciel précurseur très complet, il fait référence auprès de nombreux statisticiens, même s'ils en utilisent d'autres ;

  • JMP IN : version « grand public » de SAS, il s'est placé en concurrence frontale avec des produits d'excellente facture conçus pour PC pendant que SAS régnait sur les grands systèmes (Statistica, StatLab, StatView, SPSS, Systat…) ;

  • la famille « Open source », représentée par le logiciel R, associée avec la gratuité d'utilisation des logiciels (licence GNU) et la collégialité de leur évolution ;

  • enfin, n'ont pas été pris en considération, pour le présent article, les développements « locaux », réalisés dans le cadre d'organisations ou de particuliers. Nous pouvons ainsi citer le logiciel gratuit de modélisation des résultats d’étalonnage M-CARE, mis au point par le Collège français de métrologie.

La présentation des fonctionnalités de ces différents logiciels se concentre sur :

  • les fonctions de base ;

  • les tests d’ajustement et de comparaison ;

  • l'analyse de variance à simple et à double entrée ;

  • l'analyse de régression ;

  • l’analyse en composantes principales.

Cet article est réservé aux abonnés.
Il vous reste 94% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

VERSIONS

Il existe d'autres versions de cet article :

DOI (Digital Object Identifier)

https://doi.org/10.51257/a-v2-r272


Cet article fait partie de l’offre

Métier : responsable qualité

(252 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Lecture en cours
Présentation
Version en anglais English

6. Analyse en composantes principales

6.1 Présentation

Nous allons terminer cet article par un exemple d'analyse en composantes principales traité à l'aide de SAS. Nous reportons à l'ouvrage de Gilbert Saporta  pour la présentation théorique de cette analyse.

Le tableau 17 donne, pour chacun des 17 pays européens étudiés, la répartition du budget (en %) des ménages selon les postes suivants : alimentation, habillement, logement, équipement de la maison, santé, transports, éducation et enfin divers.

Nous allons appliquer une analyse en composantes principales à ce tableau de données. Cette analyse sera conduite avec SAS, mais elle peut être aussi menée avec R par exemple. On utilise dans SAS le module interactif.

Rappelons simplement que l'analyse en composantes principales est une méthode d'analyse statistique descriptive multidimensionnelle de données numériques. Elle permet de visualiser les données en projetant les « individus » observés, sur un plan ou dans un espace de dimension 3 construit à l'aide de nouvelles variables indépendantes entre elles et corrélées aux anciennes : les composantes principales.

L'observation conjointe des corrélations entre les variables et les composantes principales et de la situation des individus dans le nouvel espace permet de mettre en évidence des liaisons entre les variables ainsi que des comportements similaires chez certains individus.

HAUT DE PAGE

6.2 Analyse en composantes principales avec SAS

Après avoir ouvert « Analyse Interactive de données », dans le menu « Analyse », on sélectionne « Multivariate(X,Y) ». La colonne correspondant aux pays est désignée avec la sélection « Label » et les colonnes contenant les divers postes des budgets sont désignées comme Y. SAS fournit alors les statistiques de base sur les variables Alimentation, Habillement…...

Cet article est réservé aux abonnés.
Il vous reste 94% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

TEST DE VALIDATION ET CERTIFICATION CerT.I. :

Cet article vous permet de préparer une certification CerT.I.

Le test de validation des connaissances pour obtenir cette certification de Techniques de l’Ingénieur est disponible dans le module CerT.I.

Obtenez CerT.I., la certification
de Techniques de l’Ingénieur !
Acheter le module

Cet article fait partie de l’offre

Métier : responsable qualité

(252 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Lecture en cours
Analyse en composantes principales
Sommaire
Sommaire

BIBLIOGRAPHIE

  • (1) - PHAN (T.), ROWENCZYK (J.-P.) -   « Statistique et Probabilités »  -  Éditions Dunod (exercices et Problèmes, sciences sup) (2007).

  • (2) - POIRIER (J.) -   « Analyse de la variance et de la régression, Plans d'expérience »  -  Éditions Techniques de l'ingénieur vol R 260 (1993).

  • (3) - SAPORTA (G.) -   « Probabilités, Analyse des données et Statistique »  -  Éditions Technip (1990).

  • (4) - VEYSSEYRE (R.) -   « Statistique et Probabilités pour l'ingénieur »  -  Éditions Dunod (l'Usine Nouvelle) (2001).

  • (5) -   *  -  « Aide mémoire statistique », Éditions CISIA-CERESTA (1995).

  • (6) -   *  -  SAS...

1 Annuaire

HAUT DE PAGE

1.1 Distributeurs

EXCEL : distributeurs Microsoft

SAS : SAS France, Domaine de Grégy, BP 5 – 77166 Grégy-sur-Yerres

JMP : voir SAS

R : logiciel « freeware » en distribution sur Internet

HAUT DE PAGE

2 Logiciels

SAS :

États-Unis

http://www.sas.com/

France

http://www.sas.com/offices/europe/france/

R :

The R Project for Statistical Computing

http://www.r-project.org/

JMP :

États-Unis

http://www.sas.com/

http://www.jmp.com/

HAUT DE PAGE

Cet article est réservé aux abonnés.
Il vous reste 92% à découvrir.

Pour explorer cet article
Téléchargez l'extrait gratuit

Vous êtes déjà abonné ?Connectez-vous !


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

Cet article fait partie de l’offre

Métier : responsable qualité

(252 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS

Sommaire

QUIZ ET TEST DE VALIDATION PRÉSENTS DANS CET ARTICLE

1/ Quiz d'entraînement

Entraînez vous autant que vous le voulez avec les quiz d'entraînement.

2/ Test de validation

Lorsque vous êtes prêt, vous passez le test de validation. Vous avez deux passages possibles dans un laps de temps de 30 jours.

Entre les deux essais, vous pouvez consulter l’article et réutiliser les quiz d'entraînement pour progresser. L’attestation vous est délivrée pour un score minimum de 70 %.


L'expertise technique et scientifique de référence

La plus importante ressource documentaire technique et scientifique en langue française, avec + de 1 200 auteurs et 100 conseillers scientifiques.
+ de 10 000 articles et 1 000 fiches pratiques opérationnelles, + de 800 articles nouveaux ou mis à jours chaque année.
De la conception au prototypage, jusqu'à l'industrialisation, la référence pour sécuriser le développement de vos projets industriels.

Cet article fait partie de l’offre

Métier : responsable qualité

(252 articles en ce moment)

Cette offre vous donne accès à :

Une base complète d’articles

Actualisée et enrichie d’articles validés par nos comités scientifiques

Des services

Un ensemble d'outils exclusifs en complément des ressources

Un Parcours Pratique

Opérationnel et didactique, pour garantir l'acquisition des compétences transverses

Doc & Quiz

Des articles interactifs avec des quiz, pour une lecture constructive

ABONNEZ-VOUS