Move all files

This commit is contained in:
2024-09-17 22:36:02 +02:00
parent 41de349593
commit aa50cc4e52
74 changed files with 85 additions and 1251 deletions

View File

@@ -0,0 +1,13 @@
Version: 1.0
RestoreWorkspace: Default
SaveWorkspace: Default
AlwaysSaveHistory: Default
EnableCodeIndexing: Yes
UseSpacesForTab: Yes
NumSpacesForTab: 2
Encoding: UTF-8
RnwWeave: Sweave
LaTeX: pdfLaTeX

View File

@@ -0,0 +1,160 @@
---
title: "TP2 : ACP "
output:
pdf_document: default
html_document: default
output: rmarkdown::html_vignette
---
```{r setup, include=FALSE}
knitr::opts_chunk$set(echo = TRUE)
```
### Objectifs du TP
* Rappel méthodologique
* ACP avec le package FactoMineR sur les données "voitures anciennes"
* ACP avec le package FactoMineR sur les données "Habitudes alimentaires de certaines CSP"
* ACP sur le jeu de données "iris" : quantifier les variations de morphologie des fleurs d'iris de trois espèces
# Modèle type de rédaction
* Exploration de la structure du jeu de données
* Inertie expliquée et choix du nombre d'axes à retenir
* Analyse des contributions et interprétation des individus axes par axes sur le modèle du cours $I^{+}$ et $I^{-}$
* Analyse des corrélations et interprétation des variables par axe
* Interprétation et synthèse
# ACP sur le jeu de données "voitures anciennes"
* Importation du jeu de données "autos.csv" (il comporte 18 voitures et 6 variables actives : Cylindrée, Puissance, Longueur, Largeur, Poids, Vitesse maximum)
```{r}
autos <- read.table("autos.csv", sep=";",header=TRUE)
```
```{r}
rownames(autos)<-autos$Modele
autos$Modele<-NULL
```
```{r}
autos<-autos[,c(1:6,8)]
```
* Lancer FactoMineR sur le jeu de données autos en mettant la variable PRIX en supplémentaire, comparez avec les résultats obtenus "à la main" ci-dessus.
```{r,echo=FALSE}
library(FactoMineR)
help(PCA)
```
```{r,echo=FALSE}
res.autos<-PCA(autos, scale.unit=TRUE, quanti.sup = "PRIX")
```
```{r}
summary(res.autos, nb.dec=2, nb.elements =Inf, nbind = Inf, ncp=3) #les résultats avec deux décimales, pour tous les individus, toutes les variables, sur les 3 premières CP
```
```{r}
eigenvalues <- res.autos$eig # pour faire l'eboulis des valeurs propres
```
```{r}
bplt <- barplot(eigenvalues[, 2], names.arg=1:nrow(eigenvalues),
main = "Eboulis des valeurs propres",
xlab = "Principal Components",
ylab = "Percentage of variances",
col ="steelblue",
)
lines(x = bplt, eigenvalues[, 2], type="b", pch=19, col = "red")
```
Axe 1
https://www.google.com/search?q=renault+30&sxsrf=AJOqlzXa7fdk2FHIzJnBMybS2VVl848JTw:1675932953411&source=lnms&tbm=isch&sa=X&ved=2ahUKEwjMx-viiIj9AhX0VKQEHayxCH8Q_AUoAXoECAIQAw&biw=1920&bih=973&dpr=1#imgrc=Do9PtlcmoQ22EM
https://www.google.com/search?q=toyota+corolla&sxsrf=AJOqlzUZUO_FZkxQBSnrw_fECwllyzSicA:1675932937647&source=lnms&tbm=isch&sa=X&ved=2ahUKEwi_tanbiIj9AhWkaqQEHeKnB64Q_AUoAXoECAEQAw&biw=1920&bih=973&dpr=1#imgrc=Ia1iG0X2ojWldM
Axe 2
https://www.google.com/search?q=Alfetta+1.66&tbm=isch&ved=2ahUKEwi3-KXeiYj9AhWjmicCHZPPAJ8Q2-cCegQIABAA&oq=Alfetta+1.66&gs_lcp=CgNpbWcQA1DhAVjlCWCEDGgBcAB4AIABMYgBYJIBATKYAQCgAQGqAQtnd3Mtd2l6LWltZ8ABAQ&sclient=img&ei=HLbkY7f6EqO1nsEPk5-D-Ak&bih=973&biw=1920
https://www.google.com/search?q=Audi+100&tbm=isch&ved=2ahUKEwiYsc7fiYj9AhVgnCcCHVTHBzQQ2-cCegQIABAA&oq=Audi+100&gs_lcp=CgNpbWcQAzIICAAQgAQQsQMyBQgAEIAEMgUIABCABDIFCAAQgAQyBQgAEIAEMgUIABCABDIFCAAQgAQyBQgAEIAEMgUIABCABDIFCAAQgAQ6BAgjECc6BggAEAUQHjoECAAQHjoGCAAQCBAeOgcIABCABBAYOgQIABBDOgcIABCxAxBDUJMHWPwhYMwjaABwAHgAgAGBAYgB6AeSAQQxOC4xmAEAoAEBqgELZ3dzLXdpei1pbWfAAQE&sclient=img&ei=H7bkY9ilBOC4nsEP1I6foAM&bih=973&biw=1920#imgrc=HcD1MCnYOiL6CM
# ACP normée sur les données "Habitudes alimentaires de certaines CSP"
Individus : AGRI : exploitants agricoles // SAAG : salariés agricoles // PRIN : professions indépendantes // CSUP : cadres supérieurs // CMOY : cadres moyens // EMPL : employés // OUVR : ouvriers // INAC : inactifs
Variables : Pains ordinaires (PAO), Autres pains (plus sophistiqués) (PAA), Vins ordinaires (VIO), Autres vins (plus sophistiqués) (VIA), Pommes de terre (POT), Légumes secs (lentilles, flageolets etc) (LEC), Raisins (fruits) (RAI), Plats préparés (coûteux à l'époque de l'enquête) (PLP)
* Charger les données "alimentation.csv" vous les mettrez dans un jeu de données appelé alim.
```{r, include=FALSE}
alim <- read.table('alimentation.csv', sep=';', header=TRUE)
```
* Formater les pour l'ACP
```{r}
rownames(alim)<-alim$ROW_LABEL
alim$ROW_LABEL<-NULL
```
* Calculer la matrice des corrélations
```{r}
help(cor)
corr <- cor(alim)
corr
```
* Lancer FactoMineR sur ce jeu de données. Effectuer l'analyse statistique des résultats.
* Que remarquez vous chez les individus ?
```{r}
res.alim<-PCA(alim, scale.unit=TRUE, quanti.sup = c())
```
```{r}
summary(res.alim, nb.dec = 2, nbelements = Inf, nbind = Inf, ncp = 3)
```
* Relancez l'ACP en prenant en compte cette modification
```{r}
res.alim2 <- PCA(alim, scale.unit=TRUE, quanti.sup = c(), ind.sup = c(8))
```
```{r}
summary(res.alim2, nb.dec = 2, nbelements = Inf, nbind = Inf, ncp = 3)
```
# ACP sur le jeu de données "iris" : quantifier les variations de morphologie des fleurs d'iris de trois espèces
https://fr.wikipedia.org/wiki/Iris_de_Fisher
```{r}
data(iris)
head(iris)
```
```{r}
res.iris <- PCA(iris, scale.unit = TRUE, quali.sup = c('Species'))
plot.PCA(res.iris, choix = "ind", habillage = 5, label = "none")
dimdesc(res.iris)
```
```{r}
summary(res.iris, nbelements = Inf, nbind = Inf, ncp = 3)
```

View File

@@ -0,0 +1,9 @@
ROW_LABEL;PAO;PAA;VIO;VIA;POT;LEC;RAI;PLP
AGRI;167;1;163;23;41;8;6;6
SAAG;162;2;141;12;40;12;4;15
PRIN;119;6;69;56;39;5;13;41
CSUP;87;11;63;111;27;3;18;39
CMOY;103;5;68;77;32;4;11;30
EMPL;111;4;72;66;34;6;10;28
OUVR;130;3;76;52;43;7;7;16
INAC;138;7;117;74;53;8;12;20
1 ROW_LABEL PAO PAA VIO VIA POT LEC RAI PLP
2 AGRI 167 1 163 23 41 8 6 6
3 SAAG 162 2 141 12 40 12 4 15
4 PRIN 119 6 69 56 39 5 13 41
5 CSUP 87 11 63 111 27 3 18 39
6 CMOY 103 5 68 77 32 4 11 30
7 EMPL 111 4 72 66 34 6 10 28
8 OUVR 130 3 76 52 43 7 7 16
9 INAC 138 7 117 74 53 8 12 20

View File

@@ -0,0 +1 @@
Modele;CYL;PUISS;LONG;LARG;POIDS;V-MAX;FINITION;PRIX;R-POID.PUIS
1 Modele CYL PUISS LONG LARG POIDS V-MAX FINITION PRIX R-POID.PUIS Alfasud TI 1350 79 393 161 870 165 B 30570 11.01 Audi 100 1588 85 468 177 1110 160 TB 39990 13.06 Simca 1300 1294 68 424 168 1050 152 M 29600 15.44 Citroen GS Club 1222 59 412 161 930 151 M 28250 15.76 Fiat 132 1585 98 439 164 1105 165 B 34900 11.28 Lancia Beta 1297 82 429 169 1080 160 TB 35480 13.17 Peugeot 504 1796 79 449 169 1160 154 B 32300 14.68 Renault 16 TL 1565 55 424 163 1010 140 B 32000 18.36 Renault 30 2664 128 452 173 1320 180 TB 47700 10.31 Toyota Corolla 1166 55 399 157 815 140 M 26540 14.82 Alfetta-1.66 1570 109 428 162 1060 175 TB 42395 9.72 Princess-1800 1798 82 445 172 1160 158 B 33990 14.15 Datsun-200L 1998 115 469 169 1370 160 TB 43980 11.91 Taunus-2000 1993 98 438 170 1080 167 B 35010 11.02 Rancho 1442 80 431 166 1129 144 TB 39450 14,11 Mazda-9295 1769 83 440 165 1095 165 M 27900 13.19 Opel-Rekord 1979 100 459 173 1120 173 B 32700 11.20 Lada-1300 1294 68 404 161 955 140 M 22100 14.04