usc <- read.table("uscrime.txt", header=TRUE) #Importiamo i dati USCrime usc$S <- as.factor(usc$S) # Trasformiamo in factgo la variabile S (1=Sud , 0=Nord) install.packages("FactoMineR") # Installiamo e carichiamo il pacchetto FactoMineR per analisi miultivariata library(FactoMineR) pca.usc <- PCA(usc, scale.unit = TRUE, quali.sup=3) # PCA è la funzione per effettuare l'analisi in componenti principali # lasciare scale.unit=TRUE (cioè standardizzare le variabili per togliere l'effetto della scala di misura) # quali.sup e quanti.sup contengono come valore l'indice di colonna che contienete riuspettivamente le variabili qualitative e quantitative che non devono essere considerate per individuare la componenti (se ci sono var. qualitativve nel dataframe richiamato nella funzioen PCA allora quali.sup deve essere obbligatoriamente specificato) summary(pca.usc) # Fornisce un riepilogo dei risultati pca.usc$eig barplot(pca.usc$eig[, 1]) # Grafico della varianza riassunta dalle componenti individuate plot(pca.usc, choix="var", axes=1:2) # Rapprentazione del cerchio delle correlazioni compoenenti/variabili (serve ad interpretare gli assi) dimdesc(pca.usc, axes = 1:2) # Rissuanto della correlazione variabili/componenti principali (sempre per interpretare gli assi del nuovo riferimento spaziale) plot(pca.usc,choix="ind", habillage=3) #Rappresentazione delle unità statistiche nello spazio ridotto (ad es. 2 dimensioni) habillage contiene l'indice di colonna della variabile qualitativa con cui caratterizzare (diversi colori/forme) i punti degli individui # Valori mancanti (se si hanno NA nel dataframe eseguire questa funzione) imputePCA(X, ncp = 2, scale = TRUE, method = c("Regularized","EM"), row.w = NULL, coeff.ridge = 1, threshold = 1e-06, seed = NULL, nb.init = 1, maxiter = 1000, ...)