Corso: 142SP - ANALISI DEI DATI 2025

Schema della sezione

Seleziona sezione Introduzione

Minimizza Espandi
Introduzione

Minimizza tutto Espandi tutto
- Seleziona attività Annunci
  
  Annunci Forum
Seleziona sezione Slides

Minimizza Espandi
Slides
- Seleziona attività Introduzione al corso
  
  Introduzione al corso File PDF
- Seleziona attività 01 Richiami di statistica di base
  
  01 Richiami di statistica di base File PDF
- Seleziona attività 02 Richiami di statistica di base 2
  
  02 Richiami di statistica di base 2 File PDF
- Seleziona attività 03 Richiami di statistica di base 3
  
  03 Richiami di statistica di base 3 File PDF
- Seleziona attività 04 Fonti dati e data preparation
  
  04 Fonti dati e data preparation File PDF
- Seleziona attività Linee guida qualità di dati e processi (integrazione slides Fonti dati))
  
  Linee guida qualità di dati e processi (integrazione slides Fonti dati)) File PDF
- Seleziona attività Data preparation (lecture notes)
  
  Data preparation (lecture notes) File PDF
  
  Estratto dal volume D. Larose - DISCOVERING KNOWLEDGE IN DATA, Wiley
- Seleziona attività 05 Campionamento
  
  05 Campionamento File PDF
- Seleziona attività Note su campionamento (integrazione slides campionamento)
  
  Note su campionamento (integrazione slides campionamento) File PDF
- Seleziona attività 06 ulteriori appunti su campionamento
  
  06 ulteriori appunti su campionamento File PDF
- Seleziona attività Seminario fonti dati e applicazioni (dott. Samar)
  
  Seminario fonti dati e applicazioni (dott. Samar) File PDF
- Seleziona attività 07 Regressione
  
  07 Regressione File PDF
- Seleziona attività 07_bis regressione lineare slides complete
  
  07_bis regressione lineare slides complete File PDF
- Seleziona attività Seminario Prof. Witold Smigileski su "Regressione logistica versus regressione di Cox"
  
  Seminario Prof. Witold Smigileski su "Regressione logistica versus regressione di Cox" File PDF
- Seleziona attività 08 Regressione logistica
  
  08 Regressione logistica File PDF
- Seleziona attività 09 Analisi dei gruppi
  
  09 Analisi dei gruppi File PDF
- Seleziona attività 10 Analisi multidimensionale/multivariata dei dati
  
  10 Analisi multidimensionale/multivariata dei dati File PDF
- Seleziona attività Simulazione compito 26/5/2026
  
  Simulazione compito 26/5/2026 Cartella
- Seleziona attività Altro compito
  
  Altro compito File PDF
Seleziona sezione Dati per esercizi e materiale addizionale

Minimizza Espandi
Dati per esercizi e materiale addizionale
- Seleziona attività Strumento Tabelle per la definizione del campione
  
  Strumento Tabelle per la definizione del campione File PDF
  
  Tabella per il calcolo dell'ampiezza campionaria nel caso di un proporzione considerando varianza massima (=0.25).
  
  Si noti che per una popolazione grande (all'aumentare di N) l'ampiezza campionaria è sostanzialmente identica (e dipende solo da livello di confidenza e margine di errore accettato per le stime). Si ricordi inoltre che in tali casi (N grande) la frazione di campionamento è in genere molto bassa.
- Seleziona attività Link sito ISTAT indagini multiscopo
  
  Link sito ISTAT indagini multiscopo URL
- Seleziona attività Esempio analisi dati multiscopo
  
  Esempio analisi dati multiscopo File PDF
- Seleziona attività Esempio su regressione logistica
  
  Esempio su regressione logistica File PDF
  
  Esempio utilizzato in aula
- Seleziona attività Dispense su modello di regressione logistica con R
  
  Dispense su modello di regressione logistica con R File PDF
- Seleziona attività Dati e metadati sole 24 ore (qualità della vita)
  
  Dati e metadati sole 24 ore (qualità della vita) File CSV
  
  Dati scaricati dal github del Sole 24 ore in formato CSV separati da ","
- Seleziona attività Metadati sole 24 ore
  
  Metadati sole 24 ore File CSV
- Seleziona attività Dati e metadati food choices
  
  Dati e metadati food choices Cartella
- Seleziona attività Dati benessere equo-sostenibile BES ISTAT
  
  Dati benessere equo-sostenibile BES ISTAT Cartella
Seleziona sezione Esercitazioni individuali

Minimizza Espandi
Esercitazioni individuali
- Seleziona attività Esercitazione 1 - pulizia dati
  
  Esercitazione 1 - pulizia dati Compito
  
  Aperto: mercoledì, 18 marzo 2026, 00:00
  
  Termine consegna martedì, 24 marzo 2026, 14:00
- Seleziona attività Esercizio su trasformazioni dati - consegna 14/4
  
  Esercizio su trasformazioni dati - consegna 14/4 Compito
  
  Aperto: martedì, 7 aprile 2026, 00:00
  
  Termine consegna martedì, 14 aprile 2026, 15:00
  
  Sul file excel pulito dei dati degli studenti dell'esercizio precedente selezionare una variabile quantitativa a piacere ed effettuare le seguenti operazioni:
  
  normalizzare la variabile scelta secondo il metodo min-max (aggiungere una colonna nel file excel con questi nuovi valori)
  
  standardizzare la medesima variabile (aggiungere una colonna nel file excel con questi nuovi valori)
  
  Confrontare le due trasformazioni dati e commentare le differenze (gli eventuali valori anomali sono gli stessi? qual è il valore medio delle due trasformazioni? e la deviazione standard?)
- Seleziona attività Esercizio regressione
  
  Esercizio regressione Compito
  
  Aperto: domenica, 5 aprile 2026, 17:48
  
  Termine consegna lunedì, 11 maggio 2026, 23:59
  
  Buongiorno,
  
  Vi chiederei di caricare una scansione (meglio un file pdf) del foglio che utilizzerete per rispondere ai seguenti quesiti sull'output di R di un modello di regressione multiplo
  
  Aggiungo il punto
  
  f) interpretare i valori dei coefficienti che risultano significativi.
Seleziona sezione Parte pratica. Software R

Minimizza Espandi
Parte pratica. Software R
- Seleziona attività Link per scaricare R - CRAN
  
  Link per scaricare R - CRAN URL
- Seleziona attività Link per scaricare RStudio
  
  Link per scaricare RStudio URL
  
  Scaricare la versione FREE
- Seleziona attività Introduzione ad R - dispensa integrativa al manuale R
  
  Introduzione ad R - dispensa integrativa al manuale R File PDF
- Seleziona attività Script Introduzione a R
  
  Script Introduzione a R File
- Seleziona attività Laboratorio Campionamento
  
  Laboratorio Campionamento Cartella
- Seleziona attività SCRIPT SU MODELLO DI REGRESSIONE
  
  SCRIPT SU MODELLO DI REGRESSIONE File R
  
  Il file riporta l'esempio di analisi descrittiva e step per interpretare il modello di regressione sui dati contenuti nelle slides del corso (file .R con commenti)
  
  Per visualizzarlo aprire il file con RStudio o con un editor di testi
- Seleziona attività Laboratorio R (liste, dataframe, factors dal file R_introduzione; campionamento)
  
  Laboratorio R (liste, dataframe, factors dal file R_introduzione; campionamento) Cartella
- Seleziona attività Laboratorio data manipulation
  
  Laboratorio data manipulation Cartella
- Seleziona attività R script - regressione multipla
  
  R script - regressione multipla File
- Seleziona attività Laboratorio R - Regressione Logistica
  
  Laboratorio R - Regressione Logistica Cartella
- Seleziona attività FIle calcolo K-means
  
  FIle calcolo K-means R
  
  Script di R per l'algoritmo di clustering k-means (esempio riportato nelle slides analisi gruppi lievement modificato)
  Oltre al calcolo delle k-medie nello script c'è:
  - uso della funzione points e plot (per colorare i punti sulla base dei gruppi)
  - l'uso del ciclo for
  - il calcolo della distanza tra uniità statistiche e centroidi
- Seleziona attività SCRIPT SU ANALISI DEI GRUPPI
  
  SCRIPT SU ANALISI DEI GRUPPI File R
  
  Esempio di analisi dei gruppi per il dataframe Autovetture (che trovate nella sezione DATI del corso su moodle)
  Contiene anche uno script da usare come suggerimento per la parte di analisi dei gruppi da inserire nel report
- Seleziona attività SCRIPT SU ANALISI DELLE COMPONENTI PRINCIPALI
  
  SCRIPT SU ANALISI DELLE COMPONENTI PRINCIPALI File R
  
  Il file riporta l'esempio di analisi i componenti principali svolto in aula sui dati UScrime (file .R con commenti)
- Seleziona attività Laboratorio R Clustering e ACP
  
  Laboratorio R Clustering e ACP Cartella
Seleziona sezione Quiz per argomenti

Minimizza Espandi
Quiz per argomenti
- Seleziona attività Quiz 1 - Cenni introduttivi, indagini campionarie e intro a R
  
  Quiz 1 - Cenni introduttivi, indagini campionarie e intro a R
  
  Aperto: venerdì, 17 aprile 2026, 14:00
  
  Chiuso: mercoledì, 27 maggio 2026, 23:59
  
  Quiz sugli argomenti che vanno fino alle slides 04 (eccetto quelle su data preparation) e includono parte del materiale su R (guardate la dispensa e/o il manuale di Iacus).
  
  I punteggi saranno pesati sulla base del grado di fiducia che dichiarate prima della risposta alla domanda (minimo -6 se risposta sbagliata e massimo grado di fiducia ad un massimo di 3 se risposta corretta con massimo grado di fiducia).
  
  Il quiz è composto da domande di varia natura, dura un massimo di 70 minuti e va completato in un'unica sessione. Ricordate che una volta avviato il quiz non si può tornare indietro sulle domande. Avviata una domanda occorre rispondere!
- Seleziona attività Quiz 2: Campionamento
  
  Quiz 2: Campionamento
  
  Aperto: venerdì, 17 aprile 2026, 14:00
  
  Chiuso: mercoledì, 27 maggio 2026, 23:59
  
  Quiz sugli argomenti inclusi nelle slides sul campionamento, nel manuale dell'ISTAT e nel materiale addizionale caricato.
  
  I punteggi saranno pesati sulla base del grado di fiducia che dichiarate prima della risposta alla domanda (minimo -6 se risposta sbagliata e massimo grado di fiducia ad un massimo di 6 se risposta corretta con massimo grado di fiducia).
  
  Il quiz dura un massimo di 50 minuti e va completato in un'unica sessione. Non si può tornare indietro nelle domande.
- Seleziona attività Quiz 3 Data pre-processing
  
  Quiz 3 Data pre-processing
  
  Aperto: venerdì, 17 aprile 2026, 15:00
  
  Chiuso: mercoledì, 27 maggio 2026, 23:59
  
  Quiz sugli argomenti inclusi nelle slides sul fonti dati e preprocessing e nel pdf data preporcessing (estratto dal volume di Larose) caricato nella sezione materiale di studio
  
  I punteggi saranno pesati sulla base del grado di fiducia che dichiarate prima della risposta alla domanda (minimo -6 se risposta sbagliata e massimo grado di fiducia ad un massimo di 6 se risposta corretta con massimo grado di fiducia).
  
  Il quiz dura un massimo di 45 minuti e va completato in un'unica sessione. Non si può tornare indietro nelle domande.
- Seleziona attività Quiz 4: regressione
  
  Quiz 4: regressione
  
  Aperto: venerdì, 15 maggio 2026, 16:00
  
  Chiuso: martedì, 2 giugno 2026, 15:59
  
  Quiz su correlazione, regressione semplice e multipla. Gli argomenti riguardano sia le slides che il capitolo del libro di testo.
  
  I punteggi saranno pesati sulla base del grado di fiducia che dichiarate prima della risposta alla domanda (minimo -6 se risposta sbagliata e massimo grado di fiducia ad un massimo di 6 se risposta corretta con massimo grado di fiducia).
  
  Il quiz è composto da 20 domande di varia natura, dura un massimo di 60 minuti e va completato in un'unica sessione.
Seleziona sezione Esercizi

Minimizza Espandi
Esercizi
- Seleziona attività Dati Indagine VOTER su elezioni USA (per esercitarsi su report)
  
  Dati Indagine VOTER su elezioni USA (per esercitarsi su report) File PDF
  
  I file contengono descrizione, coodebook e matrice dati dell'indagine campionaria VOTER. La matrice dati è un file csv (comma-separated value), la funzione per caricarlo in R è read.csv("percorso_file", header=TRUE, sep=",").
  Usate il file per esercitarvi alla redazione di un report (scegliete un "tema" e poche variabili per analizzarlo; ad esempio relazione tra scelte di voto e sessismo).
Seleziona sezione REPORT (Parte pratica del corso)

Minimizza Espandi
REPORT (Parte pratica del corso)
- Seleziona attività Report - IstruzioniIl report dati da consegnare en...
  
  Report - Istruzioni
  
  Il report dati da consegnare entro fine maggio con discussione dei risultati nella data del 3 giugno (orario da definire) dovrà essere un file word o pdf di massimo 15 pagine che conterrà anche grafici, tabelle e copia/incolla dei comandi di R o excel usati. L'invio dovrà avvenire per posta elettronica (ddestefano@units.it).
  
  Il report dovrà essere ripartito nelle seguenti sezioni:
  
  1) Breve introduzione (max 1 pagina) su cosa conterrà il report e le variabili di interesse e punto piu importante la domanda di ricerca (cosa vogliamo conoscere attraverso l'indagine?)
  
  2) Eventuale spiegazione della fase di pulizia o trasformazione dati (es se è necessario sommare variabili o ricodificarne alcune, ecc)
  
  3) Analisi descrittive (indici, tabelle e grafici) e commento su alcune variabili di vostro interesse (non tutte!) utili a descrivere il campione
  
  4) Modello di regressione multipla che risponda eventualmente alla domanda di ricerca del punto 1
  
  5) Uno a scelta tra:
  
  - Analisi in Componenti Principali per rappresentare graficamente i dati in un unico spazio ridotto
  
  - Analisi dei gruppi mediante il metodo delle k-medie o con metodo gerarchico e commento dei risultati (quanti gruppi avete trovato/scelto, come sono caratterizzate le unità statistiche al loro interno sulla base delle variabili a vostra disposizione)
  
  Lascio come facoltativa la possibilità di usare entrambi i metodi.
  
  NOTA: per la discussione del report ci sarebbe da preparare anche una breve presentazione del report mediante slides (cercate di stare in una decina di slides).
- Seleziona attività Esempio di report
  
  Esempio di report File PDF
- Seleziona attività Composizione gruppi di lavoro report
  
  Composizione gruppi di lavoro report Feedback
  
  Aperto: martedì, 28 aprile 2026, 18:00
  
  Chiuso: mercoledì, 20 maggio 2026, 23:59
Seleziona sezione Riferimenti libri di testo

Minimizza Espandi
Riferimenti libri di testo
- Seleziona attività Slides dalla su indagini statistiche e progettazio...
  
  Slides dalla su indagini statistiche e progettazione indagine
  Riferimento al manuale sulle indagini dell'ISTAT e ai testi inseriti nella sezione materiale addizionale
- Seleziona attività Slides 2Paragrafo 1.3 libro di testo (Gallucci, Le...
  
  Slides 2
  Paragrafo 1.3 libro di testo (Gallucci, Leone e Berlingeri)
- Seleziona attività Slides Modelli- Modello di regressione lineare sem...
  
  Slides Modelli
  - Modello di regressione lineare semplice - Capitolo 2 libro di testo (Gallucci, Leone e Berlingeri)
  - Modello di regressione lineare multipla - Capitolo 3 libro di testo (Gallucci, Leone e Berlingeri)
  - Regressione con variabili qualitative - Paragrafi 4.1, 4.2, 4.3 libro di testo (Gallucci, Leone e Berlingeri)
- Seleziona attività Slides 10-11Paragrafi 13.3.3, 13.3.4, 13.5 (tutto ...
  
  Slides 10-11
  Paragrafi 13.3.3, 13.3.4, 13.5 (tutto solo da leggere) libro di testo (Gallucci, Leone e Berlingeri)
- Seleziona attività Testi per introduzione alla Statistica
  
  Testi per introduzione alla Statistica Pagina
Seleziona sezione Esiti parziali

Minimizza Espandi
Esiti parziali
- Seleziona attività Esiti scritto del 4 giugno in 20mi (voto parziale al netto del report))
  
  Esiti scritto del 4 giugno in 20mi (voto parziale al netto del report)) File PDF
- Seleziona attività Esiti parziali appello 18/06/2026 (in 20mi al netto del report)
  
  Esiti parziali appello 18/06/2026 (in 20mi al netto del report) File PDF