Section outline

    • Opened: Wednesday, 18 March 2026, 12:00 AM
      Due: Tuesday, 24 March 2026, 2:00 PM
    • Opened: Tuesday, 7 April 2026, 12:00 AM
      Due: Tuesday, 14 April 2026, 3:00 PM

      Sul file excel pulito dei dati degli studenti dell'esercizio precedente selezionare una variabile quantitativa a piacere ed effettuare le seguenti operazioni:

      • normalizzare la variabile scelta secondo il metodo min-max (aggiungere una colonna nel file excel con questi nuovi valori)
      • standardizzare la medesima variabile (aggiungere una colonna nel file excel con questi nuovi valori)
      • Confrontare le due trasformazioni dati e commentare le differenze (gli eventuali valori anomali sono gli stessi? qual è il valore medio delle due trasformazioni? e la deviazione standard?)
    • Opened: Friday, 17 April 2026, 2:00 PM
      Closes: Monday, 27 April 2026, 11:59 PM

      Quiz sugli argomenti che vanno fino alle slides 04 (eccetto quelle su data preparation) e includono parte del materiale su R (guardate la dispensa e/o il manuale di Iacus).

      I punteggi saranno pesati sulla base del grado di fiducia che dichiarate prima della risposta alla domanda (minimo -6 se risposta sbagliata e massimo grado di fiducia ad un massimo di 3 se risposta corretta con massimo grado di fiducia).

      Il quiz è composto da domande di varia natura, dura un massimo di 70 minuti e va completato in un'unica sessione. Ricordate che una volta avviato il quiz non si può tornare indietro sulle domande. Avviata una domanda occorre rispondere!

    • Opened: Friday, 17 April 2026, 2:00 PM
      Closes: Tuesday, 5 May 2026, 11:59 PM

      Quiz sugli argomenti inclusi nelle slides sul campionamento, nel manuale dell'ISTAT e nel materiale addizionale caricato.

      I punteggi saranno pesati sulla base del grado di fiducia che dichiarate prima della risposta alla domanda (minimo -6 se risposta sbagliata e massimo grado di fiducia ad un massimo di 6 se risposta corretta con massimo grado di fiducia).

      Il quiz dura un massimo di 50 minuti e va completato in un'unica sessione. Non si può tornare indietro nelle domande. 

    • Opened: Friday, 17 April 2026, 3:00 PM
      Closes: Tuesday, 5 May 2026, 11:59 PM

      Quiz sugli argomenti inclusi nelle slides sul fonti dati e preprocessing e nel pdf data preporcessing (estratto dal volume di Larose) caricato nella sezione materiale di studio

      I punteggi saranno pesati sulla base del grado di fiducia che dichiarate prima della risposta alla domanda (minimo -6 se risposta sbagliata e massimo grado di fiducia ad un massimo di 6 se risposta corretta con massimo grado di fiducia).

      Il quiz dura un massimo di 45 minuti e va completato in un'unica sessione. Non si può tornare indietro nelle domande. 



    • I file contengono descrizione, coodebook e matrice dati dell'indagine campionaria VOTER. La matrice dati è un file csv (comma-separated value), la funzione per caricarlo in R è read.csv("percorso_file", header=TRUE, sep=",").

      Usate il file per esercitarvi alla redazione di un report (scegliete un "tema" e poche variabili per analizzarlo; ad esempio relazione tra scelte di voto e sessismo).


    • Report - Istruzioni

      Il report dati da consegnare entro fine giugno con discussione dei risultati nella data di appello del 5 luglio dovrà essere un file word o pdf di massimo 15 pagine che conterrà anche grafici, tabelle e copia/incolla dei comandi di R o excel usati. L'invio dovrà avvenire per posta elettronica (ddestefano@units.it).

      Il report dovrà essere ripartito nelle seguenti sezioni:

      1) Breve introduzione (max 1 pagina) su cosa conterrà il report e le variabili di interesse e punto piu importante la domanda di ricerca (cosa vogliamo conoscere attraverso l'indagine?)

      2) Eventuale spiegazione della fase di pulizia o trasformazione dati (es se è necessario sommare variabili o ricodificarne alcune, ecc)

      3) Analisi descrittive (indici, tabelle e grafici) e commento su alcune variabili di vostro interesse (non tutte!) utili a descrivere il campione 

      4) Modello di regressione multipla che risponda eventualmente alla domanda di ricerca del punto 1

      5) Uno a scelta tra:

      - Analisi in Componenti Principali per rappresentare graficamente i dati in un unico spazio ridotto

      - Analisi dei gruppi mediante il metodo delle k-medie o con metodo gerarchico e commento dei risultati (quanti gruppi avete trovato/scelto, come sono caratterizzate le unità statistiche al loro interno sulla base delle variabili a vostra disposizione)

      Lascio come facoltativa la possibilità di usare entrambi i metodi.

      NOTA: per la discussione del report ci sarebbe da preparare anche una breve presentazione del report mediante slides (cercate di stare in una decina di slides).