Course: 908PS-2 - MODELLI LINEARI APPLICATI 2025

Section outline

Select section General

Collapse Expand
General

Collapse all Expand all
Chiarimenti sulla modalità d'esame.

L'esame è composto da due fasi distinte:

Fase di lavoro "domestico": Per poter accedere all'esame con una base di partenza minima di 18/30 è necessario creare una propria cartella "Compiti_COGNOME" sul canale Teams del corso, dove caricare tutti gli esercizi assegnati durante le lezioni. Lo svolgimento di tutti i compiti assegnati è un prerequisito necessario per poter accedere all'esame vero e proprio "in presenza". In aggiunta, prima della partecipazione alla fase 2, sarà necessario caricare anche un Glossario preparato con cura e autonomamente, contenente tutti i termini tecnici nuovi presentati a lezione. Il Glossario potrà contenere spiegazioni basate sul materiale presentato a lezione, su ricerche autonome e naturalmente sul libro di riferimento del corso (Categorica Data Analysis, Agresti). Il docente controllerà il materiale caricato (...attenzione all'uso dell IA) e darà eventualmente il parere favorevole alla partecipazione all'esame scritto. A tal riguardo, il materiale dovrà essere presente nella propria cartella una settimana prima della data dell'esame scritto.

Esame scritto "in presenza": nelle date ufficiali, si svolgerà un'esame scritto per completare la valutazione finale (voto finale max. 30/30). L'esame sarà costituito da (a) 6 esercizi da svolgere con il programma statistico R e (b) 6 quesiti aperti e problemi da svolgere su carta, consentendo il raggiungimento di (max) 12 punti da sommare ai 18 conseguiti precedentemente. Sarà necessario portare il proprio pc/tablet + un formulario preparato autonomamente (A4 fronte-retro) con tutte le formule (solo quelle, con minimi commenti) ritenute utili. L'esame durerà due ore: nella prima ora si svolgerà la prova in R, alla fine della quale gli script R prodotti verranno inviati (immediatamente) via email al docente. A partire dalla seconda ora, si potrà iniziare la prova scritta vera e propria solo con l'ausilio del formulario (i pc/tablet verranno chiusi e messi via). Terminate le due ore, l'esame scritto verrà consegnato al docente. Nel caso non venisse svolto alcun esercizio, la valutazione conseguita sarà solamente quella minima (18/30), garantita dalle attività del punto 1.
- Select activity Annunci
  
  Annunci Forum
Select section Prima lezione

Collapse Expand
Prima lezione
Lunedì 23 febbraio 2026

13:00 - 16:00

Breve presentazione del corso

Chiarimenti sulla modalità di svolgimemento dell'esame finale

Breve ripasso sul modello lineare bivariato e multiplo (si consiglia un ripasso individuale sui testi usati durante la triennale)

Il concetto di derivata e sua applicazione nell'individuazione del minimo di una funzione (Formula della varianza campionaria con centro generico "c", vedi lezioni su Teams)

Esempio generico di "ottimizzazione" mediante diseguaglianza "Media Aritmetica - Media Geometrica" (vedi lezioni registrate su Teams)

Canale Teams ufficiale del Corso:

Generale | CD2025 908PS-2 MODELLI LINEARI APPLICATI | Microsoft Teams

COMPITO:

Produrre degli appunti della lezione (PC o a mano, è uguale) e caricarli sulla cartella condivisa della pagina Teams del corso.

salvare il file "Cognome_Compiti_1" (.pdf o Word, se foto allora consolidare su unico file .pdf magari incollando prima le foto su PowerPoint, salvando come .pdf)
- Select activity Lezione 1 MLA
  
  Lezione 1 MLA File XLSX
Select section Lezione II

Collapse Expand
Lezione II
venerdì 27 febbraio 2026

11:00 - 13:00

Il modello di regressione lineare bivariato e multiplo: rappresentazione grafica e matrice del modello di 7 casi generali.

Canale Teams ufficiale del Corso:

Generale | CD2025 908PS-2 MODELLI LINEARI APPLICATI | Microsoft Teams
- Select activity Lezione 2_MLA
  
  Lezione 2_MLA File PDF
Select section Lezione III

Collapse Expand
Lezione III
Lunedì 2 marzo 2026

13:00 - 16:00

Stima di massima verosimiglianza (MLE) dei parametri della funzione di densità di probabilità Normale.

Convergenza delle stime MLE con media e varianza campionaria.

Le derivate seconde parziali e cross-parziali: legame con la varianza/covarianza dei parametri MLE

COMPITO:

Vedi diapositive della lezione
- Select activity Lezione 3 MLA
  
  Lezione 3 MLA File PDF
Select section Lezione IV

Collapse Expand
Lezione IV
venerdì 6 marzo 2026

11:00 - 13:00

Stima di massima verosimiglianza (MLE) di "p" in una serie di Bernoulli (analisi di dati dicotomici 0-1).

Relazione tra derivata seconda della funzione Log-likelihood e precisione delle stime MLE.
- Select activity Lezione 4 MLA
  
  Lezione 4 MLA File PDF
Select section Lezione V

Collapse Expand
Lezione V
Lunedì 9 marzo 2026

13:30 - 15:30

Linguaggio di programmazione R: Grafici e funzioni di base.

Analisi dell'articolo e replica della procedura iterativa proposta mediante programmazione in R

Camilli, G. (1994). Teacher’s Corner: Origin of the Scaling Constant d = 1.7 in Item Response Theory. Journal of Educational and Behavioral Statistics, 19(3), 293-295.

____________________

SURVEY PROGETTO
PRO-BENE-COMUNE
Università di Trieste

QR Code

oppure Link: https://dsvunits.qualtrics.com/jfe/form/SV_3JVFIafYxOgCUwC

RESPONSABILE SCIENTIFICO UNITS: PROF.SSA BARBARA PENOLAZZI

Referente per il Benessere Psicologico

Note. a) Rivolto a chi non ha mai compilato in precedenza la survey del progetto, sia a chi l’ha fatto l’anno scorso (per avere dati longitudinali); b) nel rispetto delle norme sulla privacy i dati saranno pseudonimizzati (non sarà possibile risalire ai nominativi originali)
- Select activity Lezione 5-6 MLA (Camilli 1993)
  
  Lezione 5-6 MLA (Camilli 1993) File PDF
- Select activity Lezione 5-6 MLA
  
  Lezione 5-6 MLA File R
- Select activity Teachers Corner Origin of the Scaling Constant d
  
  Teachers Corner Origin of the Scaling Constant d File PDF
Select section Lezione VI

Collapse Expand
Lezione VI
Venerdì 13 marzo 2026

11:00 - 13:00

Linguaggio di programmazione R: funzione repeat.

Analisi dell'articolo (conclusione e replica della procedura iterativa)

Camilli, G. (1994). Teacher’s Corner: Origin of the Scaling Constant d = 1.7 in Item Response Theory. Journal of Educational and Behavioral Statistics, 19(3), 293-295.
Select section Lezione VII

Collapse Expand
Lezione VII
Lunedì 16 marzo 26

13:00 - 16:00

Operazioni con vettori e matrici in R

Somma/differenza, prodotto interno/esterno tra vettori;

Somma/differenza, e prodotto tra matrici (e vettori) conformabili.

Matrice trasposta, matrice (quadrata) inversa e determinante di una matrice (quadrata).

Esempio applicativo in R: calcolo dei coefficienti di regressione lineare mediante operazione matriciale.

COMPITI: vedi file .pdf allegato
- Select activity Lezione 7 MLA
  
  Lezione 7 MLA File PDF
- Select activity Compiti sulle matrici in R
  
  Compiti sulle matrici in R File PDF
Select section Lezione VIII

Collapse Expand
Lezione VIII
Venerdì 20 marzo 2026

11:00 - 13:00

∗ Alcuni metodi iterativi per il calcolo della stima di verosimiglianza (Newton-Raphson, metodo dello scoring di Fisher).

∗ Applicazione sulla stime MLE per la distribuzione binomiale (p) e normale (μ e σ).
- Select activity Lezione 8 MLA
  
  Lezione 8 MLA File PDF
Select section Lezione IX

Collapse Expand
Lezione IX
Venerdì 27 marzo 2026

11:00 - 13:00

∗ Programmazione in R dei metodi iterativi 'Newton-Raphson' e 'scoring di Fisher' per il calcolo della stima di verosimiglianza di 'p' (binomie) e μ e σ (normale).

Compiti: consegnare lo script in R svolto durante la lezione (normale) + quello relativo alla binomiale (da svolgere in autonomia)
Select section Lezione X

Collapse Expand
Lezione X
lunedì 30 marzo 2026

13:00 - 16:00

Stima di massima verosimiglianza del modello lineare con errore normale.

COMPITI: a pg. 10 delle diapositive ci sono due esercizi di ripasso sul materiale presentato a lezione.
- Select activity Lezione 10 MLA
  
  Lezione 10 MLA File PDF
Select section Lezione XI

Collapse Expand
Lezione XI
Venerdì 10 aprile 2026

11:00 - 13:00

Il modello di regressione lineare: Stima iterativa con metodo di Fisher scoring – Applicazione in R.

Ritrovare i risultati della funzione glm() all'interno della procedura iterativa di massima verosimiglianza.
- Select activity Lezione 11 MLA
  
  Lezione 11 MLA File PDF
- Select activity Lezione 11
  
  Lezione 11 File R
Select section Lezione XII

Collapse Expand
Lezione XII
Lunedì 13 aprile 2026

13:00 - 16:00

Il modello lineare di probabilità ed il modello Logit: introduzione ed interpretazione dei parametri del modello.

Il modello Logit: stima di massima verosimiglianza (iterativa) dei parametri del modello.
- Select activity Lezione 12 MLA
  
  Lezione 12 MLA File PDF
Select section Lezione XIII

Collapse Expand
Lezione XIII
venerdì 17 aprile 2026

Il modello Logit: stima di massima verosimiglianza (iterativa) dei parametri del modello.

Residui nel modello GLM Logit e concetto di osservazione outlier: Deviance residuals, Raw and Pearson residuals.

Applicazione in linguaggio R

COMPITO:

Vedi all'interno delle diapositive della lezione.
- Select activity Lezione 13 MLA new
  
  Lezione 13 MLA new File PDF
- Select activity Lezione 13 MLA
  
  Lezione 13 MLA File R
Select section Lezione XIV

Collapse Expand
Lezione XIV
venerdì 24 aprile 11-13

"Sparse Data" e problemi di convergenza del modello: Discussione di tre casi (variabile x dicotomica, variabile x continua e due variabili x continue)

Inferenza sui parametri del modello di regressione logistica.

(a) Wald test; (b) Combinazioni lineari di coefficienti (metodo Delta + approfondimento); (c) Intervallo di fiducia per il Logit e la probabilità stimata; e (d) test Chi quadrato (LRT) per il confronto tra modello "nullo" ed "alternativo" (+ Approfondimento sul concetto di "Deviance")

Nota: La registrazione su Teams da un certo punto in poi non ha l'audio. A breve ne caricherò una "nuova".
- Select activity Lezione 14-15 MLA
  
  Lezione 14-15 MLA File PDF
- Select activity Lezione 14 MLA
  
  Lezione 14 MLA File R
Select section Lezione XV

Collapse Expand
Lezione XV
lunedì 27 aprile 13:00. - 16:00

(Continua...) Inferenza sui parametri del modello di regressione logistica.

(a) Wald test; (b) Combinazioni lineari di coefficienti (metodo Delta + approfondimento); (c) Intervallo di fiducia per il Logit e la probabilità stimata; e (d) test Chi quadrato (LRT) per il confronto tra modello "nullo" ed "alternativo" (+ Approfondimento sul concetto di "Deviance")
Select section Lezione XVI

Collapse Expand
Lezione XVI
lunedì 4 maggio 13:00 - 16:00

Simulazione con R:

Distribuzione Chi-quadrato

Distribuzione della differenza tra due variabili casuali indipendenti Chi-quadrato- Approssimazione normale

Distribuzione della differenza tra due variabili casuali non indipendenti (nested) Chi-quadrato

Distribuzione della differenza tra la (Residual) Deviance di un modello ridotto (nested) e un modello completo di regressione logistica - Approssimazione alla distribuzione Chi-quadrato con gradi di libertà pari al numero di predittori (coefficienti) rimossi nel modello ridotto.

Compiti per casa:

a) Utilizzando il "dataset08.RData" (oppure copia-incolla il file dataset08TABLET.txt, nel caso non fosse possibile caricare data set esterni su tablet) calcolare con R i Wald tests per tutti i coefficienti del modello "MHSUITHK ~ IRSEX + NDSSDNSP + DEPNDALC + DEPNDCOC + DEPNDHER + DEPNDANL + DEPNDSED + DEPNDSTM + DEPNDHAL + DEPNDINH + DEPNDMRJ + DEPNDTRN"

b) Confrontare mediante test LRT il modello precedente (completo) con un modello ridotto (nested) contenente solo i predittori IRSEX + DEPNDALC. Esplicitare ipotesi nulla e alternativa, commentare il p-valore ottenuto.

c.1) Mediante il metodo Delta, confrontare la differenza tra gli effetti stimati per cocaina ed eroina.

c.2) Confrontare la differenza tra l'effetto medio di cocaina ed eroina con l'effetto stimato per la marijuana. (Suggerimento: per creare effetti "medi" usare dei pesi nel vettore v pari a 1/k, dove k è il numero di coefficienti da mediare).

d.1) Calcolare l'intervallo di fiducia al 95% per la probabilità prevista di tentato suicidio nel caso di: "maschio", dipendente da abuso di alcool e cocaina.

d.2) Calcolare il medesimo intervallo di fiducia nel caso di una "femmina".
- Select activity dataset08
  
  dataset08 File
- Select activity Lezione 16 MLA
  
  Lezione 16 MLA File R
- Select activity dataset08TABLET
  
  dataset08TABLET File TXT
Select section Lezione XVII

Collapse Expand
Lezione XVII
venerdì 08 maggio 11-13

Introduzione alla teoria della detenzione del segnale (SDT):

L'esperimento "YES"/"NO", concetto di sensitività e bias di risposta

Le tabelle stimolo-risposta, classificazione delle risposte "YES" (Hit, False-alarm) e "No" (Miss, Correct rejections)

il d' (d prime) come misura di sensitività, esempi di calcolo in Excel

Compiti: 1.1-1.2-1.3-1.4 all'interno del .pdf
- Select activity Lezione 17 MLA
  
  Lezione 17 MLA File XLSX
- Select activity Lezione 17 MLA
  
  Lezione 17 MLA File PDF
Select section Lezione XVIII

Collapse Expand
Lezione XVIII
lunedì 11 maggio 13-16

Introduzione alla teoria della detenzione del segnale (SDT):

Lo spazio ROC e le curve di isosensitività (coppie (Hit; False-Alarm) con d' costante)

Lo spazio ROC in coordinate trasformate (punti z): interpretazione geometrica dell'indice di sensitività d'.

Esempi di calcolo in Excel

Compiti: 1.6-1.8-1.9-1.11 all'interno del .pdf
- Select activity Lezione 18 MLA
  
  Lezione 18 MLA File XLSX
- Select activity Lezione 18 MLA
  
  Lezione 18 MLA File PDF
Select section Lezione XIX

Collapse Expand
Lezione XIX
venerdì 15 maggio 11-13

CURVE ROC:

Concetto di AUC e applicazione nel modello Logit.
- Select activity Lezione 19
  
  Lezione 19 File R
- Select activity Lezione 19 MLA
  
  Lezione 19 MLA File PDF
Select section Lezione XX

Collapse Expand
Lezione XX
lunedì 18 maggio 14-16

CURVE ROC e modello Logit:

applicazione in R con il pacchetto "pROC"

Compiti per casa

Con il "dataset08.RData" stimare un modello contenente solo i predittori "IRSEX + DEPNDALC" ed uno contenente tutti i predittori tranne "IRSEX + DEPNDALC". Interpretare i coefficienti stimati di entrambi i modelli (scrivere brevemente l'effetto).

Confrontare la capacità di discriminazione dei modelli precedenti mediante l'indice AUC, calcolarne il d' associato ed interpretarlo. Disegnare le curve ROC dei due modelli.

Eseguire un test di DeLong per i due modelli precedenti ed interpretarlo.

Utilizzando il dataset "hcrabs" della libreria "rsq", identificare un numero ristretto ("parsimonioso") di predittori che abbia la stessa accuratezza classificatoria del modello completo, contenente tutti i predittori "color+spine+width+weight". Scrivete brevemente il processo analitico (corredato di grafici e test statistici inclusi) che vi ha condotto al modello finale.
- Select activity Lezione 20
  
  Lezione 20 File R

Section outline

Chiarimenti sulla modalità d'esame.