Bruno Scarpa Bruno Scarpa

Corso di Data Mining e Modelli di Regressione e Classificazione Moderna

 

PROGRAMMA   

Il corso si suddivide in una serie di sezioni logiche.:
 

Nozioni generali: motivazioni e contesto, contrasto tra aderenza ai dati e complessità del modello ovvero contrasto tra distorsione e varianza, tecniche generali per la selezione del modello.

 

Metodi di previsione di variabili quantitative:
Regressione lineare e metodi legati (modello lineare, GLM)
Smoothing e metodi di regressione non parametrica (metodo della regressione locale, splines di regressione, splines di lisciamento)
Modelli di regressione non parametrica strutturata (modelli additivi, alberi, reti neurali)

 

Metodi di classificazione:
Modelli lineari e generalizzazioni (regressione lineare e logistica, analisi discriminante lineare e quadratica)
Modelli strutturati (alberi, GAM, reti neurali)

 

Cenni a tecniche di recente sviluppo e a metodi di miglioramento di modelli (Boosting, Bagging, Random Forests)
Miscellanea: tecniche di visualizzazione dei dati, cenni ai metodi di raggruppamento.

CALENDARIO   

Il corso è impostato per essere svolto in un totale di 5 giornate:
 

Due giornate (16 ore) vengono dedicate alla presentazione in aula dei modelli e degli strumenti metodologici utili all’utilizzo concreto degli strumenti proposti.

 

Due mezze giornata (8 ore) sono utilizzate per la presentazione a laboratorio di esempi concreti di utilizzo degli strumenti presentati. Queste mezze giornate saranno possibilmente separate e posizionate una al termine della prima giornata e l’altra al termine della seconda giornata

 

Due giornate (16 ore - eventualmente separabili in 4 mezze giornate) volte all’esemplificazione sull’analisi di alcuni problemi concreti tipici del committente.

INFORMAZIONI
email: scarpa@stat.unipd.it


 © copyright 2004 Bruno Scarpa - All rights reserved.