Principali interessi di ricerca:
Data mining e statistica
Nel mondo scientifico è ormai usuale avere a disposizione ingenti quantità di dati sia in termini di unità statistiche sia in termini di variabili disponibili (la rilevazione automatica di molte informazioni e il loro immagazzinamento permette la costituzione di grosse basi di dati utilizabili ai fini di ricerca) richiede allo statistico di individuare strumenti innovativi ma efficaci per il trattamento dei dati.
Un problema particolare che sto affrontando riguarda la classificazione in classi rare.
Un altro tema rilevante in questo contesto riguarda la presenza spesso di autocorrelazione tra le osservazioni, e ho avuto modo di affrontare tale problema nell’ambito dei Modelli Additivi Generalizzati.
L’ampia esperienza di analisi di grandi basi di dati attraverso strumenti di data mining mi spinto a produrre con Adelchi Azzalini, la monografia “
Metodi statistici per il marketing
Negli anni in cui ho lavorato nel marketing di grosse aziende del dei settori assicurativi e di telecomunicazione ho avuto modo di incrociare molti problemi legati all’analisi statistica di dati relativi ai prodotti/servizi e ai clienti delle aziende stesse.
L’innovazione tecnologica permette, infatti, oggi alle aziende di disporre di masse rilevanti di elementi di informazione che possono venire utilizzati per indirizzare le scelte strategiche e operative dell’azienda. In particolare molte aziende (ad esempio banche, assicurazioni, aziende di telecomunicazioni) hanno a disposizione informazioni dettagliate sui singoli clienti e sul loro utilizzo dei prodotti e servizi offerti.
Tra le varie attività di analisi di dati quantitativi particolarmente rilevanti sono stati:
(i) l’analisi dei comportamenti e la relativa modellazione statistica della Customer Base mirate all’anticipazione di bisogni di utilizzo dei servizi offerti dall’azienda.
(ii) La definizione di indicatori di propensione al churn, e la predisposizione di modelli statistici per la loro previsione e individuazione dei motivi che portano alla disattivazione.
(iii) Il Profiling e la segmentazione della Customer Base e dei visitatori dei siti/portali per ottenere gruppi di utenti omogenei.
(iv) Individuazione dei profili principali dei clienti rispetto all’utilizzo dei servizi di internet.
(v) Determinazione di azioni di marketing che l’azienda può effettuare per aumentare la fedeltà dei clienti e di azioni di up-sell e cross-sell.
(vi) Supporto quantitativo agli altri settori di marketing per le previsioni (per economics, budget, Business Plan e altro).
(vii) Analisi del rischio assicurativo nei rami danni.
Biometria del ciclo mestruale
Il ciclo mestruale è una delle principali funzioni biologiche che regola la riproduzione umana; l’utilizzo di tecnologie sempre più avanzate in campo medico ha permesso, negli ultimi cinquant’anni di studiare e di capire sempre meglio i complessi sistemi biologici del ciclo riproduttivo. L’analisi delle grandezze legate a tale ciclo ha poi molto spesso dei risvolti pratici nel comportamento delle persone per quanto riguarda l’attività sessuale e la vita riproduttiva.
Le problematiche di modellazione statistica sono molto complesse in particolare considerando le informazioni rilevabili attraverso strumenti non invasivi e relativamente economici. Nell’ambito di ricerche in questo campo ho affrontato alcune tematiche in particolare legate alla stima della probabilità di concepimento in un ciclo quando si hanno a disposizione informazioni ridotte. Tale problema può essere attraverso atraverso una modellazione frequentista o con un approccio bayesiano.
Sono interessanto anche agli aspetti comportamentali legati alla stima delle probabilità di concepimento. Recenti lavori affrontano attraverso un approccio decisionale bayesiano il problema di identificazione da parte delle coppie di una decisione che massimizzi la loro utilità nella scelta dei giorni in cui avere rapporti sessuali o dei comportamenti da assumere in termini di variabili epidemiologiche (fumo, alcool, caffe, ecc.).
Analisi spazio-temporale di dati ambientali
La concentrazione di sostanze chimiche presenti nell’atmosfera costituisce uno degli indicatori principali per la segnalazione di situazioni di inquinamento. L’analisi di tali dati è quindi un tema rilevante per il controllo dell’atmosfera. Nella tesi di dottorato mi sono concentrato principalmente nella identificazione e nella metodologia di stima di alcuni modelli per la previsione della concentrazione di sostanze inquinanti. A partire da tale problematica ho trattato alcuni aspetti particolari dell’analisi come l’identificazione di mappe spaziali nel lavoro, l’utilizzo di centraline mobili in una modellazione completamente stocastica, il posizionamento di nuove centraline attraverso un approccio non parametrico e l’effetto della presenza di dati mancanti.