|
|
Data mining e statistica
Nel mondo scientifico è ormai usuale avere a disposizione ingenti quantità
di dati sia in termini di unità statistiche
sia in termini di variabili disponibili (la rilevazione automatica di molte
informazioni e il loro immagazzinamento permette la costituzione di grosse
basi di dati utilizabili ai fini di ricerca) richiede allo statistico
di individuare strumenti innovativi ma efficaci per il trattamento dei dati.
Un problema particolare che sto affrontando riguarda la classificazione in classi
rare.
Un altro tema rilevante in questo contesto riguarda la presenza spesso di
autocorrelazione tra le osservazioni, e ho avuto modo di affrontare tale problema
nell'ambito dei Modelli Additivi Generalizzati.
L'ampia esperienza di analisi di grandi basi di dati attraverso strumenti
di data mining mi spinto a produrre con Adelchi Azzalini, la monografia
" |
|
Metodi statistici per il marketing
Negli anni in cui ho lavorato nel marketing di grosse aziende del
dei settori assicurativi e di telecomunicazione ho avuto modo di
incrociare molti problemi legati all'analisi statistica di dati
relativi ai prodotti/servizi e ai clienti delle aziende stesse.
L'innovazione tecnologica permette, infatti, oggi alle aziende di disporre
di masse rilevanti di elementi di
informazione che possono venire utilizzati per indirizzare le
scelte strategiche e operative dell'azienda. In particolare molte aziende
(ad esempio banche, assicurazioni, aziende di telecomunicazioni)
hanno a disposizione informazioni dettagliate sui singoli clienti
e sul loro utilizzo dei prodotti e servizi offerti.
Tra le varie attività di analisi di dati quantitativi particolarmente
rilevanti sono stati:
(i) l'analisi dei comportamenti e la relativa modellazione
statistica della Customer Base
mirate all'anticipazione di bisogni di utilizzo dei servizi offerti
dall'azienda.
(ii) La definizione di indicatori di propensione
al churn, e la predisposizione di modelli statistici per la
loro previsione e individuazione dei motivi che portano alla disattivazione.
(iii) Il Profiling e la segmentazione della Customer Base e
dei visitatori dei siti/portali per ottenere gruppi di utenti omogenei.
(iv) Individuazione dei profili principali dei clienti rispetto all'utilizzo dei
servizi di internet.
(v) Determinazione di azioni di marketing che l'azienda
può effettuare per aumentare la fedeltà dei clienti e di azioni di
up-sell e cross-sell.
(vi) Supporto quantitativo agli altri
settori di marketing per le previsioni (per economics, budget,
Business Plan e altro).
(vii) Analisi del rischio assicurativo nei rami danni.
|
|
Biometria del ciclo mestruale
Il ciclo mestruale è una delle principali funzioni biologiche che
regola la riproduzione umana; l'utilizzo di tecnologie sempre più
avanzate in campo medico ha permesso, negli ultimi cinquant'anni
di studiare e di capire sempre meglio i complessi sistemi biologici
del ciclo riproduttivo. L'analisi delle grandezze legate a tale ciclo
ha poi molto spesso dei risvolti pratici nel comportamento delle persone
per quanto riguarda l'attività sessuale e la vita riproduttiva.
Le problematiche di modellazione statistica sono molto complesse in
particolare considerando le informazioni rilevabili attraverso strumenti non
invasivi e relativamente economici. Nell'ambito di ricerche in questo campo
ho affrontato alcune tematiche in particolare legate alla stima della
probabilità di concepimento in un ciclo quando si hanno a disposizione
informazioni ridotte. Tale problema può essere attraverso atraverso
una modellazione frequentista o con un approccio bayesiano.
Sono interessanto anche agli aspetti comportamentali legati alla
stima delle probabilità di concepimento. Recenti lavori affrontano attraverso
un approccio decisionale
bayesiano il problema di identificazione da parte delle coppie di una decisione
che massimizzi la loro utilità nella scelta
dei giorni in cui avere rapporti sessuali o dei comportamenti da assumere in
termini di variabili epidemiologiche (fumo, alcool, caffe, ecc.).
|
|
Analisi spazio-temporale di dati ambientali
La concentrazione di sostanze chimiche presenti nell'atmosfera costituisce
uno degli indicatori principali per la segnalazione di situazioni di
inquinamento. L'analisi di tali dati è quindi un tema rilevante
per il controllo dell'atmosfera. Nella tesi di dottorato mi sono
concentrato principalmente nella identificazione e nella metodologia di stima
di alcuni modelli per la previsione della concentrazione di sostanze inquinanti.
A partire da tale problematica ho trattato alcuni aspetti particolari dell'analisi
come l'identificazione di mappe spaziali nel lavoro, l'utilizzo di
centraline mobili in una modellazione completamente stocastica,
il posizionamento di nuove centraline attraverso un approccio non parametrico
e l'effetto della presenza di dati mancanti.
| |