Algoritmi per la clusterizzazione di dati geostatistici di tipo manifold

responsabile: Carlo Grillenzoni

responsabile: Carlo Grillenzoni

durata: 12 mesi

termine previsto: 31 dicembre 2017

finanziamento: 1.500 euro

tipologia: call di dipartimento

fonte di finanziamento: call 2016 Dppac

Linea di finanziamento 1.b “Progetti di ricerca”

 

descrizione del progetto

Dati numerici di tipo manifold sono comunemente presenti a livello geografico nei rilievi laser-scanner (LIDAR), nelle immagini telerilevate di zone urbanizzate (Ortofoto), nei cataloghi di fenomeni sismici (Epicentri). Questi dati descrivono oggetti spaziali molto complessi (come sagome di edifici, reticoli stradali o fluviali, faglie tettoniche), l’identificazione dei quali non può avvenire attraverso le comuni tecniche di interpolazione statistiche (tipo Splines) o geo-statistiche (tipo Kriging) dei dati. Tecniche di estrazione efficaci ma euristiche sono rappresentate dai metodi di clusterizzazione, dove in una prima fase si riduce il “rumore” dei dati attraverso medie locali, e nella seconda si proiettano i dati sulla superficie più vicina attraverso le componenti principali locali.

Estendendo l’approccio di Grillenzoni (2014), questo progetto propone di decomporre la nuvola di punti 3D da trattare in sottoinsiemi omogenei con tecniche di manifold clustering (Grillenzoni, 2016); ovvero di classificazione dei dati in gruppi morfologicamente omogenei (che trovano corrispondenze sostanziali in sottoinsiemi coerenti, quali faglie tettoniche indipendenti o assi stradali autonomi). Successivamente, ogni cluster viene trattato con tecniche di interpolazione non-parametriche che consentono di proiettare la struttura degli oggetti anche al di fuori dell’insieme di valori osservati. La struttura finale viene ottenuta assemblando le singoli componenti.

L'importanza e la novità del progetto consiste nella attuale mancanza di metodi numerici (statistici ed ingegneristici) per il filtraggio, l'interpolazione e la previsione spaziale di dati che sottendono superfici multiple intersecanti. Questo tema è ben presente anche nella geometria computazionale e nella grafica computerizzata relativamente alla rappresentazione di superfici tridimensionali sulla base di punti prefissati. Gli ambiti applicativi riguardano principalmente la geostatistica per il filtraggio di dati laser (Grillenzoni, 2007), e la geologia, per la rilevazione e la rappresentazione di sistemi di faglie tettoniche. Tuttavia, sono anche possibili applicazioni in ambito medico, per dati di risonanza ed ecografia relativi ad analisi endoscopiche sul corpo umano.

 

– Grillenzoni C (2007), Pattern Recognition via Robust Smoothing: application to laser data. «Australian Journal of Statistics», Vol. 49, N. 2, pp. 137-143 (Wiley)

– Grillenzoni C. (2014), Detection of Tectonic Faults by Spatial Clustering of Erthquakes. «Spatial Statistics» Vol. 7, N. 2, pp. 1230-1251 (Elsevier)

– Grillenzoni C. (2016), Design of Blurring Mean Shift Algorithms for Data Classification. «Journal of Classification», in press (Springer).