Secondo studi recenti, i cambiamenti climatici minacciano di portare all’estinzione tra il 15% ed il 37% delle specie viventi entro il 2050. E’ pertanto evidente la necessità di studiare tali fenomeni per valutarne l’impatto e suggerire possibili soluzioni alle figure politiche responsabili, come evidenziato anche dalla quarta relazione di valutazione del Gruppo Intergovernativo sui Cambiamenti Climatici (Intergovernmental Panel on Climate Change, IPCC) [J.Kerr É.ÓTuama S.Nativi P.Mazzetti H.Saarenmaa, 2009].
Tali valutazioni ed analisi richiedono infrastrutture tecnologiche in grado di integrare enormi volumi di informazioni provenienti da archivi di dati di biodiversità, di osservazione della Terra e di scenari di cambiamento climatico.
I requisiti principali per queste infrastrutture sono:
- Il supporto di funzionalità per l’interoperabilità multidisciplinare al fine di armonizzare le interfacce dei servizi e modelli di dati;
- Elevata scalabilità per consentire l’esecuzione di modelli complessi diversi per il cambiamento climatico e la distribuzione delle specie.
La prima questione è attualmente oggetto di diverse iniziative volte a fornire infrastrutture avanzate per la condivisione di risorse geospaziali e di Scienza della Terra, quali le attività di normalizzazione degli organismi internazionali come ISO e OGC (Open Geospatial Consortium), e le iniziative internazionali quali INSPIRE (Infrastructure for Spatial Information in Europe) e GMES (Global Monitoring for Environment and Security) in Europa, e GEO (Group on Earth Observation) a livello globale.
La scalabilità elevata invece potrebbe essere fornita, in linea di principio, dalle infrastrutture di calcolo distribuito concepite e realizzate negli ultimi dieci anni.
Sulla base di questo scenario e dei punti sopra esposti, la mia attività di tirocinio (per la laurea Triennale in Ingegneria dell’Informazione) si è focalizzata sul porting di un framework per la stima e la proiezione di modelli di nicchia ecologica (Ecological Niche Model, ENM) su una piattaforma di Cloud Computing per il calcolo distribuito. Per questo porting è stato quindi progettato e sviluppato un sistema in grado di interfacciarsi ai servizi di Cloud Computing forniti da Amazon in modo da parallelizzare i calcoli necessari a questo tipo di studi.
Qui di seguito una immagine che mostra a grandi linee l’architettura:
L’obiettivo dell’attività era la valutazione dei vantaggi del calcolo distribuito nell’elaborazione della distribuzione di specie in base a diversi scenari di cambiamento climatico. La disponibilità di potenza di calcolo on-demand fornita dalle infrastrutture di Cloud Computing rende infatti possibile elaborare in parallelo diversi scenari di cambiamento climatico, con più specie, e con l’utilizzo di diversi algoritmi.
L’attività è stata svolta presso il laboratorio ESSI-Lab (Earth and Space Science Informatics Laboratory) del CNR, nell’ambito della convenzione esistente con il PIN di Prato.
La realizzazione del progetto ha seguito alcune fasi principali. In primo luogo è stato necessario effettuare un’analisi preliminare. È stata analizzata l’architettura di calcolo distribuita Cloud Computing e gli strati dei servizi offerti, analizzando quale fosse utile al raggiungimento dello scopo preposto. Successivamente è stato analizzato il framework per lo studio dei modelli di nicchia ecologica chiamato Open Modeller. Si è analizzato il procedimento svolto dai ricercatori per la stima e la proiezione dei modelli di nicchia
ecologica fondamentale e si sono raccolte informazioni quali:
- La tipologia dei dati necessari;
- Le infrastrutture e le modalità necessarie per il reperimento dei dati;
- I comandi principali per l’utilizzo del framework Open Modeller.
Dopo aver analizzato questi fattori, sono stati realizzati alcuni esempi di stima e proiezione di modelli. Questi test hanno permesso di evidenziare le lacune, le limitazioni e i problemi che i ricercatori si trovano ad affrontare durante lo studio di modelli molto complessi.
Ottenuto un quadro generale dello scenario, si è proceduto alla progettazione dell’architettura di sistema. In base alla progettazione sono stati identificati gli attori del sistema da realizzare e, dopodiché, si è proceduto allo studio ed alla realizzazione del prototipo. Infine sono stati eseguiti alcuni test e la valutazione del risultato.
Il lavoro svolto è stato quindi presentato presso l’European Geosciences Union General Assembly 2011 ed è possibile avere un idea del prototipo di sistema implementato tramite questi due documenti:
Riferimenti:
J.Kerr É.ÓTuama S.Nativi P.Mazzetti H.Saarenmaa. (2009). Biodiversity and climate change use scenarios framework for the GEOSS interoperability pilot process. Eological Informatics , 4.