Grazie alla realizzazione di un’infrastruttura computazionale dedicata lo Spoke 7 mira a creare un ecosistema bioinformatico di dati e strumenti software all’avanguardia, completamente integrato con il nodo italiano di ELIXIR – l’Infrastruttura di Ricerca Europea per i dati delle Scienze della Vita – a supporto delle attività degli altri spoke orizzontali e verticali. La realizzazione di questo ecosistema bioinformatico svolge un duplice ruolo. In primo luogo, fornirà risultati basati sui dati disponibili potenzialmente in grado di indirizzare nuove ricerche e formulare ipotesi verificabili su nuovi potenziali bersagli terapeutici (ad esempio predizione di neoantigeni, nuove isoforme di splicing, RNA editati o modificati, strutture 3D o interazioni strutturali, pathways/reti, ecc.). In secondo luogo, contribuirà allo sviluppo di nuove terapie basate sull’RNA altamente personalizzate individuando soluzioni ottimali per integrare predizioni bioinformatiche in test e approcci sperimentali innovativi.
Il programma dello Spoke 7 include quattro Work Package paralleli (WP).
Il WP 7.1 sta realizzando un’infrastruttura IT sicura, conforme al GDPR (Regolamento europeo sulla protezione dei dati sensibili) e orientata ai dati FAIR (ritrovabili, accessibili, interoperabili e riutilizzabili). In particolare, il WP 7.1.1 ha l’obiettivo di identificare soluzioni di calcolo e archiviazione all’avanguardia per fornire strumenti software interoperabili e pronti all’uso. Il WP 7.1.2 si concentra sullo sviluppo di un ambiente bioinformatico allo stato dell’arte per la predizione e caratterizzazione di potenziali bersagli per terapie a RNA per diversi modelli di malattia, anche avvalendosi di studi a livello di singola cellula. Ulteriori attività includono lo sviluppo di una piattaforma per la progettazione razionale di RNA mirati su specifici geni (gRNA), basata su screening CRISPR ad alta efficienza.
Il WP 7.2 si focalizza sull’identificazione di neo-antigeni per lo sviluppo di vaccini a mRNA. Gli obiettivi principali di questo WP includono lo sviluppo di workflow computazionali che integrino dati DNA-Seq e RNA-Seq generati da piattaforme di sequenziamento massivo di seconda e terza generazione allo scopo di identificare e prioritizzare neo-antigeni prodotti da mutazioni, splicing alternativo e modifiche post-trascrizionali dell’RNA, considerando anche la loro affinità con i complessi HLA di tipo 1 e tipo 2. Un ulteriore obiettivo del WP 7.2 è lo sviluppo di nuovi metodi per identificare modifiche post-trascrizionali dell’RNA mediante analisi dei dati ottenuti dal sequenziamento diretto dell’RNA con tecnologia Nanopore.
Il WP 7.3 ha come obiettivo lo sviluppo di diversi approcci computazionali mirati allo studio conformazionale e delle interazioni 3D di sistemi con componenti a RNA. Tali approcci comprendono simulazioni di dinamiche molecolari e approcci di apprendimento automatico. Un altro approccio studia l’interazione di piccole molecole/peptidi con RNA specifici allo scopo di identificare farmaci candidati basati su RNA. Infine, sono investigati i meccanismi catalitici che coinvolgono molecole di RNA o sistemi macromolecolari con componenti a RNA anche attraverso l’analisi delle loro strutture mediante Cryo-EM.
Il WP 7.4 verte sulla biologia dei sistemi e sull’analisi integrata dei dati. In particolare, in questo WP sono sviluppati modelli di riferimento delle reti di regolazione genetica in contesti patologici e in altri contesti biologici. Il WP 7.4 sviluppa anche strumenti software basati sull’intelligenza artificiale per identificare e prioritizzare i potenziali bersagli dei farmaci a RNA e prevederne gli effetti. Il WP 7.4 comprende anche lo sviluppo di approcci di analisi integrata sfruttando complessi set di dati multi-omici per eseguire la stratificazione dei pazienti e l’identificazione dei fattori di vulnerabilità delle malattie. Infine, il WP 7.4 include approcci predittivi per caratterizzare su scala genomica il modo in cui le mutazioni alterano la rete di contatti regolatori dei geni con i loro regolatori (promotori, enhancer).
È in corso la costruzione di una grande infrastruttura computazionale dedicata alla Bioinformatica con grandi capacità di calcolo e archiviazione. Tale infrastruttura metterà a disposizione del Centro Nazionale un ricco portfolio di strumenti bioinformatici e risorse di dati all’avanguardia che si avvarranno di grandi risorse di calcolo che includeranno un “fat server” dotato di un numero molto grande di core con elevata capacità di memoria, un server GPU di ultima generazione in grado di velocizzare gli algoritmi ML/DL/AI, una soluzione di storage veloce basata su tecnologia in grado di minimizzare la latenza dei dati. Sarà inoltre fornita una Tape Library ad elevata capacità per la conservazione dei dati a lungo termine. Tutte le risorse sopra illustrate saranno accessibili agli utenti finali sia attraverso le normali interfacce HPC che con le tecnologie cloud più all’avanguardia.
Essendo orientato al Biocomputing, lo Spoke 7 assume un ruolo centrale al servizio degli altri spoke, anche fornendo accesso alla sua infrastruttura avanzata di calcolo dedicata (Spoke flagship). Si stanno inoltre sviluppando diverse collaborazioni con gli altri spoke orizzontali e verticali.
L’Università degli Studi di Bari Aldo Moro (UNIBA) collabora con lo Spoke 6 nel supportare l’attività computazionale per la profilazione dell’epitrascrittoma utilizzando dati provenienti da tecnologie di sequenziamento di terza generazione (in collaborazione con Francesco Nicassio presso IIT) e nella progettazione di RNA guida per mettere a punto tecniche di editing programmabile dell’RNA (in collaborazione con Ernesto Picardi, DBBA-UNIBA e Silvo Conticello, CNR). Anche l’ottimizzazione e l’aggiornamento delle risorse bioinformatiche esistenti per lo studio e le applicazioni dell’editing dell’RNA come il database REDIportal vengono condotti in collaborazione con Spoke 6.
L’Università di Padova (UNIPD) sta instaurando importanti collaborazioni scientifiche nel campo delle applicazioni della dinamica molecolare nel contesto della caratterizzazione strutturale della struttura degli RNA in soluzione e della loro interazione con bersagli terapeutici. Queste attività coinvolgono i gruppi di lavoro coordinati da Alessandra Magistrato (CNR) e Marco De Vivo (IIT). Si sta inoltre avviando una collaborazione con Giulio Vistoli (UNIMI) per lo sviluppo di nuovi approcci di docking molecolare.
Il Dipartimento di Farmacia dell’Università degli Studi di Napoli Federico II (UNINA) ha avviato una collaborazione con lo Spoke 6 per l’applicazione di approcci computazionali per caratterizzare strutture, dinamiche e meccanismi d’azione dei sistemi di RNA e con lo Spoke 8 per la sintesi di sistemi molecolari da utilizzare nello sviluppo di sistemi innovativi per il rilascio controllato di RNA terapeutici.
I Dipartimenti di Informatica e Bioscienze dell’Università degli Studi di Milano (UNIMI) stanno sviluppando, in collaborazione con gli Spoke verticali (Spoke 1-5) e con lo Spoke 9, una serie di metodi bioinformatici e di strumenti software per lo studio e le applicazioni nel contesto di diverse malattie. Il Dipartimento di Scienze Farmaceutiche dell’Università degli Studi di Milano (UNIMI) sta collaborando con Spoke 5 e Spoke 8 alla sintesi e valutazione biologica di oligonucleotidi basati su PNA e morfolino.