Skip to main content

Oncologia di precisione, serve un’analisi dei dati integrata e multimodale

Marco Filetti By 12 Novembre 2021No Comments
Speciali

Negli ultimi anni abbiamo assistito ad una incredibile espansione delle informazioni che è possibile raccogliere su ciascun paziente oncologico. Discipline come l’istologia, la genomica e la radiologia sono in grado di fornire oggi una mole di dati grezzi su ogni singolo campione tumorale, esame radiologico e campione istologico. L’esempio più eclatante di questa “infodemia” è l’impatto radicale generato dall’integrazione del dato molecolare in oncologia, che ha rivoluzionato il modo di far diagnosi, di stimare prognosi e sviluppare farmaci.

Tutte queste discipline descrivono il problema tumore da diversi punti di vista; singolarmente nessuna di esse è in grado di descrivere nella sua interezza la complessità del problema, ma dalla loro interazione può scaturire un livello più profondo di comprensione. Infatti la maggior parte degli approcci di analisi è oggi limitata ad un’unica tipologia di dati (istologici, clinici, radiologici, molecolari), lasciando gli approcci integrati tra le varie discipline relativamente sottosviluppati.

Nella Perspective pubblicata questo mese su “Nature Reviews Cancer” gli autori analizzano potenzialità, difficoltà tecniche e possibili futuri sviluppi di un’analisi dei dati integrata e multimodale. Infatti integrazione multimodale di diagnostica molecolare avanzata, imaging radiologico, istologico e dati clinici codificati offrono la imperdibile opportunità per far progredire l’oncologia di precisione oltre la genomica e le tecniche molecolari standard. Tuttavia per poter realmente sfruttare in pieno le potenzialità di questo tipo di approccio serve affrontare in maniera sistematica quelli che sono gli attuali limiti all’uso integrato dei dati. Il principale limite a questo tipo di analisi è sicuramente la scarsità di dati analizzabili. Ad esempio, il più grande set di dati oncologici multimodali, il TCGA, contiene modalità di dati limitate e solo poche centinaia di pazienti per tipo di tumore. Questa scarsità di dati impedisce ai ricercatori di utilizzare modelli di analisi dati avanzati rallentando uno sviluppo razionale di biomarcatori multimodello.

Inoltre molto spesso i dati sono raccolti in maniera imprecisa ed incompleta: la revisione retrospettiva della cartella clinica o la revisione manuale delle cartelle cliniche per estrarre funzionalità specifiche in fogli di calcolo sono infatti modalità di raccolta dati soggette ad errori e variabili e frequentemente è necessaria una revisione ripetuta per catturare nuovi eventi clinici. Per superare questo ostacolo sarà necessario sviluppare modelli per codificare automaticamente le informazioni cliniche da testo non strutturato. Un ulteriore rischio da evitare nel momento in cui i dati vengono integrati ed analizzati è l’overfitting, ovvero il rischio che il modello di analisi si adatti ai dati analizzati nella fase di training, divenendo meno affidabile nell’analizzare dati esterni.

La scoperta di biomarcatori tumorali multimodali scaturirà dall’integrazione tra oncologia clinica, ricerca ed ingegneria dei dati, discipline che fino ad oggi hanno operato quasi sempre separatamente. Per far avanzare il campo, i programmi di ricerca collaborativa dovranno unificare e promuovere un linguaggio comune tra le parti interessate attraverso la progettazione di una piattaforma e lo sviluppo di un modello condiviso. Una volta costruito questo linguaggio comune, tali programmi consentiranno ai ricercatori di porre domande incentrate sulla stratificazione dei pazienti e, in definitiva, di produrre una classe nuova di biomarcatori multimodali razionali e strumenti predittivi per perfezionare un’oncologia realmente basata sull’evidenza e la precisione.

Boehm KM, Khosravi P, Vanguri R et al. Harnessing multimodal data integration to advance precision oncology. Nat Rev Cancer 2021 DOI https://doi.org/10.1038/s41568-021-00408-3