mercoledì, Ottobre 8, 2025
Un modello generativo transformer per prevedere la storia naturale delle malattie

Un modello generativo transformer per prevedere la storia naturale delle malattie

Lo studio presenta Delphi-2M, un modello basato su transformer capace di prevedere simultaneamente l’incidenza futura di oltre 1.000 malattie, utilizzando dati clinici longitudinali. Per gli specialisti della salute ossea, Delphi-2M apre nuove strade: prevedere rischio di fratture, decadimento osseo correlato a comorbilità, personalizzare screening e interventi precoci basati su profilo complessivo di salute.

La salute ossea non vive isolata. Le condizioni come osteoporosi, fratture, osteopenia, oppure malattie metaboliche correlate (es. diabete, infezioni croniche, malattie infiammatorie) interagiscono con fattori demografici, stile di vita, condizioni comorbide. I modelli predittivi tradizionali tendono a concentrarsi su singole patologie (per esempio rischio di frattura, rischio di osteoporosi secondo densità ossea, ecc.). Ma la forza clinica e la fragilità dipendono da più fattori coesistenti e dal modo in cui evolvono nel tempo.

Lo studio “Learning the natural history of human disease with generative transformers” si inserisce in questo contesto, mettendo a punto Delphi-2M, un modello che guarda all’intero spettro di malattie (~1.000 diagnosi top-level ICD-10) e all’evoluzione temporale (quando le diagnosi si presentano) in modo generativo, ossia capace di produrre simulazioni di traiettorie di malattia individuali, basate sulla storia di ciascun individuo.

Che cosa è Delphi-2M: struttura, dati, modalità predittive

  • Architettura: Delphi-2M usa una variante del modello GPT-2, adattata per dati clinici: ogni “evento” è una diagnosi in ICD-10 (livello top-level), integrata da token che rappresentano sesso, BMI, abitudine al fumo, consumo di alcool e “no event” padding per tenere conto dei periodi privi di diagnosi. Il modello predice il prossimo evento di malattia e il tempo entro il quale esso si presenterà.

  • Dati di addestramento e validazione:
    • UK Biobank: ~402.800 individui usati per l’addestramento; circa 100.600 per la validazione interna. 
    • Dati danesi: ~1,93 milioni di persone dai registri nazionali, usati come test esterno.

  • Output predittivi:
    • Predizione simultanea di incidenza di migliaia di malattie.
    • Simulazione di traiettorie sanitarie individuali, a partire da un determinato punto temporale (per esempio all’età di 60 anni) fino a 20 anni dopo. 
    • Valutazione del rischio individuale tenendo conto non solo dell’età e del sesso, ma anche della storia passata di malattia, stile di vita, BMI, ecc.

  • Performance:
    • AUC (Area Under ROC Curve): mediamente ~0,76 nei dati di validazione interna per le diagnosi future; valori inferiori ma ancora solidi nei dati danesi (~0,67). 
    • Buona calibrazione: il modello non solo distingue bene tra alto e basso rischio, ma le probabilità previste tendono a rispecchiare le incidenze osservate.

Cosa emerge dalle traiettorie simulate: insight utili per salute ossea

Anche se lo studio non è specifico per le patologie ossee, le modalità di Delphi-2M offrono spunti molto rilevanti per l’osteologia e la medicina delle ossa.

  1. Comorbilità che influenzano il rischio osseo:
    Le malattie metaboliche, infettive, endocrine o cardiovascolari (diabete, malattie renali, disturbi infiammatori cronici, ecc.) possono comparire prima delle condizioni ossee o concorrere con esse, alterando i percorsi di perdita di massa ossea o di rischio di frattura. Un modello che incorpora la storia di queste condizioni può meglio stimare il rischio futuro osseo anche in assenza, per ora, di dati ossei specifici.

  2. Influenza temporale degli eventi precedenti:
    Delphi-2M permette di quantificare quanto certi eventi aumentano il rischio di altre malattie o di mortalità nel tempo. Ad esempio, la diagnosi di tumore può avere effetto prolungato sulla mortalità; eventi acuti come sepsi o infarto hanno effetti più marcati ma che tendono a decrescere nel tempo. Se si potessero aggiungere dati su fratture, densità ossea, terapia ormonale, farmaci antiresorptivi o altri interventi, si potrebbe modellare quanta parte del rischio osseo è dovuto a queste variabili.

  3. Simulazioni previsionali e stratificazione del rischio:
    Per pazienti con diagnosi multiple, o con stili di vita a rischio (es. BMI alto o basso, fumo, consumo di alcool), Delphi-2M mostra che le traiettorie simulate divergono notevolmente a seconda degli input. Ciò suggerisce che, anche per la salute ossea, interventi precoci (modifiche dello stile di vita, terapie preventive) potrebbero avere impatti misurabili sul lungo periodo, se incorporati nei modelli.

Limiti, bias e cautela interpretativa

  • Bias dei dati: il campione UK Biobank soffre di “healthy volunteer bias” (i partecipanti tendono a essere più sani, più istruiti, più facoltosi). Ciò può portare a sottostimare la malattia in popolazioni più fragili.

  • Completezza delle diagnosi: mancano informazioni uguali per tutti i soggetti su certi eventi clinici, su livelli di cura primaria vs ospedaliera, e non tutte le malattie sono registrate con la stessa precisione.

  • Mancanza, per ora, di dati ossei specifici: densità minerale ossea (BMD), storia di fratture, terapie farmacologiche anti-osteoporosi ecc. non sono inclusi nello studio. Questo limita per ora la capacità di fare previsioni specifiche per l’osteoporosi o rischio frattura.

  • Non causalità: le associazioni temporali e le dipendenze apprese non equivalgono a causalità. L’identificazione di un aumento del rischio dopo una malattia non significa che intervenire su quella malattia ridurrà necessariamente quel rischio, senza prove specifiche.

Implicazioni cliniche e per la salute ossea

Per gli operatori nel campo delle ossa, come endocrinologi, reumatologi, fisiatri, geriatri, ortopedici, le opportunità sono:

  • Screening precoce e personalizzazione: usare modelli che integrano storia pregressa di malattie per identificare pazienti che, magari non hanno densità ossea particolarmente bassa al momento, ma hanno altri fattori che predicono un peggioramento futuro o un rischio fratturativo elevato.

  • Monitoraggio e interventi mirati: stratificare rischio su base multipla – non solo densitometria, ma comorbilità, stile di vita, BMI, abuso di alcol/fumo ecc. – per decidere quando iniziare terapia farmacologica o preventiva.

  • Politiche sanitarie e risorse: prevedere il carico futuro di malattie, compresi i danni ossei secondari, per allocare risorse (fratture, ricoveri ortopedici, riabilitazione).

  • Ricerca dedicata: l’estensione del modello includendo biomarcatori ossei, dati radiologici, storia di fratture permetterebbe di costruire versioni specifiche per la salute ossea che potrebbero essere usate come decision support system per le fratture, la perdita ossea, ecc.

Conclusione

Delphi-2M rappresenta un passo avanti significativo nella modellizzazione predittiva multidimensionale delle malattie, permettendo di osservare non solo “cosa può succedere” ma “in che ordine”, “in quanto tempo”, e come le malattie interagiscono nel tempo. Per il campo della salute ossea, le potenzialità sono grandi, ma c’è bisogno di integrare dati ossei specifici per arrivare a modelli che possano predire rischio fratturativo, perdita ossea accelerata, e valutare l’impatto degli interventi precoci.

Fonte

Shmatko, A., Jung, A.W., Gaurav, K. et al. Learning the natural history of human disease with generative transformersNature (2025). https://doi.org/10.1038/s41586-025-09529-3

ARTICOLI RECENTI

Articoli correlati