Fin dalla nascita di IBM Watson nel 2007, gli esseri umani hanno continuato a impegnarsi nello sviluppo dell'intelligenza artificiale (IA) in ambito medico. Un sistema di IA medica potente e utilizzabile ha un enorme potenziale per rimodellare tutti gli aspetti della medicina moderna, consentendo un'assistenza più intelligente, accurata, efficiente e inclusiva, portando benessere a operatori sanitari e pazienti e migliorando così significativamente la salute umana. Negli ultimi 16 anni, sebbene i ricercatori nel campo dell'IA medica si siano concentrati in vari campi di ricerca, a questo punto non sono ancora riusciti a trasformare la fantascienza in realtà.
Quest'anno, con lo sviluppo rivoluzionario della tecnologia AI come ChatGPT, l'AI medica ha compiuto grandi progressi sotto molti aspetti. Una svolta senza precedenti nelle capacità dell'AI medica: la rivista Nature ha costantemente avviato la ricerca sul modello di linguaggio ampio per la medicina e sul modello di base per le immagini mediche; Google ha rilasciato Med-PaLM e il suo successore, raggiungendo un livello di competenza elevato nelle domande d'esame per medici statunitensi. Le principali riviste accademiche si concentreranno sull'AI medica: Nature ha pubblicato le prospettive sul modello di base dell'AI medica generale; dopo una serie di revisioni dell'AI in medicina all'inizio di quest'anno, il New England Journal of Medicine (NEJM) ha pubblicato la sua prima revisione sulla salute digitale il 30 novembre e ha lanciato il primo numero della sottorivista NEJM AI il 12 dicembre. Il terreno di atterraggio dell'AI medica è ulteriormente maturo: la sottorivista JAMA ha pubblicato l'iniziativa globale per la condivisione dei dati delle immagini mediche; la Food and Drug Administration (FDA) statunitense sta sviluppando una bozza di linee guida per la regolamentazione dell'AI medica.
Di seguito, esaminiamo i progressi significativi che i ricercatori di tutto il mondo hanno compiuto nella direzione dell'intelligenza artificiale medica utilizzabile nel 2023.
Modello base dell'intelligenza artificiale medica
La costruzione di un modello di base di intelligenza artificiale in ambito medico è senza dubbio l'obiettivo di ricerca più importante di quest'anno. Le riviste Nature hanno pubblicato articoli di revisione sul modello di base universale dell'assistenza sanitaria e sul modello di linguaggio esteso dell'assistenza sanitaria nel corso dell'anno. Medical Image Analysis, la rivista leader del settore, ha esaminato e analizzato le sfide e le opportunità della ricerca sui modelli di base nell'analisi delle immagini mediche e ha proposto il concetto di "pedigree del modello di base" per riassumere e guidare lo sviluppo della ricerca sui modelli di base dell'intelligenza artificiale in ambito medico. Il futuro dei modelli di intelligenza artificiale in ambito sanitario sta diventando più chiaro. Basandosi sugli esempi di successo di modelli di linguaggio estesi come ChatGPT, utilizzando metodi di pre-addestramento auto-supervisionati più avanzati e una vasta raccolta di dati di addestramento, i ricercatori nel campo dell'intelligenza artificiale in ambito medico stanno cercando di costruire 1) modelli di base specifici per malattia, 2) modelli di base generali e 3) modelli di grandi dimensioni multimodali che integrano un'ampia gamma di modalità con parametri massivi e capacità superiori.
Modello di intelligenza artificiale per l'acquisizione di dati medici
Oltre ai grandi modelli di intelligenza artificiale che svolgono un ruolo fondamentale nelle attività di analisi dei dati clinici a valle, anche nell'acquisizione dei dati clinici a monte si è affermata la tecnologia rappresentata dai modelli di intelligenza artificiale generativa. Il processo, la velocità e la qualità dell'acquisizione dei dati possono essere significativamente migliorati dagli algoritmi di intelligenza artificiale.
All'inizio di quest'anno, Nature Biomedical Engineering ha pubblicato uno studio della Straits University in Turchia, incentrato sull'utilizzo dell'intelligenza artificiale generativa per risolvere il problema della diagnosi patologica assistita da immagini nelle applicazioni cliniche. Gli artefatti presenti nei tessuti congelati durante l'intervento chirurgico rappresentano un ostacolo alla rapida valutazione diagnostica. Sebbene il tessuto incluso in formalina e paraffina (FFPE) fornisca un campione di qualità superiore, il suo processo di produzione è lungo e spesso richiede dalle 12 alle 48 ore, rendendolo inadatto all'uso in chirurgia. Il team di ricerca ha quindi proposto un algoritmo chiamato AI-FFPE, in grado di rendere l'aspetto del tessuto nella sezione congelata simile a quello della FFPE. L'algoritmo ha corretto con successo gli artefatti delle sezioni congelate, migliorato la qualità dell'immagine e mantenuto le caratteristiche clinicamente rilevanti. Nella validazione clinica, l'algoritmo AI-FFPE migliora significativamente l'accuratezza diagnostica dei patologi per i sottotipi tumorali, riducendo notevolmente i tempi di diagnosi clinica.
Cell Reports Medicine riporta un lavoro di ricerca condotto da un team del Third Clinical College dell'Università di Jilin, del Dipartimento di Radiologia, dell'Ospedale Zhongshan affiliato all'Università di Fudan e dell'Università di Scienza e Tecnologia di Shanghai [25]. Questo studio propone un framework di fusione di ricostruzione iterativa e apprendimento profondo di uso generale (Hybrid DL-IR) con elevata versatilità e flessibilità, che mostra eccellenti prestazioni di ricostruzione delle immagini in MRI veloce, TC a bassa dose e PET veloce. L'algoritmo può ottenere una scansione multisequenza di singolo organo MR in 100 secondi, ridurre la dose di radiazioni a solo il 10% dell'immagine TC ed eliminare il rumore, e può ricostruire piccole lesioni dall'acquisizione PET con un'accelerazione da 2 a 4 volte, riducendo al contempo l'effetto degli artefatti da movimento.
Intelligenza artificiale medica in collaborazione con gli operatori sanitari
Il rapido sviluppo dell'intelligenza artificiale in ambito medico ha inoltre portato i professionisti del settore a valutare e valutare seriamente come collaborare con l'intelligenza artificiale per migliorare i processi clinici. A luglio di quest'anno, DeepMind e un team di ricerca multi-istituzionale hanno proposto congiuntamente un sistema di intelligenza artificiale chiamato Complementary Driven Clinical Workflow Delay (CoDoC). Il processo diagnostico viene prima diagnosticato da un sistema di intelligenza artificiale predittiva, poi valutato da un altro sistema di intelligenza artificiale in base al risultato precedente e, in caso di dubbio, la diagnosi viene infine formulata da un medico per migliorare l'accuratezza diagnostica e bilanciare l'efficienza. Per quanto riguarda lo screening del cancro al seno, CoDoC ha ridotto i tassi di falsi positivi del 25% a parità di falsi negativi, riducendo al contempo il carico di lavoro del medico del 66%, rispetto all'attuale processo di "arbitraggio a doppia lettura" nel Regno Unito. In termini di classificazione della tubercolosi, i tassi di falsi positivi sono stati ridotti dal 5 al 15% a parità di falsi negativi rispetto all'intelligenza artificiale indipendente e ai flussi di lavoro clinici.
Analogamente, Annie Y. Ng et al., della Kheiron Company di Londra, Regno Unito, hanno introdotto ulteriori lettori di intelligenza artificiale (in collaborazione con esaminatori umani) per riesaminare i risultati in assenza di risultati di richiamo nel processo di arbitrato a doppia lettura, il che ha migliorato il problema della mancata rilevazione nello screening precoce del cancro al seno e il processo non ha avuto quasi nessun falso positivo. Un altro studio, condotto da un team della McGovern Medical School dell'Università del Texas e completato in quattro centri per l'ictus, ha applicato la tecnologia di intelligenza artificiale basata sull'angiografia con tomografia computerizzata (CTA) per automatizzare il rilevamento di ictus ischemico occlusivo vascolare (LVO) di grandi dimensioni. Medici e radiologi ricevono avvisi in tempo reale sui loro telefoni cellulari entro pochi minuti dal completamento dell'imaging TC, che li informano della possibile presenza di LVO. Questo processo di intelligenza artificiale migliora i flussi di lavoro ospedalieri per l'ictus ischemico acuto, riducendo il tempo dall'ingresso in ospedale all'inguine, dall'ammissione al trattamento, e offrendo opportunità di salvataggio di successo. I risultati sono pubblicati su JAMA Neurology.
Un modello di assistenza sanitaria basato sull'intelligenza artificiale per un beneficio universale
Il 2023 vedrà anche un notevole sviluppo dell'intelligenza artificiale in ambito medico, che consentirà di individuare caratteristiche invisibili all'occhio umano a partire da dati più facilmente reperibili, consentendo così una diagnosi universale e uno screening precoce su larga scala. All'inizio dell'anno, Nature Medicine ha pubblicato studi condotti dallo Zhongshan Eye Center dell'Università Sun Yat-sen e dal Secondo Ospedale Affiliato dell'Università Medica del Fujian. Utilizzando gli smartphone come terminali applicativi, hanno utilizzato immagini video simili a cartoni animati per indurre lo sguardo dei bambini e registrarne il comportamento dello sguardo e i tratti del viso, e hanno ulteriormente analizzato modelli anomali utilizzando modelli di deep learning per identificare con successo 16 patologie oculari, tra cui cataratta congenita, ptosi congenita e glaucoma congenito, con un'accuratezza media di screening superiore all'85%. Ciò fornisce un mezzo tecnico efficace e di facile diffusione per lo screening precoce su larga scala dei deficit visivi infantili e delle patologie oculari correlate.
Alla fine dell'anno, Nature Medicine ha pubblicato un lavoro condotto da oltre 10 istituti medici e di ricerca in tutto il mondo, tra cui lo Shanghai Institute of Pancreatic Disease e il First Affiliated Hospital dell'Università di Zhejiang. L'autore ha applicato l'intelligenza artificiale allo screening del cancro al pancreas di persone asintomatiche presso centri di visita medica, ospedali, ecc., per rilevare le caratteristiche delle lesioni nelle immagini TC a scansione semplice, difficili da rilevare a occhio nudo, in modo da ottenere una diagnosi precoce efficiente e non invasiva del cancro al pancreas. Esaminando i dati di oltre 20.000 pazienti, il modello ha anche identificato 31 casi di lesioni clinicamente non rilevate, migliorando significativamente i risultati clinici.
Condivisione dei dati medici
Nel 2023, in tutto il mondo sono emersi molti altri meccanismi di condivisione dei dati perfetti e casi di successo, che garantiscono la cooperazione multicentrica e l'apertura dei dati, nel rispetto della tutela della privacy e della sicurezza dei dati.
In primo luogo, con l'aiuto della tecnologia AI stessa, i ricercatori di AI hanno contribuito alla condivisione di dati medici. Qi Chang e altri della Rutgers University negli Stati Uniti hanno pubblicato un articolo su Nature Communications, proponendo un framework di apprendimento federale DSL basato su reti avversarie sintetiche distribuite, che utilizza l'AI generativa per addestrare i dati generati specifici di centri multipli, e quindi sostituire i dati reali di centri multipli con i dati generati. Garantire l'addestramento dell'AI basato su big data multicentrici, proteggendo al contempo la privacy dei dati. Lo stesso team ha anche reso open source un set di dati di immagini patologiche generate e le relative annotazioni. Il modello di segmentazione addestrato sul set di dati generato può ottenere risultati simili a quelli dei dati reali.
Il team di Dai Qionghai della Tsinghua University ha pubblicato un articolo su npj Digital Health, proponendo Relay Learning, che utilizza big data multi-sito per addestrare modelli di intelligenza artificiale, basandosi sulla sovranità dei dati locali e sull'assenza di connessioni di rete tra siti. Questo sistema bilancia la sicurezza dei dati e le preoccupazioni relative alla privacy con il perseguimento delle prestazioni dell'intelligenza artificiale. Lo stesso team ha successivamente sviluppato e convalidato congiuntamente CAIMEN, un sistema diagnostico per tumori pan-mediastinici mediante TC del torace basato sull'apprendimento federale, in collaborazione con il Primo Ospedale Affiliato dell'Università Medica di Guangzhou e 24 ospedali in tutto il paese. Il sistema, applicabile a 12 tumori mediastinici comuni, ha ottenuto un'accuratezza diagnostica migliore del 44,9% se utilizzato da solo rispetto a quando utilizzato da soli esperti umani, e un'accuratezza diagnostica migliore del 19% quando gli esperti umani sono stati assistiti dal sistema.
D'altro canto, sono in corso diverse iniziative per costruire set di dati medici sicuri, globali e su larga scala. Nel novembre 2023, Agustina Saenz e altri del Dipartimento di Informatica Biomedica della Harvard Medical School hanno pubblicato online su Lancet Digital Health un framework globale per la condivisione di dati di immagini mediche chiamato Artificial Intelligence Data for All Healthcare (MAIDA). Stanno collaborando con organizzazioni sanitarie di tutto il mondo per fornire una guida completa sulla raccolta e la de-identificazione dei dati, utilizzando il modello US Federal Demonstration Partner (FDP) per standardizzare la condivisione dei dati. Prevedono di rilasciare gradualmente set di dati raccolti in diverse regioni e contesti clinici in tutto il mondo. Il primo set di dati dovrebbe essere rilasciato all'inizio del 2024, con altri in arrivo con l'espansione della partnership. Il progetto rappresenta un importante tentativo di costruire un set globale, su larga scala e diversificato di dati di intelligenza artificiale disponibili al pubblico.
Sulla scia della proposta, la UK Biobank ha dato l'esempio. Il 30 novembre, la UK Biobank ha pubblicato nuovi dati derivanti dal sequenziamento dell'intero genoma dei suoi 500.000 partecipanti. Il database, che pubblica la sequenza completa del genoma di ciascuno dei 500.000 volontari britannici, è il più grande database completo del genoma umano al mondo. Ricercatori di tutto il mondo possono richiedere l'accesso a questi dati anonimizzati e utilizzarli per indagare le basi genetiche della salute e delle malattie. In passato, i dati genetici sono sempre stati estremamente sensibili per la verifica, e questo storico risultato della UK Biobank dimostra che è possibile costruire un database globale su larga scala, aperto e senza privacy. Con questa tecnologia e questo database, l'intelligenza artificiale in campo medico è destinata a inaugurare il prossimo balzo in avanti.
Verifica e valutazione dell'intelligenza artificiale medica
Rispetto al rapido sviluppo della tecnologia di intelligenza artificiale in ambito medico, lo sviluppo della verifica e della valutazione dell'intelligenza artificiale in ambito medico è leggermente lento. La convalida e la valutazione nel campo dell'intelligenza artificiale in generale spesso ignorano le reali esigenze di medici e pazienti in termini di intelligenza artificiale. I tradizionali studi clinici randomizzati controllati sono troppo laboriosi per eguagliare la rapida iterazione degli strumenti di intelligenza artificiale. Migliorare il prima possibile il sistema di verifica e valutazione adatto agli strumenti di intelligenza artificiale in ambito medico è la cosa più importante per promuovere l'intelligenza artificiale in ambito medico e far davvero un balzo in avanti nella ricerca e sviluppo per approdare alla pratica clinica.
Nel documento di ricerca di Google su Med-PaLM, pubblicato su Nature, il team ha anche pubblicato il benchmark di valutazione MultiMedQA, utilizzato per valutare la capacità di modelli linguistici di grandi dimensioni di acquisire conoscenze cliniche. Il benchmark combina sei set di dati esistenti di domande e risposte mediche professionali, che coprono conoscenze mediche professionali, ricerca e altri aspetti, nonché un set di dati di database di domande mediche di ricerca online, che considera le domande e risposte online tra medico e paziente, cercando di addestrare l'IA a diventare un medico qualificato sotto molti aspetti. Inoltre, il team propone un framework basato sulla valutazione umana che tiene conto di molteplici dimensioni di fatti, comprensione, ragionamento e possibili distorsioni. Questo è uno degli sforzi di ricerca più rappresentativi per valutare l'IA in ambito sanitario pubblicati quest'anno.
Tuttavia, il fatto che i modelli linguistici di grandi dimensioni mostrino un elevato livello di codifica delle conoscenze cliniche significa che siano competenti per le attività cliniche del mondo reale? Proprio come uno studente di medicina che supera l'esame di abilitazione alla professione medica con un punteggio perfetto è ancora lontano dall'essere un primario autonomo, i criteri di valutazione proposti da Google potrebbero non essere una risposta perfetta al tema della valutazione dell'intelligenza artificiale medica per i modelli di intelligenza artificiale. Già nel 2021 e nel 2022, i ricercatori hanno proposto linee guida di reporting come Decid-AI, SPIRIT-AI e INTRPRT, sperando di guidare lo sviluppo e la convalida iniziali dell'intelligenza artificiale medica a condizione di considerare fattori come la praticità clinica, la sicurezza, i fattori umani e la trasparenza/interpretabilità. Di recente, la rivista Nature Medicine ha pubblicato uno studio condotto da ricercatori dell'Università di Oxford e dell'Università di Stanford sull'opportunità di utilizzare la "validazione esterna" o la "validazione locale ricorrente" per convalidare gli strumenti di intelligenza artificiale.
La natura imparziale degli strumenti di intelligenza artificiale è anche un'importante direzione di valutazione che ha ricevuto attenzione quest'anno sia da articoli di Science che del NEJM. L'intelligenza artificiale presenta spesso bias perché è limitata ai dati di addestramento. Questo bias può riflettere la disuguaglianza sociale, che si evolve ulteriormente in discriminazione algoritmica. I National Institutes of Health hanno recentemente lanciato l'iniziativa Bridge2AI, dal costo stimato di 130 milioni di dollari, per costruire set di dati diversificati (in linea con gli obiettivi dell'iniziativa MAIDA sopra menzionati) che possono essere utilizzati per convalidare l'imparzialità degli strumenti di intelligenza artificiale in ambito medico. Questi aspetti non sono considerati da MultiMedQA. La questione di come misurare e convalidare i modelli di intelligenza artificiale in ambito medico necessita ancora di una discussione ampia e approfondita.
A gennaio, Nature Medicine ha pubblicato un articolo d'opinione intitolato "La prossima generazione della medicina basata sulle prove" di Vivek Subbiah dell'MD Anderson Cancer Center dell'Università del Texas, che esamina i limiti degli studi clinici emersi nel contesto della pandemia di COVID-19 e sottolinea la contraddizione tra innovazione e aderenza al processo di ricerca clinica. Infine, l'articolo delinea un futuro di ristrutturazione degli studi clinici: la prossima generazione di studi clinici che utilizzano l'intelligenza artificiale, ovvero l'uso dell'intelligenza artificiale a partire da un gran numero di dati di ricerca storici, dati del mondo reale, dati clinici multimodali e dati di dispositivi indossabili per trovare evidenze chiave. Ciò significa che la tecnologia dell'intelligenza artificiale e i processi di convalida clinica dell'intelligenza artificiale potrebbero rafforzarsi a vicenda e co-evolversi in futuro? Questa è la domanda aperta e stimolante del 2023.
Regolamentazione dell'intelligenza artificiale medica
L'avanzamento della tecnologia AI pone sfide anche alla regolamentazione dell'AI, e i decisori politici di tutto il mondo stanno rispondendo con attenzione e cautela. Nel 2019, la FDA ha pubblicato per la prima volta una Proposta di Quadro Regolamentare per le Modifiche Software ai Dispositivi Medici basati sull'Intelligenza Artificiale (Bozza di Discussione), che descrive in dettaglio il suo potenziale approccio alla revisione pre-commercializzazione delle modifiche software basate sull'AI e sull'apprendimento automatico. Nel 2021, la FDA ha proposto il "Piano d'Azione per il Software basato sull'Intelligenza Artificiale/Apprendimento Automatico come Dispositivo Medico", che ha chiarito cinque specifiche misure normative mediche per l'AI. Quest'anno, la FDA ha ripubblicato la Presentazione Pre-commercializzazione per le Caratteristiche Software dei Dispositivi per fornire informazioni sulle raccomandazioni per la presentazione pre-commercializzazione per la valutazione da parte della FDA della sicurezza e dell'efficacia delle caratteristiche software dei dispositivi, comprese alcune caratteristiche software dei dispositivi che utilizzano modelli di apprendimento automatico addestrati tramite metodi di apprendimento automatico. La politica normativa della FDA si è evoluta da una proposta iniziale a una guida pratica.
In seguito alla pubblicazione dell'European Health Data Space nel luglio dello scorso anno, l'UE ha nuovamente promulgato l'Artificial Intelligence Act. Il primo mira a sfruttare al meglio i dati sanitari per fornire un'assistenza sanitaria di alta qualità, ridurre le disuguaglianze e supportare i dati per la prevenzione, la diagnosi, il trattamento, l'innovazione scientifica, il processo decisionale e la legislazione, garantendo al contempo ai cittadini dell'UE un maggiore controllo sui propri dati sanitari personali. Il secondo chiarisce che il sistema di diagnosi medica è un sistema di intelligenza artificiale ad alto rischio e che è necessario adottare una supervisione mirata e rigorosa, una supervisione dell'intero ciclo di vita e una supervisione pre-valutazione. L'Agenzia europea per i medicinali (EMA) ha pubblicato una bozza di documento di riflessione sull'uso dell'IA a supporto dello sviluppo, della regolamentazione e dell'uso dei farmaci, con particolare attenzione al miglioramento della credibilità dell'IA per garantire la sicurezza dei pazienti e l'integrità dei risultati della ricerca clinica. Nel complesso, l'approccio normativo dell'UE sta gradualmente prendendo forma e i dettagli di attuazione finali potrebbero essere più dettagliati e rigorosi. In netto contrasto con la rigorosa regolamentazione dell'UE, il progetto normativo sull'intelligenza artificiale del Regno Unito chiarisce che il governo intende adottare un approccio morbido e, per il momento, non promulgare nuove leggi né istituire nuovi enti di regolamentazione.
In Cina, il Medical Device Technical Review Center (NMPA) della National Medical Products Administration ha precedentemente pubblicato documenti quali "Punti di revisione del software decisionale assistito da apprendimento profondo", "Principi guida per la revisione della registrazione dei dispositivi medici di intelligenza artificiale (bozza per commento)" e "Circolare sui principi guida per la classificazione e la definizione dei prodotti software medici di intelligenza artificiale (n. 47 nel 2021)". Quest'anno è stato nuovamente pubblicato il "Riepilogo dei primi risultati della classificazione dei dispositivi medici nel 2023". Questa serie di documenti rende la definizione, la classificazione e la regolamentazione dei prodotti software medicali basati sull'intelligenza artificiale più chiare e facili da utilizzare, e fornisce una guida chiara per le strategie di posizionamento e registrazione dei prodotti di varie aziende del settore. Questi documenti forniscono un quadro e decisioni gestionali per la regolamentazione scientifica dei dispositivi medici basati sull'intelligenza artificiale. Vale la pena attendere con interesse che l'agenda della Conferenza cinese sull'intelligenza artificiale in ambito medico, tenutasi a Hangzhou dal 21 al 23 dicembre, istituisca un forum speciale sulla governance medica digitale e sullo sviluppo di alta qualità degli ospedali pubblici, nonché un forum per lo sviluppo del settore della standardizzazione delle tecnologie di test e valutazione dei dispositivi medici basati sull'intelligenza artificiale. In tale occasione, parteciperanno all'incontro funzionari della Commissione nazionale per lo sviluppo e la riforma e dell'NMPA che potrebbero rilasciare nuove informazioni.
Conclusione
Nel 2023, l'intelligenza artificiale in ambito medico ha iniziato a integrarsi nell'intero processo medico a monte e a valle, coprendo la raccolta, la fusione, l'analisi, la diagnosi e il trattamento dei dati ospedalieri e lo screening comunitario, e a collaborare organicamente con gli operatori sanitari e addetti al controllo delle malattie, dimostrando il potenziale per migliorare la salute umana. La ricerca sull'intelligenza artificiale in ambito medico sta iniziando a delinearsi. In futuro, il progresso dell'intelligenza artificiale in ambito medico non dipenderà solo dallo sviluppo tecnologico in sé, ma richiederà anche la piena collaborazione di industria, università e ricerca medica, nonché il supporto di decisori politici e autorità di regolamentazione. Questa collaborazione interdisciplinare è la chiave per realizzare servizi medici integrati con l'intelligenza artificiale e promuoverà sicuramente lo sviluppo della salute umana.
Data di pubblicazione: 30-12-2023




