Ein neues KI-gestütztes Vorhersagemodell namens Delphi-2M eröffnet einen tiefgreifenden Blick in die individuelle Gesundheitsentwicklung. Auf Basis einer modifizierten GPT-Architektur analysiert es Register- und Gesundheitsdaten der UK Biobank, darunter ICD-10-Diagnosen, Alter, Geschlecht sowie Lebensstilfaktoren wie Rauchen, Alkohol und BMI. Damit lässt sich das Risiko für über 1.000 verschiedene Krankheiten prognostizieren – mit einer Genauigkeit, die mit etablierten Einzelerkrankungsmodellen vergleichbar ist oder diese teilweise übertrifft.
Ein Alleinstellungsmerkmal ist die generative Fähigkeit von Delphi-2M: Es berechnet nicht nur punktuelle Risiken, sondern simuliert komplette individuelle Krankheitsverläufe über einen Zeitraum von bis zu 20 Jahren.
Im Gegensatz zu herkömmlichen Modellen, die meist auf eine einzelne Erkrankung zugeschnitten sind, erlaubt Delphi-2M eine umfassende Vorausschau auf die multimorbide Zukunft von Patientinnen und Patienten. Berücksichtigt werden nicht nur demografische Daten, sondern auch die gesamte bisherige Krankengeschichte, wobei sich typische Cluster von Diagnosen abzeichnen – etwa gastrointestinale Erkrankungen oder psychische Störungen – , die wiederum das Risiko für Folgeerkrankungen erhöhen. Die Modellarchitektur wurde eigens an die Besonderheiten medizinischer Langzeitdaten angepasst, unter anderem durch eine kontinuierliche Alterskodierung und ein exponentielles Wartezeitmodell für das nächste Ereignis.
Neben vielversprechenden Ergebnissen legt die Studie aber auch Grenzen offen. Delphi-2M spiegelt zwangsläufig Verzerrungen seiner Trainingsdaten wider, etwa die Unterrepräsentation bestimmter Krankheitsbilder oder die Abhängigkeit von der Art der Datenerhebung. Zudem stammt das Ausgangsmaterial primär aus der UK Biobank, deren Teilnehmerinnen und Teilnehmer tendenziell gesünder und sozioökonomisch besser gestellt sind als die Allgemeinbevölkerung. Eine externe Validierung mit fast zwei Millionen dänischen Registerdaten zeigte eine gute Übertragbarkeit, allerdings mit einem leichten Rückgang der Modellleistung.
Trotz dieser Einschränkungen weist Delphi-2M neue Wege für Prävention und Versorgungsplanung. Es könnte dazu beitragen, Hochrisikopersonen frühzeitig zu identifizieren, Screening-Empfehlungen stärker zu individualisieren und den langfristigen Versorgungsbedarf ganzer Bevölkerungsgruppen besser abzuschätzen. Die Autoren betonen jedoch, dass Delphi-2M derzeit ein Forschungsinstrument ist und die abgebildeten Assoziationen nicht als kausale Zusammenhänge missverstanden werden dürfen. Perspektivisch könnte die Integration weiterer Datenebenen - etwa Biomarker, Genom- oder Freitextdaten – die Genauigkeit und Anwendbarkeit des Modells noch erheblich steigern.
Hintergrund: Delphi-2M wurde mit Daten von 402.799 britischen UK-Biobank-Teilnehmer:innen trainiert und auf >1.000 Krankheiten angewandt. Als Input-Daten benutzte das Modell ICD-10-basierte Krankheitsereignisse, Alter, Geschlecht und Lebensstil-Informationen (Rauchen, Alkohol, BMI), jedoch keine Daten aus elektronischen Gesundheitsakten.
Conroy G: „Which diseases will you have in 20 years? This AI accurately predicts your risks“. Nature News, 2025 Sep 17 (https://www.nature.com/articles/d41586-025-02993-x)
* Shmatko A et al.: Learning the natural history of human disease with generative transformers. Nature. 2025 Sep 17 (DOI 10.1038/s41586-025-09529-3).