Ein Forschungsteam der Stanford University hat mit „SleepFM“ ein KI-Modell entwickelt, das aus Polysomnographie-Daten Hinweise auf das spätere Auftreten zahlreicher Erkrankungen ableiten kann. Grundlage waren mehr als 585.000 Stunden Schlafaufzeichnungen von über 65.000 Personen aus vier großen Kohorten.
Das Modell wertet gleichzeitig verschiedene im Schlaflabor erhobene Signale aus – darunter Hirnströme (EEG), Herzaktivität (EKG), Muskelaktivität (EMG) und Atmung. Anders als herkömmliche Ansätze wurde es zunächst ohne konkrete Zielvorgabe auf großen Datenmengen „vortrainiert“. Dabei lernte es typische Muster gesunder und krankheitsassoziierter Schlafphysiologie. Anschließend wurde das System gezielt darauf trainiert, das Risiko für das spätere Auftreten bestimmter Erkrankungen abzuschätzen.
Für die Auswertung wurden elektronische Gesundheitsdaten einer Stanford-Kohorte mit 5.019 Personen herangezogen. Insgesamt untersuchten die Forschenden 1.041 Krankheitskategorien. Erkrankungen, die innerhalb der ersten sieben Tage nach der Schlafuntersuchung auftraten, wurden ausgeschlossen, um reine Zufallsbefunde zu vermeiden. Für 130 Erkrankungen erreichte das Modell eine gute bis sehr gute Vorhersagegenauigkeit (AUROC und C-Index ≥0,75). Die Berechnung erfolgte dabei auf Basis eines sechsjährigen Beobachtungszeitraums.
Beste Vorhersage bei Kombination aller Signale
Besonders hohe Vorhersagewerte zeigten sich unter anderem für Morbus Parkinson (AUROC 0,93), Demenz (0,87), hypertensive Herzerkrankung (0,88) sowie Prostata- und Mammakarzinom (je 0,90). Auch für Mortalität, Herzinsuffizienz und Schlaganfall erwies sich das Modell als robust – selbst in einer später erhobenen Validierungskohorte.
Analysen der einzelnen Signalarten zeigten physiologisch nachvollziehbare Muster: Hirnsignale waren besonders relevant für neurologische und psychische Erkrankungen, Herzsignale für kardiovaskuläre Diagnosen und respiratorische Parameter für metabolische Störungen. Die beste Vorhersageleistung ergab jedoch die Kombination aller Signale.
Im Vergleich zu einem Modell, das lediglich demografische Daten wie Alter, Geschlecht, BMI und ethnische Zugehörigkeit berücksichtigte, verbesserte sich die Vorhersagegenauigkeit um 5-17 %. Auch gegenüber einem direkt auf Schlafdaten trainierten Modell ohne Vortraining schnitt SleepFM konsistent besser ab. Einschränkend ist zu beachten, dass die untersuchten Personen überwiegend aufgrund von Schlafproblemen überwiesen worden waren, sodass die Übertragbarkeit auf die Allgemeinbevölkerung begrenzt sein dürfte.
Thapa R et al.: A multimodal sleep foundation model for disease prediction. Nat Med. 2026 Feb;32(2):752-762 (DOI 10.1038/s41591-025-04133-4).