- Anzeige -
Onkologie

Chancen und Risiken

Big Data in der Onkologie

Dr. Reinhard Merz, Prof. Dr. med. Achim Rody

6.9.2021

Die Techniken zur Datenanalyse haben sich in den vergangenen Jahren entscheidend weiterentwickelt. Da auch die Analyse genetischen Materials immer schneller und billiger wird, stehen mehr und mehr Daten für die individuelle onkologische Therapie zur Verfügung. Fluch oder Segen?

 „Big Data“ sind in der Wissenschaft omnipräsent. Man gewinnt in vielerlei Bereichen den Eindruck, die Medizin sei ein Teil der Informatik geworden und in kaum einer anderen Disziplin ist das so sichtbar wie in der Onkologie. Dabei wurden gerade hier schon lange vor der Einführung des Big-Data-Begriffs Studien durchgeführt, die tausende von Individuen umfassten, und die Patientenzahlen sind seit dieser Zeit nicht dramatisch gestiegen.1 Was also ist neu?

Die molekulare Herausforderung

Hier lohnt ein Blick auf die molekularen Tumorboards.2 Dort müssen zu individuellen Patienten und potenziellen Vergleichsgruppen große Datenmengen analysiert werden. Während derzeit häufig noch Genpanels zur Mutationsanalyse verwendet werden, ist die Exom-Sequenzierung (also die Sequenzierung aller Protein-kodierenden Bereiche) auf dem Weg in die Routineanwendung. Und es ist bereits absehbar, dass die Exom-Sequenzierung in der Onkologie schon bald durch die Ganzgenom-Sequenzierung (whole genome sequencing, WGS) abgelöst werden könnte. Denn nur WGS ermöglicht auch die Analyse von Mutationen im nicht-kodierenden Bereich des Genoms, deren Bedeutung zunehmend verstanden und als potenziell klinisch relevant erkannt wird.3,4 Die Datenmenge steigt dabei von einigen 100 MByte bei der Panel-Sequenzierung über 5–10 GByte bei der Exom-Sequenzierung auf über 200 GByte pro Patient für WGS.5 Durch diese exakte genomische Analyse wird sich das Bild einer Tumorerkrankung immer weiter fragmentisieren, sodass kleinste Subgruppen definiert werden müssen, von denen wir weder Informationen zum Krankheitsverlauf (Prognose) noch zum genauen Therapieansprechen (Prädiktion) haben. Und das gilt sowohl für etablierte Therapieverfahren als auch für die aus den genomischen Veränderungen heraus abzuleitenden zielgerichteten Medikamente.

„Die bisherige Exom-Sequenzierung könnte schon bald durch die GanzgenomSequenzierung abgelöst werden.“

Um diese Informationen sammeln zu können, ist eine effiziente Nutzung der Daten notwendig. Dies umfasst die Speicherung der genomischen Daten, des Kompartiments, in welchem die Daten erhoben wurden (Primärtumor, Metastase oder Liquid Biopsy), den Krankheitsverlauf und die durchgeführten therapeutischen Maßnahmen. In diesem Zusammenhang wird es in Zukunft schwieriger werden, prospektiv randomisierte Studien durchzuführen, die dann Therapiekonzepte in kleinsten, genomisch definierten Subgruppen generieren.

Daher benötigen wir eine effiziente Nutzung dieser Informationen. Vor der effizienten Nutzung stehen aber die Schritte der Datenharmonisierung. Und hier hinken wir in Deutschland leider etwas hinterher. Zentrale staatliche Systeme wie das NHS in Großbritannien oder das dänische System (s. u.) sind aufgrund ihrer einheitlichen Struktur klar im Vorteil. Doch das Problem ist erkannt und in den Use Cases der BMBF-Initiative Medizininformatik (www.medizininformatik-initiative.de), anhand derer die Machbarkeit und Praxisrelevanz dieses Ansatzes auch in Deutschland demonstriert werden sollen, haben onkologische Anwendungen eine prominente Rolle.

Auch in anderen Ländern wie den USA gibt es hier noch Handlungsbedarf, wie Arbeiten im ASCO-CancerLinQ-Verbund zeigen.[6] CancerLinQ soll Onkologen bei der Therapieentscheidung unterstützen, indem es die Daten des jeweiligen Patienten in Echtzeit mit einer großen Zahl ähnlicher Patienten abgleicht und so Erfahrungen und Behandlungsergebnisse zugänglich macht.

Chancen von Big Data

Zu den größten Chancen der Big-Data-Anwendungen gehört die bessere Patientenstratifizierung. So können durch die Kombination von (histo-)pathologischen Daten mit genomweiten molekularen Daten sehr sichere und sehr differenzierte Diagnosen gestellt werden, die eine weitaus präzisere Klassifizierung von Tumoren ermöglichen. Ein Beispiel: Für eine Gruppe kindlicher Hirntumoren (CNS-PNETs) konnte durch die Kombination verschiedener genomweiter molekularer Analysen eine differenziertere Klassifizierung erreicht und vier neue Tumor­entitäten definiert werden.[7] Das wiederum hat Konsequenzen für die Therapie, da man aufgrund der Daten recht genau vorhersagen kann, ob ein Patient auf eine bestimmte Therapieform reagieren wird oder nicht. Dies wurde in einer großen Metaanalyse auch bestätigt. Hier konnte gezeigt werden, dass eine personalisierte Therapie, die auf der Grundlage genomischer Veränderungen und nicht auf Proteinebene durchgeführt wurde, zu einem signifikant längeren Überleben geführt hat.[8]

Das erfordert ein Umdenken bei der Bewertung der Therapiewirksamkeit. Der bisherige Ansatz, die Wirksamkeit einer Prüfsubstanz über das durchschnittliche Ansprechen einer Patientenkohorte nachzuweisen, ist bei individuell auf einzelne Patienten abgestimmten Therapien naturgemäß nicht möglich. Statt in wenigen großen Studien muss die Wirksamkeit durch eine Vielzahl sogenannter N-of-1 trials, also Studien mit nur einem Teilnehmer nachgewiesen werden.[9]

Auf der anderen Seite wird das Konzept der „tumoragnostischen Therapie“ vermehrt Einzug halten. Dabei wird zunächst unabhängig von der Organzuordnung eines Tumors die spezifische Wirksamkeit eines Medikaments bei unterschiedlichen Tumoren mit nachgewiesenen genomischen Veränderungen überprüft. Dies hat z. B. erstmalig zu einer Zulassung des Checkpoint-Inhibitors Pembrolizumab bei nachgewiesener „mismatch repair deficiency“ unabhängig von der organbezogenen Herkunft des Tumors durch die FDA geführt.[10]

Und in der präventiven Onkologie können in Studien erhobene Daten mit Gesundheits- und Lifestyle-Daten verknüpft werden, die von Smartphone-Apps, Wearables und in sozialen Netzwerken außerhalb von Studien erfasst werden. Dadurch können Risikogruppen genauer definiert werden und ggf. besser gemonitort werden.

„Grundsätzlich gleicht kein Tumorgenom dem anderen – die inter- und intra­tumorale Heterogenität ist gewaltig.“
Herausforderungen von Big Data

Allein das Volumen der Daten stellt enorme Herausforderungen an die IT-Infrastruktur. Zurzeit verdoppelt sich die weltweite Sequenzierkapazität alle zwölf Monate und auch für die Zukunft wird noch eine Verdopplung alle 18 Monate vorausgesagt.[11] Schon jetzt beträgt die Menge in öffentlichen Datenbanken zugänglicher Krebs-Genomdaten mehrere Peta-Byte (1 Peta-Byte entspricht 1.015 Bytes), und solche Datenmengen sind nur sehr eingeschränkt portabel. Das erfordert den konsequenten Einsatz der Cloudtechnologie, die Wissenschaftlern und Ärzten Zugang zu großen Kollektionen genomischer Daten sowie zu standardisierten Analyseverfahren gibt (www.genome-cloud.de).

Auch die klinische Interpretation der genomweiten Sequenzdaten ist bisher nur eingeschränkt möglich. Denn nur für einen Bruchteil der beobachteten Mutationen ist bekannt, ob und wie sie für bestimmte Therapien sensibilisieren bzw. Resistenzen vermitteln. Zwar gibt es einige sehr häufig auftretende Treibermutationen, die leicht zu erkennen und mittlerweile gut charakterisiert sind. Ihnen steht aber eine sehr viel größere Zahl seltener Treibermutationen gegenüber, die nur durch die Untersuchung sehr großer Patientengruppen erkannt werden können. Noch komplizierter wird die Analyse, wenn zu den Genomdaten noch weitere Daten (Proteomics oder Metabolomics) hinzukommen.

Auch die Tumorbiologie setzt den Big-Data-Anwendungen Grenzen, denn grundsätzlich gleicht kein Tumorgenom dem anderen. Weder wird man in zwei Patienten jemals das gleiche Mutationsmuster beobachten noch wird man in einer größeren Anzahl von Zellen eines Tumors das exakt gleiche Genom vorfinden. Die Heterogenität der Tumoren von verschiedenen Patienten (interpatient heteroge­neity) erschwert das Erkennen von Treibermutationen und die Patientenstratifizierung – und damit letztlich die Therapieempfehlung.

Darüber hinaus zeigt sich innerhalb eines Tumors eine mehr oder weniger ausgeprägte Klonalität, die sich durch verschiedene genomische Veränderungen charakterisieren lässt, allerdings auch in verschiedenen Metastasen unterschiedlich ausgeprägt sein kann (inter- und intratumorale Hetero­genität). Möglicherweise könnte in diesem Zusammenhang die Analyse zirkulierender Tumor-DNA im Rahmen einer Liquid Biopsy Vorteile im Vergleich zur Analyse der Tumor-DNA bringen, da es sich um eine Mischung von DNA aus den unterschiedlichen Tumorkompatimenten handelt.[12]

Outcomes-Research- und Real-World-Daten

Derzeit werden etwa 3 % aller Krebspatienten in klinische Studien eingeschlossen. Das bedeutet, dass die Ergebnisse der klinischen Studien nicht notwendigerweise für die Gesamtheit der Krebspatienten unter den tatsächlichen Behandlungsbedingungen repräsentativ sind. Big-Data-Technologien geben uns nun die Möglichkeit, auch große, heterogene Patientenkohorten retrospektiv auszuwerten. Dadurch lassen sich Fragen zu Behandlungseffektivität und Langzeitergebnis, aber auch zu Korrelationen mit dem Lebensstil und genetischer Prädisposition in bisher unerreichter Genauigkeit beantworten. Die kontrollierte Umgebung von klinischen Studien wird hier zwangsweise durch große heterogene Kollektive und Bedingungen ersetzt. Signifikante Aussagen werden aus diesen Kollektiven durch „Real World Evidence“ (RWE) ersetzt – große Fallzahlen sowie eine möglichst vollständige Erfassung aller Variablen.[5]

„RCTs schaffen idealisierte Bedingungen, RWE-Studien gewähren Einblicke in das normale klinische Umfeld.“

RWE-Studien ermöglichen „crucial insights into quality of care and effectiveness“.[13] Sie stellen den Nutzen traditioneller (randomisierter kontrollierter) klinischer Studien (Randomized Controlled Trials, RCTs) aber nicht infrage, sondern sind prin­z­i­piell als komplementäre Vorgehensweisen sich ergänzender Fragestellungen anzusehen.[14] Durch ihre Ein- und Ausschlusskriterien schaffen RCTs in der Regel idealisierte Bedingungen, während RWE-Studien per Definition Einblicke in das normale klinische Umfeld gewähren.[15] Daher können RWE-Studien im Vergleich zu RCTs von einer höheren Generalisierbarkeit und ihrer externen Validität profitieren (Abb. 1).[16]

RWE-Studien eignen sich besonders zur Analyse einer differenzierten Behandlungseffektivität in der Routineversorgung oder für Patienten-Subgruppen. Sie sind deutlich schneller und ressourcenschonender durchführbar, wenn die notwendige Infrastruktur existiert. Und mit einer höheren Datentiefe und Datenqualität in Verbindung mit stringenten Methoden und Prozessen sollten die Limitationen von RWE-Studien weiter eingegrenzt und die Qualität und Anzahl der RWE-Studien gesteigert werden können.[17]

Dennoch werden Limits bleiben: Wissenschaftliche Datentypen (neue Biomarker, genomische Daten) werden nach wie vor nicht oder in unterschiedlicher Weise erfasst. Das gilt auch für die von Patienten berichtete Einschätzung eines Behandlungserfolgs („patient-reported outcome“, PRO) wie strukturiert abgefragte Aussagen zur Lebensqualität. Die durch neue Therapien erzielten klinischen Ergebnisse bewirken leider nach wie vor oft nur geringfügige Verbesserungen im Gesamtüberleben, haben aber durchaus relevant unterschiedliche Auswirkungen auf die Lebensqualität der Patienten. Relevant wäre daher mit Priorität die Etablierung und Vorhaltung eines benutzerfreundlichen Systems zur Aufzeichnung von Lebensqualitätsdaten.[18]

Ausblick

Die Fortschritte in der digitalen Medizin erlauben zusammen mit den ausgefeilten und mittlerweile bezahlbaren Sequenziertechniken ein nie gekanntes Maß an individueller Therapie. Doch ist nicht alles Gold, was glänzt. Aus Korrelationen in Big-Data-Analysen kann nicht notwendigerweise auf Kausalität geschlossen werden. Und eine statistische Signifikanz ist noch kein Beweis für eine klinische Relevanz. Die nächsten zehn Jahre wird die Entwicklung sicher im gleichen, atemberaubenden Thema weiter gehen wie in den vergangenen zehn. Das wird unseren Patienten neue Perspektiven eröffnen – den Krebs haben wir aber auch dann noch lange nicht besiegt.

Dänemark als Blaupause

Von unseren nördlichen Nachbarn im kleinen Dänemark können wir in Sachen Digitalisierung im Gesundheitswesen eine Menge lernen. Beeindruckend ist es vor allen Dingen, wie die Dänen die Versorgungsschritte des Alltags konsequent digital umsetzen. Hier sind Praxen, Kliniken und Patienten miteinander vernetzt. Ob einfache Versorgungsschritte wie Überweisung zum Facharzt und Rezept für die Apotheke oder komplexe Analysen wie in der personalisierten Onkologie – alles wird elektronisch abgewickelt und ist jederzeit für den Patienten einsehbar.

In der Praxis funktioniert das so: Für alle Vorgänge gibt es einen Hub, in dem die Vorgänge zwischengespeichert werden. Verordnet ein Arzt ein Präparat, wird es in dieser gesicherten Cloud gespeichert und kann mit der ID des Patienten von jeder Apotheke abgerufen werden. Abgewickelt wird das alles über sundhed.dk. Das Portal ist die Schnittstelle zwischen Patienten und allen Gesundheitsberufen.

Im zugangsgeschützten Bereich können Patienten auf ihre gespeicherten Daten zugreifen: Diagnosen, Medikamentenlisten, Röntgenbefunde, Labortests, Überweisungen und mehr. Mit Zustimmung des Patienten können auch behandelnde Ärzte auf die Daten zugreifen. Möglich macht das eine elektronische Patientenakte, die im dänischen System e-journalen heißt und der eigentliche Kern der persönlichen Dienste ist.

Der entscheidende Vorteil für RWE-Studien ist der Fakt, das alle Daten anonymisiert ausgelesen werden können. Es ist also kein Wunder, dass viele hochrangig in Nature oder dem New England Journal publizierte Real-World-Studien mit dänischen Daten arbeiten.

DATENSCHUTZ

Um das Potenzial von Big-Data-Technologien optimal ausnutzen zu können, sind sowohl eine möglichst breite Verfügbarkeit der Datensätze als auch eine weitgehende Verknüpfung verschiedener Datentypen essenziell. Diese Maximierung des Erkenntnisgewinns steht aber im Konflikt mit dem Schutz der Privatsphäre des Patienten. Denn genomische Daten sind per se nicht anonymisierbar, da sie die eindeutige Zuordnung zu einem Individuum ermöglichen. Und je mehr Daten miteinander verknüpft werden, desto größer wird das Risiko der Re-Identifizierung.

Hier müssen Wege gefunden werden, die Rechte und Interessen der Patienten zu wahren, ohne auf den essenziellen Datenaustausch zu verzichten. Dabei muss auch geklärt werden, wem die erhobenen Daten überhaupt gehören. Was passiert, wenn Patienten ihre Einwilligung zur Datennutzung widerrufen? Und wie geht man mit Zufallsbefunden um, die das Leben des Patienten schwerwiegend beeinflussen könnten? Hier gilt es, das Recht auf informationelle Selbstbestimmung zu respektieren und damit auch das Recht auf Nichtwissen. Empfehlungen für einen verantwortungsvollen Umgang mit den neuen technischen Möglichkeiten in Klinik und Forschung gibt die Heidelberger Projektgruppe EURAT in ihren „Eckpunkten für eine Heidelberger Praxis der Ganzgenom-Sequenzierung“.[19]

Der Autor

Prof. Dr. med. Achim Rody
Universitätsklinikum
Schleswig-Holstein
Ratzeburger Allee 160, Haus 40
23538 Lübeck

achim.rody@uksh.de

[1] Binder H, Onkologe 2018; 24: 361–367
[2] Singer J et al., Brief Bioinformat 2017; doi.org/10.1093/bib/bbx143
[3] Horn S et al., Science 2013; 339: 959–961
[4] Northcott PA et al., Nature 2014; 511: 428–434
[5] Schlesner M, TumorDiagn u Ther 2016; 37: 312–315
[6] Shah A et al., J Clin Oncol 2016; 34: 756–763
[7] Sturm D et al., Cell 2016; 164: 1060–1072
[8] Schwaederle et al., J Clin Oncol 2015; 33: 3817–3825
[9] Schork NJ, Nature 2015; 520: 609–611
[10] Le DT et al., Science 2017; 357: 409–413
[11] Stephens ZD et al., PLoS Biol 13: e1002195
[12] Raphael J et al., Eur J Cancer 2018; 91: 38–46
[13] Tannock IF et al., Lancet Oncol 2016; 17: e560–e567
[14] Visvanathan K et al., J Clin Oncol 2017; 35: 1845–1854
[15] Booth CM et al., Br J Cancer 2014; 110: 551–555
[16] Meissenhälter BE et al., Onkologe 2018; 24: 378–389
[17] Obermeyer Z et al., N Engl J Med 2016; 375: 1216–1219
[18] Secord AA et al., Nat Rev Clin Oncol 2015; 12: 358–370
[19] www.uni-heidelberg.de/md/totalsequenzierung/stellung­nahme_2.pdf

Lesen Sie mehr und loggen Sie sich jetzt mit Ihrem DocCheck-Daten ein.
Der weitere Inhalt ist Fachkreisen vorbehalten. Bitte authentifizieren Sie sich mittels DocCheck.

Das könnte Sie auch interessieren