Real-World-Daten als Folge der Digitalisierung

Die US-amerikanische Food and Drug Administration (FDA) definiert Real-World-Daten (RWD) als Daten zum Gesundheitszustand von Patient:innen und/oder zur Gesundheitsversorgung, die routinemäßig aus einer Vielzahl von Quellen gewonnen werden. Dies können Daten aus elektronischen Gesundheitsakten, medizinischen Leistungsabrechnungen, Produkt- oder Krankheitsregistern oder anderen Quellen wie digitalen Gesundheitstechnologien (Apps) sein. Real-World-Evidenz (RWE) dagegen ist die klinische Evidenz über die Verwendung, den potenziellen Nutzen und die Risiken eines medizinischen Produkts, die aus der Analyse von RWD abgeleitet wird.1

Quellen für Real-World-Daten

RWD unterscheiden sich in mehreren Punkten von Daten aus randomisierten, kontrollierten Studien. Es handelt sich um Beobachtungsdaten, die nicht in einem kontrollierten Rahmen erhoben wurden und die häufig unstrukturiert und inkonsistent sind, da die Erfassung je nach Quelle variiert. Meist erfolgte die ursprüngliche Datenerhebung für einen anderen Zweck, wodurch wichtige Daten oder Endpunkte fehlen können. RWD können zudem mit (Selektions-)Verzerrungen sowie zufälligen und nicht zufälligen Messfehlern behaftet sein. Sie können jedoch breitere Patientenpopulationen erfassen und in hoher Frequenz generiert werden (z.B. Messungen auf Millisekundenebene von Wearables).

Die Arten von RWD können vielfältig sein. Elektronische Patientenakten (Electronic Health Records, EHR) – in Österreich in Form der elektronischen Gesundheitsakte (ELGA) – werden als Teil der Routineversorgung in Ordinationen, Krankenhäusern und anderen Gesundheitseinrichtungen erhoben. EHR-Daten sind oft heterogen, unstrukturiert und dynamisch und damit typische RWD, die aufgrund des hohen Hintergrundrauschens eine sorgfältige und intensive Vorverarbeitung erfordern. Bei datenschutzrechtlich gegebener Möglichkeit, sie für Forschungszwecke zu nutzen, können sie jedoch dabei helfen, Ergebnisse aus klinischen Studien zu bestätigen, Muster zu erlernen und klinische Prognosen zu verbessern.2

Register stellen eine wertvolle Datenquelle für das Verständnis des Krankheitsverlaufs und für die Entwicklung neuer Therapien dar. So bestehen Krankheitsregister aus Personen mit einer bestimmten Krankheit, was insbesondere bei seltenen Krankheiten wichtig ist, bei denen klinische Studien oft klein und die Daten variabel sind. Produktregister umfassen Patient:innen, die mit einem Medizinprodukt oder einem Medikament behandelt wurden; Register von Gesundheitsdienstleistern bestehen aus Patient:innen, die z.B. einen Krankenhausaufenthalt hatten. Daten, die zu Abrechnungs- und Zahlungszwecken erhoben und gespeichert werden, können im Gesundheitswesen genützt werden, um das Verhalten von Patient:innen und Ärzt:innen sowie deren Interaktion zu untersuchen, die Prävalenz von Krankheiten abzuschätzen und den Krankheitsverlauf zu verstehen. Es können auch Erkenntnisse zum Medikamentengebrauch sowie zu Wechselwirkungen zwischen Medikamenten gewonnen werden. Patient-reported Outcomes (PROs) sind Angaben, die direkt von den Patient:innen selbst über ihren Gesundheitszustand gemacht werden. PROs sind zwar anfällig für verfälschte Erinnerungen und interindividuelle Variabilität, können aber gute Einblicke in die Wirksamkeit von Interventionen auf die Symp­tome geben.2

Tragbare Gesundheitsmessgeräte, sogenannte Wearables, erzeugen riesige Datenströme, deren Nutzung durch Fortschritte in der Datenspeicherung und -verarbeitung erst ermöglicht wurde und parallel dazu weiterwachsen wird. In Kombination mit kontextbezogenen Daten (z.B. Standortdaten, soziale Medien) bieten sie die Möglichkeit für umfangreiche Forschungsstudien, die in diesem Ausmaß in kontrollierten Studien nicht durchführbar wären. Bekannte Beispiele dafür sind Pulsuhren, es gibt jedoch mittlerweile Apps für verschiedene Gesundheitsbereiche – von Kalorienzählern bis hin zu Zyklustra­ckern. RWD können auch aus der Familienanamnese stammen, etwa aus Angaben zu Fällen bestimmter Erkrankungen, zu vererbbaren Erkrankungen, aber auch zu Nikotin- und Alkoholkonsum. Heute einfach erstellbare molekulare Profile, z.B. mit genetischen Daten, stellen unabhängig davon, aber auch in Kombination, potenziell verwertbare Quellen dar.2

Künstliche Intelligenz zur Auswertung von RWD

Die zunehmende Verfügbarkeit riesiger Datenmengen in pharmazeutischen Unternehmen erforderte die Entwicklung fortschrittlicher Analysemethoden (z.B. Machine Learning, ML) zur Nutzung dieser Daten. So mussten die Teams für Forschung und Entwicklung in Pharmafirmen die wissenschaftliche Literatur traditionell manuell zusammenfassen, was in Bereichen mit einer großen Anzahl neu veröffentlichter Studien immer schwieriger wurde. Deshalb wurden Ins­trumente zur natürlichen Sprachverarbeitung (Natural Language Processing, NLP) entwickelt, um Abstracts zusammenzufassen oder sogar genetische Zielsequenzen von pharmazeutischem Interesse anhand der Veröffentlichungshäufigkeit zu identifizieren. Andere Tools ermöglichen es Forscher:innen, Abfragen über mehrere Datenquellen hinweg durchzuführen oder medizinische Ereignisse aus EHR-Daten verschiedener Gesundheitszen­tren vorherzusagen, ohne die Daten zuvor standortübergreifend harmonisieren zu müssen. ML kann auch eingesetzt werden, um Daten von tragbaren Geräten zu analysieren, Anomalien in Gang und Herzfrequenz zu entdecken oder sogar Krankheitsverschlechterungen vorab zu erkennen.3

Es ist in den USA bereits möglich, sogenannte Tokens zu verwenden, die verschiedene Quellen von RWD (z.B. EHR, Anträge, Register, klinische Studien und Labordaten) auf Patientenebene verknüpfen, um ein umfassenderes Verständnis von Gesundheit und Gesundheitsversorgung zu erhalten. Patient:innen-Token werden von privaten Unternehmen erstellt, um einzelne Patient:innen aus mehreren RWD-Quellen zu erkennen. Sie enthalten keine geschützten Gesundheitsinformationen wie Geburtsdatum und Sozialversicherungsnummer, werden nicht von solchen abgeleitet und sollen vor einer Rückidentifizierung von Patient:innen schützen. Token-Anbieter können ­entweder als Vermittler fungieren, um Patientendaten aus verschiedenen ­Datensätzen der biopharmazeutischen Unternehmen zu verknüpfen, oder Zugang zu einem zentralen Marktplatz mit mehreren bereits verknüpften Datenbanken bieten.3 ML-Techniken werden derzeit zwar großteils für Vorhersagen und Klassifizierungen, Variablenauswahl oder Datenvisualisierung und nicht für die Erstellung zulassungstauglicher RWE verwendet, dies könnte sich jedoch bald ändern, da die Regulierungsbehörden zunehmend auch für diesen Zweck ML evaluieren.2

Die Europäische Arzneimittel-Agentur (EMA) gründete 2021 ein Koordinierungszentrum, das aus Gesundheitsdatenbanken mit RWD in der gesamten Europäischen Union Evidenz über die Verwendung, Sicherheit und Wirksamkeit von Medikamenten schaffen soll. Dieses Data Analysis and Real World Interrogation Network (DARWIN EU) soll ab 2024 regulatorische Entscheidungen durch die Bereitstellung eines Katalogs von RWD-Quellen sowie durch die Durchführung nicht-interventioneller Studien, einschließlich der Entwicklung wissenschaftlicher Protokolle, der Abfrage relevanter Datenquellen und der Interpretation von Studienergebnissen, unterstützen.4

Resümee

Real-World-Daten sind eine wertvolle Datenquelle, die als Ergänzung zu herkömmlichen klinischen Studien zu sehen ist. Die fortschreitende Digitalisierung und die Vernetzung von Daten zur Gesundheitsversorgung ermöglichen laufend neue Quellen und deren Analyse. Die daraus abgeleitete Real-World-Evidenz soll bald auch in die Zulassung neuer Medikamente miteinbezogen werden.