LATTE hochgelegt: Mit KI aus elektronischen Patientenakten Tumor-Rückfälle entdecken

Langfristig erhobene elektronische Gesundheitsdaten (EHR) bergen erhebliches Potenzial zur Entwicklung prognostischer Modelle für Nierenzellkarzinome (RCC). Häufig jedoch fehlen Aufzeichnungen über klinische Therapieresultate sowie Tumorrezidive. In diese Studie wurden EHR zur Entwicklung eines Deep-Learning-Algorithmus, LATTE (label-efficient incident phenotyping deep learning algorithm) verwendet.

Methoden: Die Datenkuration von EHR von 28.715 Patient:innen mit RCC mithilfe von Natural language processing zeigte 5.992 Proband:innen als studiengeeignet. Zur Festlegung von Goldstandard-Labels für die RCC-Diagnose, Rezidivzeitpunkt und -status wurde manuell die Krankenakte von 350 Patient:innen überprüft. Innerhalb dieser Kohorte wurde ein semi-supervised KI-Algorithmus LATTE verwendet, um den Rezidivstatus und -zeitpunkt für nephrektomierte, nicht-metastasierte RCC-Patient:innen beim Zeitpunkt der Diagnose vorherzusagen. Die Leistung von LATTE bei der Identifizierung von RCC-Rezidiven in EHR-Daten wurde gegen die Goldstandard-Labels validiert, und anschließend wurden die Rezidivraten, stratifiziert nach AJCC TNM-Staging und Fuhrman-Grad, eruiert.

Ergebnisse:  LATTE identifizierte mit Präzision RCC-Rezidive und erreichte eine C-Statistik von 0,928 bei der Validierung gegenüber den annotierten Rezidivdaten. Die geschätzte 5-Jahres-Rezidivrate betrug 16,7 %. Besonders hervorzuheben ist, dass das Rezidivrisiko signifikant vom Krankheitsstadium abhängt: T3-Patient:innen wiesen eine Rezidivrate von 49,7 % auf, im Vergleich zu 3,4 % bei T1- und 14,3 % bei T2-Patient:innen.

Fazit: Der LATTE-Algorithmus stellt eine robuste Methode zur Identifizierung von RCC-Rezidiven in EHR-Daten dar und stimuliert zu einem vielversprechenden Ansatz zur prognostischen Modellierung.