Gesundheitsdaten ≠ Gesundheitsdaten: Warum Kassendaten, Patientenakten und Registerdaten nicht dasselbe sind

Autorin: Dr. Eveline Prochaska, Technische Universität Dresden, 29.01.2026

Künstliche Intelligenz (KI / AI) in der Medizin gilt als Schlüsseltechnologie für bessere Diagnostik, Prognosemodelle und eine datengetriebene Versorgung. In der Praxis entscheidet jedoch weniger der Algorithmus als vielmehr die zugrundeliegende Datenquelle, ob KI-Modelle valide, erklärbar und übertragbar sind.

Drei Datentypen spielen im Bereich der Gesundheitsdaten eine zentrale Rolle: Kassendaten (Claims-Daten), elektronische Patientenakten (EHR / ePA) und Registerdaten. Sie unterscheiden sich grundlegend mit direkten Konsequenzen für den Einsatz von KI.

1. Kassendaten (claims data / Leistungsdaten)

Kassendaten entstehen primär zur Abrechnung medizinischer Leistungen und enthalten strukturierte Informationen zu Diagnosen, Prozeduren, Verordnungen und Kosten. Sie decken häufig sehr große Populationen über lange Zeiträume ab und gelten als klassische Real-World Data (RWD) [1].

Bedeutung für KI / AI

Sehr große Fallzahlen → geeignet für Machine-Learning-Modelle auf Populationsebene
Ermöglichen Längsschnittanalysen über Jahre
Relevante Basis für Versorgungsforschung, Gesundheitsökonomie und Risiko-Stratifizierung [2]

Einschränkungen

Geringer klinischer Detailgrad
Diagnosen sind nicht zwingend klinisch validiert
Keine Laborwerte, Vitalparameter oder Befunde

Für KI in der Medizin eignen sich Kassendaten vor allem für Kosten-, Risiko- und Inanspruchsmodelle, weniger für klinische Entscheidungsunterstützung.

2. Elektronische Patientenakten (EHR / ePA)

Daten aus elektronischen Patientenakten entstehen direkt im klinischen Versorgungsprozess. Sie umfassen Laborwerte, Vitalparameter, Medikationsverläufe, Bilddaten, Befunde und umfangreiche unstrukturierte Texte. EHR-Daten bilden heute die zentrale Grundlage vieler KI-Anwendungen in der Medizin [3].

Bedeutung für KI / medizinische AI

Hoher klinischer Kontext
Grundlage für Deep Learning, NLP und Bildanalyse
Ermöglicht differenzierte Phänotypisierung und individualisierte Vorhersagemodelle [4]

Herausforderungen

Fragmentierte Daten über verschiedene Einrichtungen hinweg
Heterogene Dokumentationsstandards
Hoher Aufwand für Datenharmonisierung, Bias-Analyse und Qualitätssicherung [3]

Für klinische KI-Modelle sind Patientenakten essenziell, ihre Nutzung erfordert jedoch erhebliche technische und fachliche Expertise.

3. Registerdaten

Registerdaten werden gezielt für klar definierte Fragestellungen erhoben, etwa zu bestimmten Erkrankungen, Therapien oder Medizinprodukten. Sie folgen festen Einschlusskriterien und Qualitätsstandards und gelten als besonders valide Real-World-Datenquelle [5].

Bedeutung für KI / AI

Hohe Datenqualität und strukturierte Variablen
Besonders geeignet für Outcome-Analysen und Modellvalidierung
Relevanz für regulatorische und qualitätssichernde Fragestellungen [6]

Grenzen

Begrenzte Fallzahlen
Selektive Populationen
Häufig kein vollständiger Versorgungs-Längsschnitt

Für KI-Anwendungen sind Registerdaten besonders wertvoll zur Validierung und Absicherung von Modellen.

Abbildung 1: Grafische Gegenüberstellung der drei vorgestellten Gesundheitsdaten-Arten (KI-generiert mit Hilfe von ChatGPT)

Warum die Datenquelle für KI entscheidend ist

Keine dieser Datenquellen ist per se überlegen. Der eigentliche Mehrwert entsteht durch die Kombination:

Kassendaten liefern Breite und zeitliche Kontinuität
EHR-Daten liefern klinische Tiefe
Registerdaten liefern Qualität und Fokus

Moderne Dateninfrastrukturen und gemeinsame Datenmodelle (z. B. Sentinel, OMOP) zielen darauf ab, diese Datenquellen kontrolliert zu integrieren [7].

Fazit

KI in der Medizin scheitert selten am Algorithmus, sondern häufig an falschen Erwartungen an die Daten. Für Forschung, Klinik und Industrie gilt daher:
Welche Daten eignen sich für welche Fragestellung – und mit welchen Limitationen?

Referenzen

Sherman RE et al. Real-World Evidence — What Is It and What Can It Tell Us?
N Engl J Med, 2016. DOI: 10.1056/NEJMsb1609216
Berger ML et al. Good practices for real-world data studies of treatment and/or comparative effectiveness. Pharmacoepidemiology and Drug Safety, 2017. DOI: 10.1002/pds.4297
Hersh WR et al. Caveats for the use of operational electronic health record data in comparative effectiveness research. Medical Care, 2013. DOI: 10.1097/MLR.0b013e31829b1dbd
Knevel R et al. From real-world electronic health record data to real-world results using artificial intelligence. Annals of the Rheumatic Diseases, 2023. DOI: 10.1136/ard-2022-222626
Gliklich RE et al. Registries for Evaluating Patient Outcomes: A User’s Guide.
AHRQ, 2014. ISBN: 978-1-58763-439-1
Ioakeim-Skoufa I et al. Electronic Health Records: A Gateway to AI-Driven Multimorbidity Solutions—A Comprehensive Systematic Review. Journal of Clinical Medicine, 2025. DOI: 10.3390/jcm14103434
Platt R et al. The FDA Sentinel Initiative — An evolving national resource.
N Engl J Med, 2018. DOI: 10.1056/NEJMp1809643

Zur Übersicht

Wissens­portal