Gesundheitsdaten ≠ Gesundheitsdaten: Warum Kassendaten, Patientenakten und Registerdaten nicht dasselbe sind
Autorin: Dr. Eveline Prochaska, Technische Universität Dresden, 29.01.2026
Künstliche Intelligenz (KI / AI) in der Medizin gilt als Schlüsseltechnologie für bessere Diagnostik, Prognosemodelle und eine datengetriebene Versorgung. In der Praxis entscheidet jedoch weniger der Algorithmus als vielmehr die zugrundeliegende Datenquelle, ob KI-Modelle valide, erklärbar und übertragbar sind.
Drei Datentypen spielen im Bereich der Gesundheitsdaten eine zentrale Rolle: Kassendaten (Claims-Daten), elektronische Patientenakten (EHR / ePA) und Registerdaten. Sie unterscheiden sich grundlegend mit direkten Konsequenzen für den Einsatz von KI.
1. Kassendaten (claims data / Leistungsdaten)
Kassendaten entstehen primär zur Abrechnung medizinischer Leistungen und enthalten strukturierte Informationen zu Diagnosen, Prozeduren, Verordnungen und Kosten. Sie decken häufig sehr große Populationen über lange Zeiträume ab und gelten als klassische Real-World Data (RWD) [1].
Bedeutung für KI / AI
- Sehr große Fallzahlen → geeignet für Machine-Learning-Modelle auf Populationsebene
- Ermöglichen Längsschnittanalysen über Jahre
- Relevante Basis für Versorgungsforschung, Gesundheitsökonomie und Risiko-Stratifizierung [2]
Einschränkungen
- Geringer klinischer Detailgrad
- Diagnosen sind nicht zwingend klinisch validiert
- Keine Laborwerte, Vitalparameter oder Befunde
Für KI in der Medizin eignen sich Kassendaten vor allem für Kosten-, Risiko- und Inanspruchsmodelle, weniger für klinische Entscheidungsunterstützung.
2. Elektronische Patientenakten (EHR / ePA)
Daten aus elektronischen Patientenakten entstehen direkt im klinischen Versorgungsprozess. Sie umfassen Laborwerte, Vitalparameter, Medikationsverläufe, Bilddaten, Befunde und umfangreiche unstrukturierte Texte. EHR-Daten bilden heute die zentrale Grundlage vieler KI-Anwendungen in der Medizin [3].
Bedeutung für KI / medizinische AI
- Hoher klinischer Kontext
- Grundlage für Deep Learning, NLP und Bildanalyse
- Ermöglicht differenzierte Phänotypisierung und individualisierte Vorhersagemodelle [4]
Herausforderungen
- Fragmentierte Daten über verschiedene Einrichtungen hinweg
- Heterogene Dokumentationsstandards
- Hoher Aufwand für Datenharmonisierung, Bias-Analyse und Qualitätssicherung [3]
Für klinische KI-Modelle sind Patientenakten essenziell, ihre Nutzung erfordert jedoch erhebliche technische und fachliche Expertise.
3. Registerdaten
Registerdaten werden gezielt für klar definierte Fragestellungen erhoben, etwa zu bestimmten Erkrankungen, Therapien oder Medizinprodukten. Sie folgen festen Einschlusskriterien und Qualitätsstandards und gelten als besonders valide Real-World-Datenquelle [5].
Bedeutung für KI / AI
- Hohe Datenqualität und strukturierte Variablen
- Besonders geeignet für Outcome-Analysen und Modellvalidierung
- Relevanz für regulatorische und qualitätssichernde Fragestellungen [6]
Grenzen
- Begrenzte Fallzahlen
- Selektive Populationen
- Häufig kein vollständiger Versorgungs-Längsschnitt
Für KI-Anwendungen sind Registerdaten besonders wertvoll zur Validierung und Absicherung von Modellen.
Warum die Datenquelle für KI entscheidend ist
Keine dieser Datenquellen ist per se überlegen. Der eigentliche Mehrwert entsteht durch die Kombination:
- Kassendaten liefern Breite und zeitliche Kontinuität
- EHR-Daten liefern klinische Tiefe
- Registerdaten liefern Qualität und Fokus
Moderne Dateninfrastrukturen und gemeinsame Datenmodelle (z. B. Sentinel, OMOP) zielen darauf ab, diese Datenquellen kontrolliert zu integrieren [7].
Fazit
KI in der Medizin scheitert selten am Algorithmus, sondern häufig an falschen Erwartungen an die Daten. Für Forschung, Klinik und Industrie gilt daher:
Welche Daten eignen sich für welche Fragestellung – und mit welchen Limitationen?
Referenzen
- Sherman RE et al. Real-World Evidence — What Is It and What Can It Tell Us?
N Engl J Med, 2016. DOI: 10.1056/NEJMsb1609216 - Berger ML et al. Good practices for real-world data studies of treatment and/or comparative effectiveness. Pharmacoepidemiology and Drug Safety, 2017. DOI: 10.1002/pds.4297
- Hersh WR et al. Caveats for the use of operational electronic health record data in comparative effectiveness research. Medical Care, 2013. DOI: 10.1097/MLR.0b013e31829b1dbd
- Knevel R et al. From real-world electronic health record data to real-world results using artificial intelligence. Annals of the Rheumatic Diseases, 2023. DOI: 10.1136/ard-2022-222626
- Gliklich RE et al. Registries for Evaluating Patient Outcomes: A User’s Guide.
AHRQ, 2014. ISBN: 978-1-58763-439-1 - Ioakeim-Skoufa I et al. Electronic Health Records: A Gateway to AI-Driven Multimorbidity Solutions—A Comprehensive Systematic Review. Journal of Clinical Medicine, 2025. DOI: 10.3390/jcm14103434
- Platt R et al. The FDA Sentinel Initiative — An evolving national resource.
N Engl J Med, 2018. DOI: 10.1056/NEJMp1809643