Geschrieben von Marco Geuer. Veröffentlicht in Blog - Data Inspired & Digital Culture.

Governance beginnt an der Quelle

Q: Warum scheitern so viele KI-Projekte an der Datenbasis?

Laut Gartner scheitern mehr als 80 Prozent der KI-Initiativen nicht an der Modellqualität, sondern an fehlenden KI-fähigen Daten. Das eigentliche Problem ist kein Datenqualitätsproblem, sondern ein Architekturproblem: Governance-Regeln liegen in Wikis, PDFs und Organigrammen vor — in Formaten, die kein KI-System lesen kann. Ein AI-Agent findet in dieser Dokumentationsschicht keine verwertbare Kontextinformation und kann daher keine zuverlässigen Ergebnisse liefern.

Q: Was ist das Data Management Model 5.1 und was unterscheidet es von früheren Versionen?

Das Data Management Model 5.1 ist ein ganzheitliches Architekturmodell von Marco Geuer (The Data Economist), das beschreibt, wie Unternehmensstrategie, Data Governance, Data Life Cycle und KI-Systeme als kohärente Einheit zusammenwirken. Die entscheidende Erweiterung gegenüber Version 5.0: Data Contracts werden als strukturelles Verbindungselement direkt an den operativen Quellsystemen verankert. Damit überführt das Modell Governance von manuell gepflegter Dokumentation in maschinenlesbare, automatisch durchsetzbare Form.

Q: Wie verändert das Data Contract CLI die Pflege des Data Catalogs?

In Version 5.0 des Data Management Models war der Data Catalog ein Repository, das manuell gepflegt werden musste — mit den bekannten Konsequenzen für Aktualität und Vollständigkeit. In Version 5.1 ändert sich das strukturell: Das Data Contract CLI generiert Katalogeinträge direkt aus YAML-Dokumenten. Aktualität und Vollständigkeit des Catalogs sind damit keine Frage der organisatorischen Disziplin mehr, sondern des Prozessdesigns. Governance skaliert, weil sie als automatisches Betriebsprodukt entsteht — nicht als manuell gepflegtes Dokumentationsartefakt.

Q: Welchen Zusammenhang gibt es zwischen Data Contracts und regulatorischer Compliance (DSGVO, EU AI Act)?

Das Data & AI Risk Management im Data Management Model 5.1 führt Security, Privacy und Compliance als strukturelle Schutzschicht zusammen. Data Contracts tragen direkt dazu bei, weil Compliance-Nachweise als automatisches Betriebsprodukt entstehen statt als manuell gepflegtes Dokumentationsartefakt. Für Anforderungen aus DSGVO und EU AI Act bedeutet das: Nachweispflichten werden operativ eingebettet, nicht nachträglich dokumentiert. Das senkt den Aufwand und erhöht gleichzeitig die Belastbarkeit der Nachweise.

Q: Welche konkreten Schritte sollten Führungskräfte jetzt einleiten, um das Data Management Model 5.1 umzusetzen?

Vier Handlungsfelder sind entscheidend. Erstens: Quellsystem-Verantwortung dort verankern, wo Daten täglich entstehen — in den Teams, die ERP, CRM und Supply-Chain-Systeme betreiben. Zweitens: Contract-First als verbindlichen Entwicklungsstandard einführen, damit kein neues Datenprodukt ohne abgestimmten Data Contract in Produktion geht. Drittens: Automatisierung über das Data Contract CLI als einzige tragfähige Skalierungsstrategie priorisieren. Viertens: Metadatenqualität als strategische Investitionsklasse behandeln, weil Datenqualität allein nicht ausreicht — KI-Systeme brauchen Kontext. Unternehmen, die diesen Kontext heute aufbauen, beschleunigen ihren KI-Rollout und reduzieren gleichzeitig die Fehlerquote in produktiven Systemen.

Das Data Management Model 5.1 und die neue Architektur für dateninspirierte Unternehmen

Mehr als 80 Prozent der KI-Initiativen in Unternehmen liefern keinen messbaren Ergebnisbeitrag. Gartner nennt fehlende KI-fähige Daten als häufigsten Grund für gescheiterte KI-Deployments. Dieser Befund klingt nach einem Datenqualitätsproblem. Tatsächlich ist er ein Architekturproblem.

Organisationen, die in KI investieren, treffen dabei implizit eine Annahme: dass ihre Datenbasis strukturell auf KI-Systeme vorbereitet ist. Diese Annahme ist in den meisten Fällen falsch. Nicht weil die Daten schlecht wären, sondern weil die Governance-Regeln, die ihre Nutzung steuern, in Formaten vorliegen, die kein KI-System lesen kann. Qualitätsregeln stehen in Wikis, Verantwortlichkeiten in Organigrammen, Nutzungsbedingungen in PDFs. Ein KI-Agent, der eine regulatorische Analyse erstellen soll, findet in dieser Dokumentationsschicht keine verwertbare Kontextinformation.

Das Data Management Model 5.1 adressiert genau diesen strukturellen Bruch. Es beschreibt nicht, wie Daten gespeichert und verarbeitet werden, das leisten Plattformen. Es beschreibt, wie Governance, Strategie, Data Life Cycle und KI-Systeme als kohärente Architektur zusammenwirken. Und es positioniert Data Contracts als das fehlende Verbindungselement zwischen operativer Datenproduktion und maschinenlesbarer Steuerung.

Definition | The Data Economist

Data Management Model 5.1 ist ein ganzheitliches Architekturmodell für dateninspirierte Unternehmen, das Unternehmensstrategie, Data & AI Strategy, Data Governance, Data Life Cycle Management und KI-Systeme als kohärente Einheit beschreibt. Die zentrale Erweiterung gegenüber Version 5.0: Data Contracts werden als maschinenlesbares Verbindungselement direkt an den operativen Quellsystemen verankert und überführen Governance von dokumentationsbasierter Steuerung in automatisch durchsetzbare Prozesse. Das Modell unterscheidet sich von Plattform-Architekturen dadurch, dass es nicht beschreibt, wie Daten gespeichert und verarbeitet werden, sondern wie Governance, Strategie und KI-Betrieb als strukturelle Einheit zusammenwirken.

Begriff geprägt von Marco Geuer, The Data Economist, 2026.

Von der Strategie zur Architektur

Jedes Datenmanagement-Modell, das nicht aus der Unternehmensstrategie heraus entwickelt wird, ist ein technisches Selbstzweckprojekt. Das Data Management Model 5.1 beginnt deshalb bewusst mit der Corporate Strategy als „WHY", der übergeordneten Frage, welchen Geschäftsnutzen Daten und KI im Unternehmen schaffen sollen.

Daraus leitet sich die Data & AI Strategy ab. Sie ist kein IT-Dokument, sondern die Übersetzung von Unternehmenszielen in konkrete Entscheidungen darüber, welche Daten in welcher Qualität und mit welchen Fähigkeiten bereitgestellt werden müssen. Vier Steuerungsdimensionen strukturieren diese Übersetzung: Data Scope definiert, welcher Datenumfang strategisch relevant ist. Principles & Ethics legen fest, welche Werte und Leitlinien das Handeln prägen. Organisation & Processes sichern die strukturellen Voraussetzungen für nachhaltiges Datenmanagement. Literacy beschreibt, wie Daten- und KI-Kompetenzen im Unternehmen systematisch aufgebaut werden.

Accountability und Stewardship verankern Verantwortung für Daten als organisatorisches Grundprinzip, nicht als Kontrollmechanismus, sondern als kulturelle Voraussetzung für eine belastbare Datenbasis.

Data Governance: Von der Kontrolle zur Steuerungsarchitektur

Data Governance definiert das „HOW" des Modells. Sie ist die Verbindung zwischen strategischer Absicht und operativer Umsetzung. Im Data Management Model 5.1 umfasst Governance nicht nur Rollen und Regeln, sie umfasst eine Architektur aus Bausteinen, die im gesamten Data Life Cycle zusammenwirken.

Die klassischen Governance-Funktionen, darunter Meta Data Management, Data Quality Management, Master Data Management und Reference Data Management, sind als strukturelle Bausteine im gesamten Lebenszyklus verankert. Sie sichern Transparenz, Qualität, Nachvollziehbarkeit und Compliance. Ihre Wirksamkeit ist direkt proportional dazu, wie früh sie im Datenfluss ansetzen. Ein Data Quality Framework, das erst in der Analytics-Schicht prüft, repariert keine strukturellen Fehler aus den Quellsystemen.

Ergänzend wirken übergreifende Governance-Elemente: der Data Catalog als zentrales Transparenz-Repository, Data Sharing als verbindendes Element zwischen Domänen und Partnern, und als neue strukturelle Erweiterung in Version 5.1 Data Contracts als das Instrument, das Governance in maschinenlesbare, automatisch durchsetzbare Form überführt.

Der operative Kern: Data Life Cycle Management

Das Data Life Cycle Management bildet den operativen Kern des Modells. Es gliedert sich in drei Phasen, die zusammen den vollständigen Datenfluss von der Entstehung bis zur Nutzung abbilden.

Plan & Design schafft die architektonische Grundlage. Datenmodelle und -strukturen werden entworfen, Sensibilitätsstufen klassifiziert und die grundlegende Datenlandschaft definiert. Diese Phase ist investiv, ihre Ergebnisse bestimmen die Qualität aller nachgelagerten Prozesse.

Maintain & Enhance ist die operative Hauptphase. Metadaten werden gepflegt, Datenqualität wird kontinuierlich gesichert, Stamm- und Referenzdaten werden konsistent gehalten. Moderne Plattformelemente wie Data Lake House, Data Fabric und Data Integration & Interoperability sichern den technischen Betrieb. KI-Assistenten und Multi AI Agents übernehmen zunehmend Routineaufgaben, Prozessoptimierung und autonome Echtzeit-Entscheidungen. Für sie gilt: Ihre Leistungsfähigkeit ist direkt abhängig von der Kontextinformation, die das Datenprodukt ihnen mitliefert.

Enable & Use ist die Wertschöpfungsphase. Business Intelligence, Reporting, Data Science, generative KI, Datenprodukte und Datenmonetisierung greifen auf die in den vorherigen Phasen bereitgestellten Daten zu. Die Güte dieser Nutzung steht und fällt mit der Verlässlichkeit der Datenbasis und damit mit der Qualität der Governance-Architektur, die sie absichert.

Das Modell unterscheidet dabei zwei Integrationsperspektiven: die internen Quellsysteme (CRM, Supply Chain, Finance, Material, Manufacturing, eCommerce) und die externen Partnersysteme. Daten fließen nicht isoliert, sondern sind in Wertschöpfungsnetzwerke eingebettet. Eine Governance-Architektur, die diese Einbettung nicht berücksichtigt, bleibt strukturell unvollständig.

Data Contracts: Governance als Eigenschaft des Datenprodukts

Mit Version 5.1 wird ein neues, strategisch bedeutsames Element eingeführt: Data Contracts. Im Modell sind sie direkt an den Operational Source Systems positioniert. Diese Verortung ist eine klare architektonische Aussage: Governance beginnt dort, wo Daten entstehen. Die verlässlichsten Contracts entstehen in den Teams, die die Daten täglich erzeugen, sie kennen Entstehungsbedingungen, Ausnahmefälle und Grenzen ihrer Daten besser als jede nachgelagerte Einheit. Wird dieses Wissen in einem maschinenlesbaren Data Contract formalisiert, entsteht Governance als inhärente Eigenschaft des Datenprodukts: prüfbar, versioniert und für alle Konsumenten zugänglich, für Mensch und KI-Agent gleichermaßen.

Data Catalog und Data Sharing, gestärkt durch Contracts

Der Data Catalog ist das Herzstück für Transparenz und Auffindbarkeit im Modell. Er bietet eine zentrale Übersicht aller strukturierten und unstrukturierten Datenanlagen und ermöglicht konsistente Suche, Sichtbarkeit zu Datenherkunft und Qualität sowie die Grundlage für regelkonformes Data Sharing. In Version 5.0 war der Catalog ein Repository, das manuell gepflegt werden musste. In Version 5.1 ändert sich das strukturell: Das Data Contract CLI generiert Katalogeinträge direkt aus YAML-Dokumenten. Aktualität und Vollständigkeit des Catalogs sind keine Frage der Disziplin mehr, sondern des Prozessdesigns.

Data Sharing ist das verbindende Element zwischen operativen Systemen, Fachbereichen und externen Partnern. Ohne maschinenlesbare Spielregeln basiert jede Datenweitergabe auf informellem Vertrauen und bilateralen Absprachen. Mit Data Contracts entsteht vertragsbasiertes Vertrauen: Jeder Konsument weiß aus dem Contract, was er von einem Datenprodukt erwarten kann, unter welchen Bedingungen er es nutzen darf und welche Service Level Agreements gelten. Dieses strukturelle Vertrauen ist die Voraussetzung für breite, skalierbare Datennutzung.

Data Contracts als Fundament für KI-Agenten

„Die Gleichung, die über den Erfolg von KI-Initiativen entscheidet, lautet nicht: Qualität der Modelle plus Rechenkapazität gleich Ergebnis. Sie lautet: Qualität der Modelle mal Kontextqualität der Daten gleich Ergebnis."

Marco Geuer, The Data Economist — Governance beginnt an der Quelle, 2026

KI-Agenten lesen keine Wikis. Sie benötigen Herkunft, Qualitätsstatus, Semantik und Zugriffsregeln direkt am Datenprodukt, in maschinenlesbarer Form. Nur Datenprodukte, die diese Kontextinformation über einen Data Contract mitführen, können von einem AI Operating System autonom entdeckt, bewertet und orchestriert werden. Data Contracts sind deshalb keine Ergänzung zur KI-Strategie, sondern ihre operative Voraussetzung.

Das Data & AI Risk Management als Schutzschicht

Alle Aktivitäten des Datenmanagements werden durch ein umfassendes Data & AI Risk Management abgesichert, das Security, Privacy und Compliance zusammenführt. Es ist die strukturelle Grundlage für die Erfüllung regulatorischer Anforderungen, insbesondere DSGVO und EU AI Act. Data Contracts tragen dazu bei, indem Compliance-Nachweise als automatisches Betriebsprodukt entstehen statt als manuell gepflegtes Dokumentationsartefakt.

Was Führungskräfte jetzt konkret angehen sollten

Das Data Management Model 5.1 ist eine strategische Entscheidung, keine technische. Sie berührt Organisationsstruktur, Rollenverteilung und die Frage, wie Governance grundsätzlich verstanden wird. Vier Handlungsfelder sind entscheidend.

Quellsystem-Verantwortung gehört dort verankert, wo Daten täglich entstehen. Datenproduzenten-Verantwortung muss in den Teams angesetzt werden, die operative Systeme betreiben: ERP, CRM, Supply Chain. Diese Teams kennen Entstehungsbedingungen, Ausnahmefälle und Grenzen ihrer Daten besser als jede nachgelagerte Einheit.

Contract-First sollte zum verbindlichen Entwicklungsstandard werden. Kein neues Datenprodukt geht ohne abgestimmten Data Contract in Produktion. Der gemeinsame Workshop zwischen produzierenden und konsumierenden Teams wird zur Pflichtphase, die Anforderungen explizit macht, bevor Entwicklungsaufwand entsteht.

Automatisierung ist die einzige Skalierungsstrategie, die trägt. Das Data Contract CLI ermöglicht es, aus einem YAML-Dokument automatisch Tests, Katalogeinträge und Compliance-Nachweise abzuleiten. Governance, die manuell gepflegt wird, ist keine Skalierungsstrategie für Datenlandschaften im KI-Zeitalter.

Metadatenqualität verdient den Status einer strategischen Investitionsklasse. Datenqualität ist eine notwendige, aber keine hinreichende Bedingung für KI-fähige Datenprodukte. Was KI-Systeme zusätzlich brauchen, ist Kontext. Unternehmen, die diesen Kontext heute aufbauen, beschleunigen ihren KI-Rollout und reduzieren die Fehlerquote in produktiven KI-Systemen gleichzeitig.

Das Data Management Model 5.1 macht deutlich: Nur wer Datenstrategie, Governance, Lifecycle und Wertschöpfung konsequent zusammendenkt, in der Organisation verankert und durch maschinenlesbare Data Contracts operationalisiert, kann Daten und KI als echten Wettbewerbsvorteil nutzen. Governance, die sich selbst durchsetzt, ist die logische Konsequenz aus der Entscheidung, Daten als Produkte zu behandeln und Data Contracts als ihr strukturelles Steuerungsinstrument zu nutzen.

Data Management Model 5.1 mit Data Contracts an Quellsystemen – Architektur für KI-fähige Daten — (Abb.: Data Management Model 5.1 - Erweiterung Data Contract)

Häufige Fragen zu Data Contracts und Data Management Model 5.1

Warum scheitern so viele KI-Projekte an der Datenbasis?

Laut Gartner liefern mehr als 80 Prozent der KI-Initiativen keinen messbaren Ergebnisbeitrag — als häufigster Grund werden fehlende KI-fähige Daten genannt. Das eigentliche Problem ist kein Datenqualitätsproblem, sondern ein Architekturproblem: Governance-Regeln liegen in Wikis, PDFs und Organigrammen vor, also in Formaten, die kein KI-System lesen kann. Ein AI-Agent, der eine regulatorische Analyse erstellen soll, findet in dieser Dokumentationsschicht keine verwertbare Kontextinformation.

Was ist das Data Management Model 5.1?

Das Data Management Model 5.1 ist ein von Marco Geuer (The Data Economist) entwickeltes ganzheitliches Architekturmodell, das beschreibt, wie Unternehmensstrategie, Data Governance, Data Life Cycle Management und KI-Systeme als kohärente Einheit zusammenwirken. Die entscheidende Erweiterung gegenüber Version 5.0: Data Contracts werden als maschinenlesbares Verbindungselement direkt an den Operational Source Systems verankert und überführen Governance von manuell gepflegter Dokumentation in automatisch durchsetzbare Steuerung.

Was sind Data Contracts und warum sind sie für KI-Systeme unverzichtbar?

Data Contracts sind maschinenlesbare Vereinbarungen zwischen Datenproduzenten und Datenkonsumenten, die Herkunft, Qualitätsstatus, Semantik und Zugriffsregeln eines Datenprodukts formal definieren. Ihre strategische Bedeutung liegt darin, dass KI-Agenten keine Wikis lesen: Sie benötigen diesen Kontext direkt am Datenprodukt. Nur Datenprodukte, die diese Kontextinformation über einen Data Contract mitführen, können von einem AI Operating System autonom entdeckt, bewertet und orchestriert werden. Data Contracts sind damit keine Ergänzung zur KI-Strategie, sondern ihre operative Voraussetzung.

Wo im Unternehmen sollten Data Contracts verantwortet werden?

Im Data Management Model 5.1 sind Data Contracts direkt an den Operational Source Systems positioniert. Governance beginnt dort, wo Daten entstehen. Die Teams, die ERP, CRM und Supply-Chain-Systeme betreiben, kennen Entstehungsbedingungen, Ausnahmefälle und Grenzen ihrer Daten besser als jede nachgelagerte Einheit. Wird dieses Wissen in einem maschinenlesbaren Data Contract formalisiert, entsteht Governance als inhärente Eigenschaft des Datenprodukts: prüfbar, versioniert und für Mensch und KI-Agent gleichermaßen zugänglich.

Wie verändert das Data Contract CLI die Arbeit mit dem Data Catalog?

In früheren Ansätzen war der Data Catalog ein Repository, das manuell gepflegt werden musste. Im Data Management Model 5.1 ändert sich das strukturell: Das Data Contract CLI generiert Katalogeinträge direkt aus YAML-Dokumenten. Aktualität und Vollständigkeit des Catalogs sind damit keine Frage der organisatorischen Disziplin mehr, sondern des Prozessdesigns. Governance skaliert, weil sie als automatisches Betriebsprodukt entsteht.

Welche Rolle spielen Data Contracts für DSGVO- und EU AI Act-Compliance?

Data Contracts tragen direkt zur Erfüllung regulatorischer Anforderungen bei, weil Compliance-Nachweise als automatisches Betriebsprodukt entstehen statt als manuell gepflegtes Dokumentationsartefakt. Das Data & AI Risk Management im Modell führt Security, Privacy und Compliance als strukturelle Schutzschicht zusammen. Für Anforderungen aus DSGVO und EU AI Act bedeutet das: Nachweispflichten werden operativ eingebettet, nicht nachträglich dokumentiert.

Welche konkreten Schritte sollte ein CDO jetzt einleiten?

Vier Handlungsfelder sind entscheidend: Erstens Quellsystem-Verantwortung in den Teams verankern, die operative Systeme bewirtschaften. Zweitens Contract-First als verbindlichen Entwicklungsstandard einführen, damit kein neues Datenprodukt ohne abgestimmten Data Contract in Produktion geht. Drittens Automatisierung über das Data Contract CLI als einzige tragfähige Skalierungsstrategie priorisieren. Viertens Metadatenqualität als strategische Investitionsklasse behandeln: KI-Systeme brauchen Kontext, nicht nur saubere Daten. Unternehmen, die diesen Kontext heute aufbauen, beschleunigen ihren KI-Rollout und reduzieren die Fehlerquote in produktiven Systemen.

Weitere interessante Artikel:

Datenmanagement, Data Governance, Data Quality, Data Management, Data Foundation, Data Contract, KI-Konvergenz

Geändert am 01. Juni 2026.
Aufrufe: 614

The Data Economist Blog (DE) | Etablierung einer Data Inspired & Digital Culture

Governance beginnt an der Quelle

Das Data Management Model 5.1 und die neue Architektur für dateninspirierte Unternehmen

Von der Strategie zur Architektur

Data Governance: Von der Kontrolle zur Steuerungsarchitektur

Der operative Kern: Data Life Cycle Management

Data Contracts: Governance als Eigenschaft des Datenprodukts

Data Catalog und Data Sharing, gestärkt durch Contracts

Data Contracts als Fundament für KI-Agenten

Das Data & AI Risk Management als Schutzschicht

Was Führungskräfte jetzt konkret angehen sollten

Häufige Fragen zu Data Contracts und Data Management Model 5.1

Weitere interessante Artikel:

Marco Geuer

Cookie-Einstellungen

Funktional

Präferenzen

Statistik

Marketing