Share
Beitragsbild zu Von „Shit in, shit out“ zum „Golden Record“: Wie KI Identitätsdaten zu mehr Qualität verhilft

Von „Shit in, shit out“ zum „Golden Record“: Wie KI Identitätsdaten zu mehr Qualität verhilft

7. Juli 2025

Auch für das Identitäts- und Berechtigungsmanagement gilt: Es steht und fällt mit der Qualität der zugrunde liegenden Daten. Was trivial klingt, ist in der Praxis eine der größten Schwachstellen vieler IAM-Projekte: Inkonsistente, doppelte oder unvollständige Stammdaten führen zu Fehlentscheidungen, Prozessabbrüchen und Sicherheitsrisiken. Projektverzögerungen, manuelle Aufwände oder erschwerte Governance sind ebenso denkbar. Doch mit der richtigen Kombination aus automatisierten Prozessen und künstlicher Intelligenz lässt sich die Datenqualität systematisch verbessern – und damit die Wirksamkeit von IAM-Systemen.

Die unterschätzte Achillesferse im IAM

In den meisten Unternehmen liegen Identitätsdaten verteilt über unterschiedliche Systeme – HR, Onboarding-Tools, CRM, Active Directory oder dezentrale Fachanwendungen. Diese Daten sind häufig historisch gewachsen und wurden von Verantwortlichen nie zentral konsolidiert oder aktiv gepflegt. Die Folge: Dubletten, Tippfehler, veraltete Rollen, verwaiste Accounts. Was erst einmal nur lästig klingt, kann echte Gefahren bedeuten. Denn wenn unzuverlässige Informationen über Benutzer, ihre Rollen und Berechtigungen überwiegen, können sie sich zum ernstzunehmenden Sicherheitsrisiko entwickeln.

Schließlich steht und fällt die präzise Arbeit eines IAM-Systems mit der Datenbasis, auf die es aufsetzt. Erkennen Organisationen beispielsweise veraltete Rollen nicht oder führen Personen mehrfach, kommt es zu redundanten Zugriffsrechten, erhöhtem Audit-Aufwand und den bereits angesprochenen potenziellen Sicherheitslücken. Die klassische „Garbage in, garbage out“-Problematik trifft das Identitätsmanagement mit voller Wucht.

Von der Analyse zur Bereinigung: Was KI leisten kann

Hier kommen KI-gestützte Verfahren ins Spiel. Sie helfen, die Identitätsdaten systematisch zu analysieren, Muster zu erkennen und problematische Einträge automatisiert zu identifizieren. Dabei weisen sie eine Genauigkeit auf, die rein regelbasierten Systemen weit überlegen ist. Typische Einsatzbereiche sind:

  • Dublettenerkennung: Über KI-gestützte Ähnlichkeitsalgorithmen lassen sich doppelt gepflegte Nutzerprofile auch dann erkennen, wenn Schreibweisen abweichen oder IDs unterschiedlich sind. Manchmal reicht hierfür jedoch auch ETL (extract – transform – load), und man kommt ohne KI aus.
  • Plausibilitätsprüfungen: Ungewöhnliche Rollenkombinationen, selten genutzte Accounts oder inkonsistente Metadaten können automatisiert identifiziert und zur Überprüfung angestoßen werden. Hier hilft die KI bei der Automation der wiederkehrenden Massendatenanalyse.
  • Vervollständigung fehlender Informationen: KI-gestützte Vorschläge auf Basis von Ähnlichkeitsclustern oder historischen Daten helfen, unvollständige Profile zu ergänzen – etwa bei Abteilungszugehörigkeit, Standort oder Funktionsbezeichnung.
  • Automatische Namensfindung: Viele Anwendungsrollen bzw. Einzelrechte in Zielsystemen haben eher technische Bezeichnungen. Die KI kann bereits heute erfolgreich und treffsicher Namen ableiten, die dem Endanwender verständlich sind.
  • Klartextanalysen: Die meisten Recherchen und Abfragen in IAM-Systemen haben bislang erhebliche technische Grundkenntnisse erfordert. Die KI hilft dabei, für Anwender, Auditoren und Prüfer, aber auch IAM-Experten einfach beschriebene Anfragen in konkrete technische Abfragen und Analysen umzuwandeln. So kann selbst ein Neuling im IAM-Kontext komplexe Reports erstellen.

Besonders effektiv wird der Einsatz von KI in Kombination mit usage-basierten Analysen. Wenn ein System erkennt, welche Rollen tatsächlich genutzt werden und welche nicht, lassen sich überflüssige Zugriffe gezielt abbauen. Ein wichtiger Schritt hin zu schlanken und revisionssicheren Berechtigungskonzepten, den jedes Unternehmen für maximale Sicherheit gehen sollte. Denn bei IAM sollte stets das Least-Privilege-Prinzip gelten.

Smarte Prozesse statt starrer Regeln

Während klassische Datenbereinigung oft als einmaliges Projekt gedacht wird, erlaubt der Einsatz von KI einen kontinuierlichen, lernenden Ansatz: Die Systeme optimieren sich mit jedem neuen Datensatz und verbessern sich darin, potenzielle Fehlerquellen zu erkennen. Gleichzeitig reduziert sich der manuelle Aufwand für IT und Fachbereiche – dank gezielter, nachvollziehbarer und priorisierter Vorschläge. Das gilt vor allem für die Erzeugung „sprechender Namen“ für Rollen und Berechtigungen, deren technische Namen vorher nur Eingeweihten eine Zuordnung ermöglicht haben.

Moderne Lösungen setzen zusätzlich auf intelligente Workflows und intelligente Vorschlagslogik. Somit bekommen Fachverantwortliche nur die Fälle vorgelegt, die tatsächlich Klärungsbedarf aufweisen – mit verständlicher Begründung, passendem Kontext und klarer Empfehlung. Die Entscheidung bleibt beim Menschen, die Vorarbeit übernimmt das System.

IAM als Datenqualitätsmotor

Spannend wird es dort, wo IAM nicht nur von Datenqualität profitiert, sondern selbst zum Enabler wird. Durch die Integration von Rückmeldemechanismen, Self-Service-Funktionen und automatisierten Korrekturvorschlägen kann das Identitätsmanagement aktiv zur Stammdatenpflege beitragen – etwa durch:

  • Echtzeitprüfungen bei der Benutzeranlage,
  • Rollenempfehlungen beim Abteilungswechsel oder
  • Feedback-Mechanismen bei falsch zugewiesenen Berechtigungen.

Die Trennung zwischen Datenverantwortung und Berechtigungsmanagement wird so überwunden. IAM entwickelt sich vom passiven Abnehmer zum aktiven Datenqualitätsmotor weiter. Es bleibt aber dabei, dass die eigentliche Änderung am Datensatz oder dem fehlerhaften Attribut „an der Quelle“ stattfinden sollte – die Autorität der Stammdaten in HR etwa, muss unangetastet bleiben, um ein gegenseitiges Überschreiben zu verhindern.

Ohne Datenqualität keine Kontrolle

Wer Identitäten effektiv managen will, braucht neben Prozessen, Richtlinien und Tools vor allem valide, vollständige und konsistente Daten. Ohne diese Grundlage laufen selbst ausgefeilte IAM-Systeme ins Leere. Künstliche Intelligenz bietet hier einen echten Mehrwert: Sie erkennt Muster, deckt Inkonsistenzen auf und macht Vorschläge, die die Datenbasis dauerhaft verbessern – ohne zusätzlichen Aufwand für IT oder Fachbereich.

https://uso-csp.com/

Autor: Sebastian Rohr, Managing Director, Umbrella Security Operations GmbH, Co-Founder, umbrella.associates GmbH