Claude Fable 5 und die neue Realität von KI-gestütztem Drittparteirisiko

new global third party party risk from AI
emma-stevens-bio-portrait
Written by Emma Stevens
Threat Intelligence Researcher

Anthropic hat kürzlich die Einführung von Claude Fable 5 angekündigt, einer öffentlichen Version seines leistungsstärkeren Mythos-KI-Modells. Eine Technologie, die zuvor nur einer ausgewählten kleinen Zahl von Organisationen zugänglich war, steht nun Unternehmen auf Enterprise-Niveau zur Verfügung. Während KI-Anbieter Schutzmechanismen aufbauen, analysieren Bedrohungsakteure bereits ihre Angriffsvektoren. Im Grunde geben wir Unternehmen die Schlüssel zur KI-Welt in die Hand und hoffen, dass die Schutzplanken standhalten. Security-Teams müssen sich jetzt noch schneller darauf vorbereiten. Mythos ist kein theoretisches Risiko mehr.

Warum Fable 5 für Security-Teams relevant ist

Für mich liegt die größere Bedeutung der Veröffentlichung von Anthropic’s Fable 5 in dem Signal, das sie an Security-Teams sendet: KI wird leistungsfähiger, tiefer in Geschäftsprozesse eingebettet und innerhalb traditioneller Risikomanagementprozesse zunehmend schwieriger zu kontrollieren. Anthropic hat sogar davor gewarnt, dass sich KI rasch der rekursiven Selbstverbesserung nähert – also der Fähigkeit von KI-Systemen, sich ohne direkte menschliche Eingriffe selbst weiterzuentwickeln. Für alle, die sich noch an eine Zeit erinnern, in der autonome Systeme Stoff für Science-Fiction waren, fühlt sich das mittlerweile beunruhigend real an. Wir bewegen uns ganz klar in unbekanntem Terrain, auf das wir uns schnell einstellen müssen.

Die Sicherheitsleitplanken von Fable 5: Ein guter Anfang (aber nicht genug)

Fable 5 ist die öffentlich verfügbare, stärker abgesicherte Version von Anthropic’s Mythos-Klasse-Modell. Es verfügt über Sicherheitsklassifizierungen, Fallback-Verhalten und klare Beschränkungen in Hochrisikobereichen wie Cybersicherheit, Biologie, Chemie und Model Distillation. Anthropic hat zudem angekündigt, dass für den Datenverkehr von Fable 5 und Mythos 5 eine Aufbewahrungsfrist von 30 Tagen gelten wird – selbst für einige Enterprise-Kunden, die zuvor Vereinbarungen zur Nullspeicherung hatten.

Das ist enorm. Einerseits zeigt es, dass Anthropic das Risiko von Missbrauch ernst nimmt – ein Punkt, den viele Security-Experten bereits angesprochen haben. Leistungsfähigere Modelle erfordern mehr Überwachung, mehr Transparenz und mehr Schutzmechanismen. Andererseits macht es auch ein viel größeres Problem für Unternehmen deutlich: Je leistungsfähiger diese Modelle werden, desto mehr Risiken bringen sie in Bezug auf Datenzugriff, Datenspeicherung, Berechtigungen und die Exponierung gegenüber Drittparteien mit sich.

Oft geben wir diesen Modellen Zugriff auf unsere Daten, damit sie uns helfen, schneller zu skalieren. Der Preis dafür ist jedoch: Je mehr Zugriff ein KI-Tool auf unsere Daten hat, desto größer ist das Risiko, dass ein Bedrohungsakteur im Fall einer Kompromittierung des Tools, eines angebundenen Systems oder der Identitätsschicht auf dieselben sensiblen Daten zugreifen könnte.

CISOs können sich bei der Steuerung dieses Risikos nicht allein auf die Schutzmechanismen der Anbieter verlassen. Sicherheitsklassifizierungen sind wichtig, aber sie stellen keine vollständige Sicherheitsstrategie dar. Modelle können gejailbreakt werden. Bitsight Threat Intelligence hat beobachtet, dass Bedrohungsakteure aus allen drei Bereichen – Ransomware, Hacktivisten und staatlich unterstützte Akteure – darüber diskutieren, wie sich verschiedene KI-Modelle jailbroken lassen.

Das eigentliche Risiko: Datenzugriff und Berechtigungen

Auch wenn Anthropic das Thema Sicherheit ernst nimmt, ist es vernünftig, sich auf eine Welt vorzubereiten, in der nicht jedes konkurrierende Modell mit demselben Maß an Schutzmechanismen veröffentlicht wird. Und selbst wenn der Modellanbieter die richtigen Maßnahmen ergreift, müssen Unternehmen dennoch verstehen, wie diese Tools im gesamten Unternehmen, in ihren Vendor-Ökosystemen und im Hinblick auf den Umfang der Datenzugriffe durch KI-Modelle eingesetzt werden.

Unternehmen gewähren KI-Systemen heute mehr Berechtigungen als je zuvor. KI-Tools werden mit Code-Repositories, Cloud-Umgebungen, Kundendaten, Ticketing-Systemen, internen Dokumenten, Collaboration-Tools und Security-Workflows verbunden. In vielen Fällen generieren diese Tools nicht nur Text. Sie führen Aktionen aus, rufen andere Tools auf, schreiben Code, analysieren Schwachstellen und geben Empfehlungen ab, die reale Geschäftsprozesse beeinflussen können.

Das Drittparteienproblem

Auch wenn ein Unternehmen sich bewusst dafür entscheiden kann, auf KI mit beispiellosem Datenzugriff zu verzichten – tun seine Anbieter dasselbe? Wie steht es um SaaS-Plattformen, Managed Service Provider, Softwareanbieter, Support-Tools, Analyseplattformen oder Sicherheitsanbieter, die im Hintergrund möglicherweise bereits Frontier-KI einsetzen? Genau hier wird das Risiko komplex.

Dadurch entsteht ein neuer Fragenkatalog, den Security-Teams stellen müssen:

  • Welche KI-Modelle nutzen unsere Anbieter?
  • Welche Daten werden von diesen Modellen verarbeitet?
  • Werden Prompts, Outputs oder Logs gespeichert?
  • Verfügen Anbieter über Zero-Retention-Vereinbarungen, oder ändern sich diese Bedingungen, je leistungsfähiger die Modelle werden?
  • Welche Berechtigungen haben KI-Tools innerhalb geschäftskritischer Systeme?
  • Können diese Tools auf sensible Kunden-, Mitarbeiter- oder Betriebsdaten zugreifen?
  • Wie überwachen Anbieter Missbrauch, Jailbreaks und auffälliges Verhalten?
  • Und wenn ein Anbieter KI zum Schreiben oder Pflegen von Software einsetzt – wie wird dieser Code validiert, bevor er bei uns eingesetzt wird?

An diesem Punkt beginnt KI-Risiko stark wie Drittparteienrisiko auszusehen.

Geschwindigkeit als neue Angriffsfläche

Der andere entscheidende Faktor ist Geschwindigkeit. Fable 5 und ähnliche Modelle zeigen, wie schnell fortschrittliche KI bei der Softwareentwicklung, Analyse und komplexen technischen Aufgaben unterstützen kann. Für Entwickler ist das spannend, für Verteidiger verändert es jedoch die Ausgangslage grundlegend.

Das Auffinden von Schwachstellen wird günstiger und schneller. Es wird einfacher, Informationen über Schwachstellen in konkrete Maßnahmen zu überführen. Bedrohungsakteure werden dieselben Fähigkeiten nutzen, um noch schneller von einer Offenlegung zur Entwicklung von Exploits zu gelangen. Man vergisst leicht, dass dieselben Tools, die wir für unsere Verteidigung einsetzen, auch von Bedrohungsakteuren analysiert und genutzt werden. Das bedeutet nicht, dass jede Schwachstelle sofort zu einer Krise wird, aber es bedeutet, dass Security-Teams eine bessere Möglichkeit brauchen, um zu verstehen, worauf es tatsächlich ankommt.

Nicht jede CVE betrifft jedes Unternehmen. Nicht jede Schwachstelle erzeugt dasselbe Risikoniveau. Die Herausforderung besteht darin, zu wissen, welche Exponierungen die eigene Organisation betreffen, welche die Anbieter betreffen und bei welchen es bereits Diskussionen unter Bedrohungsakteuren oder Anzeichen einer aktiven Ausnutzung gibt. Priorisierung selbst muss zur Priorität werden.

Wo Bitsight unterstützen kann

Security-Teams benötigen Transparenz über ihre eigenen internetexponierten Assets, aber auch über das erweiterte Ökosystem, von dem sie abhängig sind. Sie müssen verstehen, wo kritische Anbieter exponiert sein könnten, wo Viertparteien-Abhängigkeiten Risiken schaffen und wo eine neue Schwachstelle geschäftliche Auswirkungen haben könnte. Ebenso wichtig ist es zu verstehen, welche Bedrohungsakteure für das eigene Unternehmen, die eigene Branche und die eigenen Anbieter relevant sind. So wie nicht jede CVE für jedes Unternehmen relevant ist, gilt das auch nicht für jede Bedrohung und jeden Bedrohungsakteur.

Das ist in einer KI-gestützten Bedrohungslandschaft besonders wichtig. Wenn KI die Zeitspanne zwischen der Offenlegung einer Schwachstelle und ihrer Ausnutzung verkürzt, können Organisationen nicht auf manuelle Benachrichtigungen von Anbietern oder jährliche Fragebögen warten. Sie brauchen kontinuierliche Transparenz, Echtzeit-Intelligence und eine Möglichkeit, die Risiken zu priorisieren, die am wichtigsten sind.

Bitsight unterstützt dabei durch:

  • Echtzeit-Threat-Intelligence
  • CVE-Priorisierung mit dem DVE-Score
  • Tracking von Bedrohungsakteuren
  • MITRE-Mapping
  • Third-Party Risk Management
  • Threat Intelligence für Drittparteien

Warum das alles wichtig ist

Die zentrale Erkenntnis aus Fable 5 ist nicht nur, dass ein bestimmtes Modell leistungsfähig ist oder dass ein Anbieter eine konkrete Entscheidung zur Datenspeicherung getroffen hat. Entscheidend ist vielmehr, dass Frontier-KI zunehmend zu operativer Infrastruktur wird. Sie wird in die Tools integriert, die Unternehmen täglich nutzen – einschließlich der Tools, die ihre Anbieter täglich einsetzen. Das bedeutet, dass AI Governance, Third-Party Risk Management, Exposure Management und die Priorisierung von Schwachstellen heute Teil derselben Diskussion sind.

Die Organisationen, die damit gut umgehen, werden nicht diejenigen sein, die versuchen, alles zu patchen oder jeden denkbaren KI-Anwendungsfall zu blockieren. Erfolgreich werden diejenigen sein, die wissen, wo sie exponiert sind, verstehen, welche Risiken für ihr Geschäft wirklich relevant sind, und schnell handeln können, wenn KI die Geschwindigkeit der Bedrohungslandschaft verändert. Fable 5 erinnert daran, dass sich KI-Fähigkeiten rasant weiterentwickeln. Das Risikomanagement muss sich noch schneller weiterentwickeln.

2026 GigaOM TPRM Radar cover

See why GigaOm named Bitsight a Leader in TPRM

Third-party risk is now a business-critical priority for security and risk leaders. In GigaOm’s latest Radar report for Third-Party Risk Management, Bitsight was positioned as a Leader and Fast Mover for its externally sourced cyber risk ratings, continuous monitoring, API-first integrations, and vendor risk visibility.