Question 1

Was ist ein KI-Penetrationstest?

Accepted Answer

Ein KI-Penetrationstest ist eine autorisierte Sicherheitsprüfung von KI-Systemen durch spezialisierte Experten. Wir simulieren reale Angriffe auf Ihre Large Language Models (LLMs), ML-Modelle, RAG-Systeme und KI-Agenten — von Prompt Injection über Jailbreaking bis hin zu Datenexfiltration und Modelldiebstahl. Anders als bei klassischen Pentests testen wir nicht nur die Infrastruktur, sondern die KI-Logik selbst: Guardrails, Alignment, Trainingsintegrität und Agentenverhalten.

Question 2

Welche Arten von KI-Systemen testen Sie?

Accepted Answer

Wir testen alle marktgängigen KI-Architekturen: LLM-basierte Chatbots und Copiloten (GPT, Claude, Llama, Mistral), RAG-Systeme (Retrieval-Augmented Generation), KI-Agenten mit Tool-Zugriff, klassische ML-Modelle (Fraud Detection, Scoring, Diagnostik), multimodale Systeme (Bild + Text) sowie die zugehörige Infrastruktur (APIs, MLOps-Pipelines, Vektordatenbanken). Ob Self-hosted oder Cloud-API — der Testansatz wird individuell auf Ihre Architektur zugeschnitten.

Question 3

Was ist der Unterschied zwischen KI-Pentesting und KI-Red-Teaming?

Accepted Answer

Ein KI-Pentest prüft Ihr System systematisch gegen bekannte Schwachstellenklassen (OWASP Top 10 for LLMs, MITRE ATLAS). Sie erhalten eine priorisierte Liste aller Findings mit Reproduktionsschritten. KI-Red-Teaming geht weiter: Wir simulieren über mehrere Wochen kreative, realistische Angriffsszenarien — auch solche, die noch in keiner Taxonomie stehen. Das Ziel ist nicht nur eine Schwachstellenliste, sondern die Antwort: Wie weit kommt ein motivierter Angreifer gegen Ihre KI-gestützten Prozesse?

Question 4

Was ist Prompt Injection und warum ist das gefährlich?

Accepted Answer

Prompt Injection ist die derzeit kritischste Schwachstelle in LLM-Anwendungen (OWASP LLM01). Ein Angreifer manipuliert die Eingabe so, dass das Modell seine Systemanweisungen ignoriert und stattdessen die Anweisungen des Angreifers ausführt. Bei direkter Prompt Injection geschieht das über die Benutzereingabe, bei indirekter Prompt Injection über vergiftete Dokumente oder Datenquellen, die das Modell verarbeitet (besonders kritisch bei RAG-Systemen). Die Folgen reichen von Datenabfluss über Reputation-Schäden bis zur Remote Code Execution, wenn das LLM an Tools oder APIs angebunden ist.

Question 5

Brauche ich einen KI-Pentest für die EU-AI-Act-Compliance?

Accepted Answer

Artikel 15 des EU AI Act verlangt für Hochrisiko-KI-Systeme „ein angemessenes Maß an Genauigkeit, Robustheit und Cybersicherheit" über den gesamten Lebenszyklus — einschließlich Widerstandsfähigkeit gegen Datenvergiftung, Adversarial Attacks und Modellmanipulation. Ein KI-Penetrationstest liefert genau diesen Nachweis. Für GPAI-Modell-Anbieter gelten die Governance-Pflichten ab August 2025. Unser Bericht ist als auditierbarer Compliance-Nachweis konzipiert und mappt alle Findings auf die relevanten EU-AI-Act-Artikel.

Question 6

Was ist OWASP Top 10 for LLMs?

Accepted Answer

Das OWASP Top 10 for Large Language Model Applications ist der internationale Community-Standard für LLM-Sicherheit, entwickelt von über 600 Experten aus 18 Ländern. Die zehn Kategorien umfassen: Prompt Injection, Insecure Output Handling, Training Data Poisoning, Model Denial of Service, Supply Chain Vulnerabilities, Sensitive Information Disclosure, Insecure Plugin Design, Excessive Agency, Overreliance und Model Theft. Wir nutzen diese Taxonomie als methodische Grundlage für jeden LLM-Pentest und ergänzen sie um das MITRE-ATLAS-Framework für die Bedrohungsmodellierung.

Question 7

Was ist MITRE ATLAS?

Accepted Answer

MITRE ATLAS (Adversarial Threat Landscape for Artificial-Intelligence Systems) ist die KI-spezifische Erweiterung des bekannten MITRE ATT&CK-Frameworks. Es dokumentiert Taktiken, Techniken und Verfahren (TTPs) realer Angriffe auf KI-Systeme — von Reconnaissance über Model Evasion bis hin zu Datenexfiltration. Wir nutzen ATLAS für die Bedrohungsmodellierung Ihres KI-Systems und strukturieren unsere Red-Team-Szenarien entlang dieser Angriffsmatrix.

Question 8

Wie läuft ein KI-Penetrationstest bei AWARE7 ab?

Accepted Answer

Unser Prozess umfasst fünf Phasen: 1) Scoping-Workshop — Identifikation aller KI-Komponenten, Bedrohungsmodellierung nach MITRE ATLAS, Definition der Rules of Engagement. 2) Reconnaissance — Analyse der KI-Architektur, Modell-Endpunkte, Daten-Pipelines, Guardrails und Integrationen. 3) Vulnerability Testing — automatisierte Scans (Garak, Promptfoo) kombiniert mit manueller Expertenanalyse für Prompt Injection, Jailbreaking, Datenexfiltration, Guardrail-Bypass und Agentenverhalten. 4) Exploitation — Bestätigung kritischer Findings mit Proof-of-Concept, Verkettung zu realistischen Angriffsszenarien. 5) Reporting — technischer Bericht mit CVSS-Scoring, Compliance-Mapping (OWASP, EU AI Act, ISO 42001) und priorisierter Remediation-Roadmap.

Question 9

Was kostet ein KI-Penetrationstest?

Accepted Answer

Die Kosten richten sich nach Scope und Komplexität. Ein fokussierter LLM-Pentest (einzelner Chatbot/Copilot, OWASP Top 10 LLM) beginnt ab 8.100 EUR netto. Ein umfassendes KI-Security-Assessment mit mehreren Modellen, RAG-System und Agenten-Testing beginnt ab 14.850 EUR netto. Ein vollumfängliches KI-Red-Teaming über 4–6 Wochen beginnt ab 25.650 EUR netto. Sie erhalten innerhalb von 48 Stunden ein verbindliches Festpreisangebot — keine Stundensätze, keine Nachforderungen.

Question 10

Was ist ISO 42001 und brauche ich das?

Accepted Answer

ISO/IEC 42001 ist der internationale Standard für KI-Managementsysteme — vergleichbar mit ISO 27001 für Informationssicherheit, aber spezifisch für KI. Der Standard definiert 38 Controls in 9 Zielkategorien und ermöglicht eine Zertifizierung. Für Unternehmen, die KI in regulierten Bereichen einsetzen (Finanzwesen, Gesundheit, kritische Infrastruktur), wird ISO 42001 zunehmend zum Differenzierungsmerkmal gegenüber Kunden und Aufsichtsbehörden. Ein KI-Pentest liefert die technischen Nachweise, die Sie für die Controls in ISO 42001 benötigen.

Question 11

Können Sie auch KI-Guardrails testen?

Accepted Answer

Ja. Wir testen systematisch alle Schutzschichten Ihrer KI-Anwendung: Content-Filter, Jailbreak-Detektoren, PII-Masking, Output-Validatoren und Constitutional Classifiers. Dabei prüfen wir sowohl die Bypass-Resistenz (False-Negative-Rate unter adversarialen Bedingungen) als auch die False-Positive-Rate (blockiert der Guardrail legitime Nutzung?). Sie erhalten eine quantitative Bewertung der Guardrail-Effektivität mit konkreten Empfehlungen zur Härtung.

Question 12

Wie oft sollte ein KI-System getestet werden?

Accepted Answer

KI-Systeme erfordern häufigere Tests als klassische Software: Modelle werden regelmäßig nachtrainiert, RAG-Inhalte ändern sich täglich, Agenten erhalten neue Fähigkeiten — jede Änderung kann neue Schwachstellen einführen, ohne dass eine einzige Zeile Code geändert wurde. Wir empfehlen: mindestens jährlich einen vollständigen KI-Pentest, bei kritischen Systemen halbjährlich. Für Unternehmen mit kontinuierlichem Model-Update-Zyklus bieten wir ein Retainer-Modell mit quartalsweisen Tests an.

Wie sicher ist Ihre
Künstliche Intelligenz?

KI-Systeme werden angegriffen — anders als klassische Software

Was wir testen

LLM-Pentest

RAG-System-Sicherheit

KI-Agenten-Testing

Guardrail-Assessment

ML-Modell-Sicherheit

KI-Infrastruktur

Unser Vorgehen in fünf Phasen

Scoping & Threat Modeling

Reconnaissance

Vulnerability Testing

Exploitation & PoC

Reporting & Remediation

Ein Test — alle Nachweise

OWASP Top 10 LLM

MITRE ATLAS

EU AI Act

ISO/IEC 42001

NIST AI RMF

BSI / NIS-2

Transparent kalkuliert

LLM-Pentest

KI-Security-Assessment

KI-Red-Teaming

Was uns von anderen Anbietern unterscheidet

Forschung und Lehre als Fundament

Digitale Souveränität - keine Kompromisse

Festpreis in 24h - planbare Projektzeiträume

Ihr fester Ansprechpartner - jederzeit erreichbar

OWASP Top 10 for Large Language Models

Management von Cyber-Risiken

Referenzen aus der Praxis

Häufige Fragen zum KI-Penetrationstest

AI/LLM Security: Prompt Injection, Jailbreaking und Red Teaming für KI-Systeme

KI-gestützte Cyberangriffe: Deepfakes, AI-Phishing und automatisierte Exploits

Spezialisierte Penetrationstests: Mobile, OT/ICS, API, LLM & 5G

Wie sicher ist Ihre KI wirklich?

KI-Systeme werden angegriffen — anders als klassische Software

Was wir testen

LLM-Pentest

RAG-System-Sicherheit

KI-Agenten-Testing

Guardrail-Assessment

ML-Modell-Sicherheit

KI-Infrastruktur

Unser Vorgehen in fünf Phasen

Scoping & Threat Modeling

Reconnaissance

Vulnerability Testing

Exploitation & PoC

Reporting & Remediation

Ein Test — alle Nachweise

OWASP Top 10 LLM

MITRE ATLAS

EU AI Act

ISO/IEC 42001

NIST AI RMF

BSI / NIS-2

Transparent kalkuliert

LLM-Pentest

KI-Security-Assessment

KI-Red-Teaming

Was uns von anderen Anbietern unterscheidet

Forschung und Lehre als Fundament

Digitale Souveränität - keine Kompromisse

Festpreis in 24h - planbare Projektzeiträume

Ihr fester Ansprechpartner - jederzeit erreichbar

OWASP Top 10 for Large Language Models

Management von Cyber-Risiken

Referenzen aus der Praxis

Häufige Fragen zum KI-Penetrationstest

Weiterführende Artikel

AI/LLM Security: Prompt Injection, Jailbreaking und Red Teaming für KI-Systeme

KI-gestützte Cyberangriffe: Deepfakes, AI-Phishing und automatisierte Exploits

Spezialisierte Penetrationstests: Mobile, OT/ICS, API, LLM & 5G

Wie sicher ist Ihre KI wirklich?