Beiträge

Das Claude 4 System-Prompt: Ein Blick hinter die Kulissen
/
0 Kommentare
Ein Blick auf die System-Prompts von Claude 4, die die Interaktion und Sicherheit der KI-Modelle von Anthropic steuern.

GitHub MCP Exploited: Zugriff auf private Repositories über MCP
In diesem Artikel beleuchten wir eine kritische Sicherheitsanfälligkeit im offiziellen GitHub MCP Server, die es Angreifern ermöglicht, auf Daten aus privaten Repositories zuzugreifen.

OPENAI OPERATOR UPDATE: Einführung des o3 Operators
Im Januar 2025 hat OpenAI den Operator vorgestellt, ein Produkt, das auf dem Computer Using Agent (CUA) Modell basiert und als Forschungs-Vorschau dient.

Anthropic aktiviert fortschrittliche Sicherheitsprotokolle für Claude Opus 4
Anthropic hat die AI Safety Level 3 (ASL-3) Sicherheitsprotokolle für Claude Opus 4 aktiviert, um den Diebstahl von Modellgewichten zu verhindern und den Missbrauch für chemische und biologische Waffen zu minimieren.

Google präsentiert Verteidigungsstrategien gegen AI Prompt Injection Angriffe
Google DeepMind hat neue Verteidigungsstrategien gegen indirekte Prompt Injection Angriffe vorgestellt, die die Sicherheit ihres KI-Modells Gemini verbessern sollen.

Robustheit von LLM-basierten Sicherheitsrichtern
Die Studie untersucht die Schwachstellen von LLM-basierten Sicherheitsrichtern und zeigt, wie Eingabensensitivität und adversarielle Angriffe die Zuverlässigkeit der Bewertungen beeinträchtigen können.

FBI warnt vor Deepfake-Betrügereien, die Regierungsbeamte imitieren
Das FBI warnt vor einer Betrugsmasche, bei der KI-generierte Sprachdeepfakes verwendet werden, um hochrangige US-Beamte zu imitieren und Regierungsmitarbeiter zu täuschen.

KLARNA’S AI RETRENCHMENT AND BROADER AI APP RISK
Klarna's Entscheidung, ihre Investitionen in Künstliche Intelligenz zurückzufahren, ist ein Signal für tiefere Probleme in der Branche, die mit dem probabilistischen Verhalten von KI in der Produktion zusammenhängen.

Google integriert Gemini Nano in Chrome zur Bekämpfung von Online-Betrug
Google hat Gemini Nano in Chrome integriert, um Nutzer vor Online-Betrug zu schützen. Der Artikel beleuchtet die neuen Technologien und Maßnahmen, die Google ergreift, um Betrügereien zu bekämpfen.