Beiträge

Anthropic aktiviert fortschrittliche Sicherheitsprotokolle für Claude Opus 4
/
0 Kommentare
Anthropic hat die AI Safety Level 3 (ASL-3) Sicherheitsprotokolle für Claude Opus 4 aktiviert, um den Diebstahl von Modellgewichten zu verhindern und den Missbrauch für chemische und biologische Waffen zu minimieren.

Google präsentiert Verteidigungsstrategien gegen AI Prompt Injection Angriffe
Google DeepMind hat neue Verteidigungsstrategien gegen indirekte Prompt Injection Angriffe vorgestellt, die die Sicherheit ihres KI-Modells Gemini verbessern sollen.

Robustheit von LLM-basierten Sicherheitsrichtern
Die Studie untersucht die Schwachstellen von LLM-basierten Sicherheitsrichtern und zeigt, wie Eingabensensitivität und adversarielle Angriffe die Zuverlässigkeit der Bewertungen beeinträchtigen können.

FBI warnt vor Deepfake-Betrügereien, die Regierungsbeamte imitieren
Das FBI warnt vor einer Betrugsmasche, bei der KI-generierte Sprachdeepfakes verwendet werden, um hochrangige US-Beamte zu imitieren und Regierungsmitarbeiter zu täuschen.

OpenAI startet Safety Metrics Hub angesichts von Transparenzbedenken
OpenAI hat einen Safety Evaluations Hub vorgestellt, der die Leistung von Modellen in Bezug auf Halluzinationen, schädliche Inhalte, Jailbreak-Widerstand und Anweisungsbefolgung verfolgt.

KLARNA’S AI RETRENCHMENT AND BROADER AI APP RISK
Klarna's Entscheidung, ihre Investitionen in Künstliche Intelligenz zurückzufahren, ist ein Signal für tiefere Probleme in der Branche, die mit dem probabilistischen Verhalten von KI in der Produktion zusammenhängen.

Google integriert Gemini Nano in Chrome zur Bekämpfung von Online-Betrug
Google hat Gemini Nano in Chrome integriert, um Nutzer vor Online-Betrug zu schützen. Der Artikel beleuchtet die neuen Technologien und Maßnahmen, die Google ergreift, um Betrügereien zu bekämpfen.

Open Source Projekt cURL kämpft gegen Welle von KI-generierten falschen Sicherheitsmeldungen
Daniel Stenberg, der Gründer des cURL-Projekts, kämpft gegen die Flut von KI-generierten falschen Sicherheitsmeldungen, die die Wartenden über Plattformen wie HackerOne überfluten.

Die Trennung von Fakt und Fiktion: So transformiert KI Cyberkriminalität
In der sich schnell verändernden Landschaft der Cybersicherheit ist 'künstliche Intelligenz' das Schlagwort, das die Gespräche in der Branche dominiert. Dieser Artikel beleuchtet, wie KI Cyberkriminalität transformiert und welche Herausforderungen und Chancen sich daraus ergeben.
