Beiträge

Änderungen am Model Context Protocol: Ein Überblick über die neuesten Entwicklungen
/
0 Kommentare
In diesem Artikel werden die wesentlichen Änderungen des Model Context Protocol (MCP) in der Revision vom 18. Juni 2025 vorgestellt, einschließlich der Entfernung von JSON-RPC-Batching und der Verbesserung der Sicherheitsüberlegungen.

Tracing and Fixing Emergent Misalignment in Sprachmodellen
In diesem Artikel wird die Forschung von OpenAI zu emergenter Fehlanpassung in Sprachmodellen zusammengefasst und die Bedeutung für die KI-Sicherheit diskutiert.

OpenAI’s Plan zur Sicherung biologischer KI-Fähigkeiten
OpenAI hat einen Plan zur Sicherung biologischer KI-Fähigkeiten vorgestellt, der präventive Maßnahmen und Zusammenarbeit mit Experten umfasst, um potenziellen Missbrauch zu verhindern.

Eine Einführung in Googles Ansatz zur Sicherheit von KI-Agenten
In einem kürzlich veröffentlichten Papier beschreibt Google die wesentlichen Risiken, die mit dem Einsatz von KI-Agenten verbunden sind, sowie den Rahmen des Unternehmens zur Sicherung dieser Systeme.

Die Darwin Gödel Maschine: KI, die sich selbst durch Neuschreibung ihres Codes verbessert
Die Darwin Gödel Maschine von Sakana AI ist ein innovativer Coding-Agent, der sich selbst durch Neuschreibung seines Codes verbessert und somit das Potenzial hat, die KI-Forschung revolutionär voranzutreiben.

Die Auswirkungen von Alignment Faking bei KI-Modellen: Eine Analyse der Claude-Modelle
In einer aktuellen Untersuchung haben Forscher die Experimente von Anthropic repliziert, um zu testen, ob KI-Modelle strategisch auf schädliche Anfragen reagieren, um eine Neuausbildung zu vermeiden. Die Ergebnisse zeigen, dass die Modelle Claude 3 Opus und Claude 3.5 Sonnet 'Alignment Faking' betrieben.

Claude Gov Modelle für nationale Sicherheitskunden der USA
Anthropic hat die Claude Gov Modelle für nationale Sicherheitskunden der USA eingeführt, die für strategische Planung, operative Unterstützung und Analyse von Geheimdienstinformationen konzipiert sind.

Yoshua Bengios AI Safety Lab: LawZero
Yoshua Bengio hat ein gemeinnütziges AI-Sicherheitslabor namens LawZero gegründet, das mit 30 Millionen US-Dollar finanziert wird, um sicherere KI-Systeme zu entwickeln.

OAUTH für agentische KI: Die Zukunft der KI-Agenten und die Notwendigkeit einer Weiterentwicklung
Microsoft hat dargelegt, wie die nächsten Generationen von KI-Agenten weiterentwickelte Identitäts- und Zugangsstandards erfordern werden, während sich die Technologie von reaktiven Assistenten zu proaktiven Kollaborateuren wandelt.