Beiträge

Chain of Thought Monitorability: Eine neue und fragile Chance für die Sicherheit von KI
/
0 Kommentare
Die Chain of Thought Monitorability bietet eine neue Perspektive auf die Sicherheit von KI-Systemen, indem sie die Überwachung ihrer Entscheidungsprozesse ermöglicht.

OpenAI startet Safety Metrics Hub angesichts von Transparenzbedenken
OpenAI hat einen Safety Evaluations Hub vorgestellt, der die Leistung von Modellen in Bezug auf Halluzinationen, schädliche Inhalte, Jailbreak-Widerstand und Anweisungsbefolgung verfolgt.

SoundClouds neues Update der Nutzungsbedingungen: KI-Training auf Nutzerinhalten erlaubt
SoundCloud hat seine Nutzungsbedingungen geändert, um KI-Training auf Nutzerinhalten zu erlauben, was Bedenken hinsichtlich Transparenz und Einwilligung aufwirft.

Die Illusion der Bestenliste: Verzerrungen im Benchmarking von Chatbots
Die Bewertung des Fortschritts in der KI-Entwicklung ist entscheidend, doch die Chatbot Arena zeigt systematische Verzerrungen durch ungleiche Datenzugänge und selektive Offenlegung. Dieser Artikel beleuchtet die Probleme und bietet Reformvorschläge für eine gerechtere Bewertungslandschaft.
