Artikelbild für den Artikel: Code Researcher: Deep Research Agent für große Systemcodes und Commit-Historie

Code Researcher: Deep Research Agent für große Systemcodes und Commit-Historie

/
Microsofts neuer Agent, Code Researcher, erzielt eine Erfolgsquote von 58 % bei der Behebung von Linux-Kernel-Abstürzen und zeigt den Wandel zu tiefgehenden Forschungssystemen in der Softwareentwicklung.
Artikelbild für den Artikel: ScreenSuite: Die umfassendste Evaluationssuite für GUI-Agenten

ScreenSuite: Die umfassendste Evaluationssuite für GUI-Agenten

/
ScreenSuite ist eine neue Benchmarking-Suite von Hugging Face, die einen standardisierten Rahmen zur Bewertung von Vision-Language-Modellen bei GUI-basierten Agenten bietet.
Artikelbild für den Artikel: Die besten KI-Modelle im Wettkampf: Ein Spiel der Diplomatie

Die besten KI-Modelle im Wettkampf: Ein Spiel der Diplomatie

/
In einem faszinierenden Experiment wurden 18 KI-Modelle gegeneinander in einem Spiel der Diplomatie getestet. Das Ziel? Weltbeherrschung im klassischen Strategiespiel, das ursprünglich auf den großen Mächten Europas im Jahr 1901 basiert.
Artikelbild für den Artikel: Die Illusion des Denkens in Reasoning Models

Die Illusion des Denkens in Reasoning Models

/
Die Studie von Apple zu Large Reasoning Models zeigt, dass diese bei hoher Komplexität versagen und wirft wichtige Fragen zu ihren Denkfähigkeiten auf.
Artikelbild für den Artikel: Qwen3 Embedding: Fortschritte in der Text-Einbettung und Neurangierung durch Foundation-Modelle

Qwen3 Embedding: Fortschritte in der Text-Einbettung und Neurangierung durch Foundation-Modelle

/
Alibaba hat die Qwen3 Embedding-Serie als Open Source veröffentlicht, wobei das 8B-Modell den ersten Platz auf der MTEB multilingual leaderboard erreicht hat. Diese Modelle sind speziell für Aufgaben der Texteingabe, -abruf und -neurangierung konzipiert.
Artikelbild für den Artikel: Microsoft's GUI-Actor: KI-Agenten navigieren Bildschirme ohne Koordinaten

Microsoft’s GUI-Actor: KI-Agenten navigieren Bildschirme ohne Koordinaten

/
Microsoft hat mit dem GUI-Actor ein System entwickelt, das KI-Agenten ermöglicht, ohne präzise Pixelkoordinaten mit GUIs zu interagieren, indem es Aufmerksamkeitsmechanismen nutzt.
Artikelbild für den Artikel: Progressive Tempering Sampler mit Diffusion: Ein neuer Ansatz für effizientes Sampling

Progressive Tempering Sampler mit Diffusion: Ein neuer Ansatz für effizientes Sampling

/
Der Progressive Tempering Sampler mit Diffusion (PTSD) revolutioniert das Sampling aus unnormalisierten Dichten, indem er die Vorteile von Parallel Tempering und Diffusionsmodellen kombiniert.
Artikelbild für den Artikel: Common Pile v0.1: Ein Durchbruch für offene Datensätze in der KI-Forschung

Common Pile v0.1: Ein Durchbruch für offene Datensätze in der KI-Forschung

/
Hugging Face und seine Partner haben das Common Pile v0.1 veröffentlicht, ein 8 TB umfassendes, offen lizenziertes Datenset zur Schulung großer Sprachmodelle.
Artikelbild für den Artikel: Claude Gov Modelle für nationale Sicherheitskunden der USA

Claude Gov Modelle für nationale Sicherheitskunden der USA

/
Anthropic hat die Claude Gov Modelle für nationale Sicherheitskunden der USA eingeführt, die für strategische Planung, operative Unterstützung und Analyse von Geheimdienstinformationen konzipiert sind.