Blog - News - Trend Forge

Code Researcher: Deep Research Agent für große Systemcodes und Commit-Historie

10. Juni 2025

Microsofts neuer Agent, Code Researcher, erzielt eine Erfolgsquote von 58 % bei der Behebung von Linux-Kernel-Abstürzen und zeigt den Wandel zu tiefgehenden Forschungssystemen in der Softwareentwicklung.

ScreenSuite: Die umfassendste Evaluationssuite für GUI-Agenten

10. Juni 2025

0 Kommentare

ScreenSuite ist eine neue Benchmarking-Suite von Hugging Face, die einen standardisierten Rahmen zur Bewertung von Vision-Language-Modellen bei GUI-basierten Agenten bietet.

Die besten KI-Modelle im Wettkampf: Ein Spiel der Diplomatie

9. Juni 2025

0 Kommentare

In einem faszinierenden Experiment wurden 18 KI-Modelle gegeneinander in einem Spiel der Diplomatie getestet. Das Ziel? Weltbeherrschung im klassischen Strategiespiel, das ursprünglich auf den großen Mächten Europas im Jahr 1901 basiert.

Die Illusion des Denkens in Reasoning Models

9. Juni 2025

0 Kommentare

Die Studie von Apple zu Large Reasoning Models zeigt, dass diese bei hoher Komplexität versagen und wirft wichtige Fragen zu ihren Denkfähigkeiten auf.

Qwen3 Embedding: Fortschritte in der Text-Einbettung und Neurangierung durch Foundation-Modelle

9. Juni 2025

0 Kommentare

Alibaba hat die Qwen3 Embedding-Serie als Open Source veröffentlicht, wobei das 8B-Modell den ersten Platz auf der MTEB multilingual leaderboard erreicht hat. Diese Modelle sind speziell für Aufgaben der Texteingabe, -abruf und -neurangierung konzipiert.

Microsoft’s GUI-Actor: KI-Agenten navigieren Bildschirme ohne Koordinaten

9. Juni 2025

0 Kommentare

Microsoft hat mit dem GUI-Actor ein System entwickelt, das KI-Agenten ermöglicht, ohne präzise Pixelkoordinaten mit GUIs zu interagieren, indem es Aufmerksamkeitsmechanismen nutzt.

Progressive Tempering Sampler mit Diffusion: Ein neuer Ansatz für effizientes Sampling

9. Juni 2025

0 Kommentare

Der Progressive Tempering Sampler mit Diffusion (PTSD) revolutioniert das Sampling aus unnormalisierten Dichten, indem er die Vorteile von Parallel Tempering und Diffusionsmodellen kombiniert.

Common Pile v0.1: Ein Durchbruch für offene Datensätze in der KI-Forschung

9. Juni 2025

0 Kommentare

Hugging Face und seine Partner haben das Common Pile v0.1 veröffentlicht, ein 8 TB umfassendes, offen lizenziertes Datenset zur Schulung großer Sprachmodelle.

Claude Gov Modelle für nationale Sicherheitskunden der USA

9. Juni 2025

0 Kommentare

Anthropic hat die Claude Gov Modelle für nationale Sicherheitskunden der USA eingeführt, die für strategische Planung, operative Unterstützung und Analyse von Geheimdienstinformationen konzipiert sind.

Code Researcher: Deep Research Agent für große Systemcodes und Commit-Historie

ScreenSuite: Die umfassendste Evaluationssuite für GUI-Agenten

Die besten KI-Modelle im Wettkampf: Ein Spiel der Diplomatie

Die Illusion des Denkens in Reasoning Models

Qwen3 Embedding: Fortschritte in der Text-Einbettung und Neurangierung durch Foundation-Modelle

Microsoft’s GUI-Actor: KI-Agenten navigieren Bildschirme ohne Koordinaten

Progressive Tempering Sampler mit Diffusion: Ein neuer Ansatz für effizientes Sampling

Common Pile v0.1: Ein Durchbruch für offene Datensätze in der KI-Forschung

Claude Gov Modelle für nationale Sicherheitskunden der USA

Über uns

Archive

Kategorien

Über uns

Archive

Kategorien

Schlagwörter