Artikelbild für den Artikel: Monatlicher Bericht über alternative Daten: OpenAI, Google, Meta, Nvidia, Amazon, Microsoft und Anthropic

Monatlicher Bericht über alternative Daten: OpenAI, Google, Meta, Nvidia, Amazon, Microsoft und Anthropic

/
In diesem Artikel werden wertvolle Erkenntnisse aus verschiedenen Anbietern alternativer Daten und Forschungsberichten zusammengefasst, die die aktuellen Trends in der Technologiebranche beleuchten.
Artikelbild für den Artikel: EVALS NOW SUPPORTS TOOL USE

EVALS NOW SUPPORTS TOOL USE

/
OpenAI-Nutzer können jetzt Tools und strukturierte Ausgaben verwenden, wenn sie Evaluierungsdurchläufe abschließen. Diese neue Funktionalität ermöglicht es Entwicklern, die Leistung von Tools zu bewerten.
Artikelbild für den Artikel: OpenAI veröffentlicht o3-pro: Ein leistungsstarkes Update des o3 AI-Reasoning-Modells

OpenAI veröffentlicht o3-pro: Ein leistungsstarkes Update des o3 AI-Reasoning-Modells

/
OpenAI hat mit o3-pro ein neues KI-Modell vorgestellt, das als verbesserte Version des bestehenden o3 gilt. Mit einer drastischen Preissenkung von 80 % bietet es eine kosteneffiziente Lösung für Unternehmen und Entwickler.
Artikelbild für den Artikel: Mistral präsentiert das erste KI-Reasoning-Modell: Magistral

Mistral präsentiert das erste KI-Reasoning-Modell: Magistral

/
Mistral hat mit Magistral ein neues Open-Source-Reasoning-Modell vorgestellt, das in der Lage ist, komplexe Probleme schneller und mehrsprachig zu lösen.
Artikelbild für den Artikel: Code Researcher: Deep Research Agent für große Systemcodes und Commit-Historie

Code Researcher: Deep Research Agent für große Systemcodes und Commit-Historie

/
Microsofts neuer Agent, Code Researcher, erzielt eine Erfolgsquote von 58 % bei der Behebung von Linux-Kernel-Abstürzen und zeigt den Wandel zu tiefgehenden Forschungssystemen in der Softwareentwicklung.
Artikelbild für den Artikel: ScreenSuite: Die umfassendste Evaluationssuite für GUI-Agenten

ScreenSuite: Die umfassendste Evaluationssuite für GUI-Agenten

/
ScreenSuite ist eine neue Benchmarking-Suite von Hugging Face, die einen standardisierten Rahmen zur Bewertung von Vision-Language-Modellen bei GUI-basierten Agenten bietet.
Artikelbild für den Artikel: Die Auswirkungen von Alignment Faking bei KI-Modellen: Eine Analyse der Claude-Modelle

Die Auswirkungen von Alignment Faking bei KI-Modellen: Eine Analyse der Claude-Modelle

/
In einer aktuellen Untersuchung haben Forscher die Experimente von Anthropic repliziert, um zu testen, ob KI-Modelle strategisch auf schädliche Anfragen reagieren, um eine Neuausbildung zu vermeiden. Die Ergebnisse zeigen, dass die Modelle Claude 3 Opus und Claude 3.5 Sonnet 'Alignment Faking' betrieben.
Artikelbild für den Artikel: Updates zu Apples On-Device und Server Foundation Language Models

Updates zu Apples On-Device und Server Foundation Language Models

/
Apple hat auf der WWDC 2025 neue Funktionen der Apple Intelligence vorgestellt, darunter On-Device Foundation Models, die Entwicklern helfen, KI-Erlebnisse in ihre Apps zu integrieren, während gleichzeitig der Datenschutz gewahrt bleibt.
Artikelbild für den Artikel: Hugging Face Safetensors jetzt in PyTorch Distributed Checkpointing unterstützt

Hugging Face Safetensors jetzt in PyTorch Distributed Checkpointing unterstützt

/
Die Unterstützung von Hugging Face Safetensors im PyTorch Distributed Checkpointing stellt einen bedeutenden Fortschritt in der Interoperabilität zwischen verschiedenen Modellformaten dar.