
EVALS NOW SUPPORTS TOOL USE
/
0 Kommentare
OpenAI-Nutzer können jetzt Tools und strukturierte Ausgaben verwenden, wenn sie Evaluierungsdurchläufe abschließen. Diese neue Funktionalität ermöglicht es Entwicklern, die Leistung von Tools zu bewerten.

Updates zu Apples On-Device und Server Foundation Language Models
Apple hat auf der WWDC 2025 neue Funktionen der Apple Intelligence vorgestellt, darunter On-Device Foundation Models, die Entwicklern helfen, KI-Erlebnisse in ihre Apps zu integrieren, während gleichzeitig der Datenschutz gewahrt bleibt.

OpenAI erreicht 10 Milliarden Dollar Jahresumsatz durch ChatGPT-Wachstum
OpenAI hat einen Jahresumsatz von 10 Milliarden Dollar erreicht, was eine Verdopplung im Vergleich zum Vorjahr darstellt. Dieser Artikel beleuchtet die Hintergründe und die Zukunftsvision des Unternehmens.

Wie man verbotene US-Modelle in China nutzt
In China sind US-basierte Sprachmodelle wie ChatGPT und Claude technisch verboten, doch ein florierender Graumarkt auf Taobao ermöglicht den Zugang zu diesen Modellen. Der Artikel beleuchtet die Preisgestaltung, Werbestrategien und die Dynamik zwischen Käufern und Verkäufern in diesem einzigartigen Markt.

Chonkie: Die ultimative Chunking-Bibliothek für schnelle Textverarbeitung
Chonkie ist eine ultraleichte und blitzschnelle Chunking-Bibliothek, die sich durch eine Vielzahl von Funktionen, Mehrsprachigkeit und Cloud-Bereitschaft auszeichnet.

Code Researcher: Deep Research Agent für große Systemcodes und Commit-Historie
Microsofts neuer Agent, Code Researcher, erzielt eine Erfolgsquote von 58 % bei der Behebung von Linux-Kernel-Abstürzen und zeigt den Wandel zu tiefgehenden Forschungssystemen in der Softwareentwicklung.

ScreenSuite: Die umfassendste Evaluationssuite für GUI-Agenten
ScreenSuite ist eine neue Benchmarking-Suite von Hugging Face, die einen standardisierten Rahmen zur Bewertung von Vision-Language-Modellen bei GUI-basierten Agenten bietet.

Claude Gov Modelle für nationale Sicherheitskunden der USA
Anthropic hat die Claude Gov Modelle für nationale Sicherheitskunden der USA eingeführt, die für strategische Planung, operative Unterstützung und Analyse von Geheimdienstinformationen konzipiert sind.

Google Gemini kann jetzt geplante Aufgaben wie ein Assistent erledigen
Die neue Funktion für geplante Aktionen von Google Gemini ermöglicht es Abonnenten, den Assistenten zu bestimmten Zeiten Aufgaben ausführen zu lassen, was die Produktivität steigern kann.
