News zu KI & Grundlagen

Artikelbild für den Artikel: Anthropic Open-Sources Circuit Tracing Tools für AI Interpretability

Anthropic Open-Sources Circuit Tracing Tools für AI Interpretability

/
Anthropic hat neue Tools zur Nachverfolgung von Entscheidungsprozessen in großen Sprachmodellen open-sourcet, um die Interpretierbarkeit von KI zu verbessern.
Artikelbild für den Artikel: DeepSeek's R1 überholt xAI, Meta und Anthropic

DeepSeek’s R1 überholt xAI, Meta und Anthropic

/
DeepSeek R1 0528 hat einen bemerkenswerten Sprung im Artificial Analysis Intelligence Index gemacht, von 60 auf 68. Damit positioniert sich das Modell als intelligenter als xAI’s Grok 3 mini, NVIDIA’s Llama Nemotron Ultra und andere.
Artikelbild für den Artikel: Die Revolution des AI-Denkens: Einblicke von Lilian Weng

Die Revolution des AI-Denkens: Einblicke von Lilian Weng

/
Lilian Weng beleuchtet die Verbindung zwischen Rechenleistung zur Testzeit und menschlicher Psychologie und erklärt, warum Modelle durch zusätzliche Rechenschritte besser abschneiden.
Artikelbild für den Artikel: DeepSeek veröffentlicht kleines Update für das R1-Reasoning-Modell

DeepSeek veröffentlicht kleines Update für das R1-Reasoning-Modell

/
DeepSeek hat ein aktualisiertes R1-Reasoning-Modell auf Hugging Face veröffentlicht, das als kleines Upgrade beschrieben wird. Die Details sind spärlich, doch die Veröffentlichung könnte für Entwickler von Bedeutung sein.
Artikelbild für den Artikel: Mistral's Codestral Embed: Ein neuer Maßstab für Code-Embeddings

Mistral’s Codestral Embed: Ein neuer Maßstab für Code-Embeddings

/
Mistral hat mit Codestral Embed ein neues, spezialisiertes Embedding-Modell für Code vorgestellt, das in den Retrieval-Benchmarks führender Alternativen überlegen ist.
Artikelbild für den Artikel: STRUCTURED CODEAGENTS FÜR INTELLIGENTERE AUSFÜHRUNGEN

STRUCTURED CODEAGENTS FÜR INTELLIGENTERE AUSFÜHRUNGEN

/
In diesem Artikel wird die innovative Kombination von strukturierter Generierung und codebasierten Aktionen durch Hugging Face vorgestellt, die die Leistung von CodeAgents verbessert.
Artikelbild für den Artikel: Mit Konzepten malen: Die Nutzung von Diffusionsmodell-Latenten

Mit Konzepten malen: Die Nutzung von Diffusionsmodell-Latenten

/
Goodfire hat Paint With Ember eingeführt – ein innovatives Tool, das es Nutzern ermöglicht, die neuronalen Aktivierungen von Bildmodellen direkt zu manipulieren, indem sie einfache Pixelbilder malen, anstatt Textaufforderungen zu verwenden.
Artikelbild für den Artikel: RANDOM REWARDS DURING RL BOOST MATH REASONING IN SOME LLMS

RANDOM REWARDS DURING RL BOOST MATH REASONING IN SOME LLMS

/
Die Qwen2.5-Math Modelle zeigen, dass zufällige Belohnungen wie falsches Feedback zu signifikanten Leistungssteigerungen im maschinellen Lernen führen können.
Artikelbild für den Artikel: EFFICIENT GRPO AT SCALE

EFFICIENT GRPO AT SCALE

/
Liger optimiert die Group Relative Policy Optimization (GRPO) und reduziert den Speicherbedarf um 40 %. Der Artikel behandelt die Integration in TRL und die Vorteile der neuen Funktionen.