Beiträge

Artikelbild für den Artikel: DeepSeek veröffentlicht kleines Update für das R1-Reasoning-Modell

DeepSeek veröffentlicht kleines Update für das R1-Reasoning-Modell

/
DeepSeek hat ein aktualisiertes R1-Reasoning-Modell auf Hugging Face veröffentlicht, das als kleines Upgrade beschrieben wird. Die Details sind spärlich, doch die Veröffentlichung könnte für Entwickler von Bedeutung sein.
Artikelbild für den Artikel: DeepSeek-V3: Einblicke in Hardware-Modell-Co-Design

DeepSeek-V3: Einblicke in Hardware-Modell-Co-Design

/
Die Forscher von DeepSeek haben Einblicke aus DeepSeek-V3 als Fallstudie im Bereich Hardware-Modell-Co-Design geteilt. Diese Studie beleuchtet die Herausforderungen, die beim Skalieren großer Sprachmodelle (LLMs) auftreten, und bietet Lösungen, die durch eine enge Zusammenarbeit zwischen Hardware und Software erreicht werden können.
Artikelbild für den Artikel: Fine-Tuning Qwen2.5B für Reasoning: Ein kosteneffizienter Ansatz

Fine-Tuning Qwen2.5B für Reasoning: Ein kosteneffizienter Ansatz

/
In diesem Artikel wird das Fine-Tuning des Qwen2.5B-Modells für Reasoning-Aufgaben mithilfe einer kosteneffizienten SFT + GRPO-Pipeline erläutert.