Beiträge

Die Illusion abnehmender Erträge: Messung der Langzeit-Ausführung in LLMs
/
0 Kommentare
In diesem Artikel untersuchen wir die Effizienz von großen Sprachmodellen (LLMs) bei der Ausführung längerer Aufgaben und die Herausforderungen, die mit der Skalierung dieser Modelle verbunden sind.

Scaling Laws für Mixture-of-Experts Modelle
In diesem Artikel untersuchen wir die Effizienz von Mixture-of-Experts Modellen und das Konzept der Efficiency Leverage, basierend auf einer aktuellen empirischen Studie.