Beiträge

Artikelbild für den Artikel: BERT ist nur ein einzelner Text-Diffusionsschritt

BERT ist nur ein einzelner Text-Diffusionsschritt

/
In diesem Artikel untersuchen wir die Beziehung zwischen BERT-Modellen und Text-Diffusionsmodellen und zeigen, wie BERT-ähnliche Modelle in generative Modelle umgewandelt werden können.
Artikelbild für den Artikel: Die Illusion abnehmender Erträge: Messung der Langzeit-Ausführung in LLMs

Die Illusion abnehmender Erträge: Messung der Langzeit-Ausführung in LLMs

/
In diesem Artikel untersuchen wir die Effizienz von großen Sprachmodellen (LLMs) bei der Ausführung längerer Aufgaben und die Herausforderungen, die mit der Skalierung dieser Modelle verbunden sind.