Beiträge

BERT ist nur ein einzelner Text-Diffusionsschritt
/
0 Kommentare
In diesem Artikel untersuchen wir die Beziehung zwischen BERT-Modellen und Text-Diffusionsmodellen und zeigen, wie BERT-ähnliche Modelle in generative Modelle umgewandelt werden können.

Die Illusion abnehmender Erträge: Messung der Langzeit-Ausführung in LLMs
In diesem Artikel untersuchen wir die Effizienz von großen Sprachmodellen (LLMs) bei der Ausführung längerer Aufgaben und die Herausforderungen, die mit der Skalierung dieser Modelle verbunden sind.
