Beiträge

BERT ist nur ein einzelner Text-Diffusionsschritt
/
0 Kommentare
In diesem Artikel untersuchen wir die Beziehung zwischen BERT-Modellen und Text-Diffusionsmodellen und zeigen, wie BERT-ähnliche Modelle in generative Modelle umgewandelt werden können.

Sampling und strukturierte Ausgaben in LLMs
Sampling ist ein entscheidender Prozess in der Textgenerierung von großen Sprachmodellen (LLMs). Dieser Artikel beleuchtet die verschiedenen Sampling-Techniken und deren Bedeutung für kreative und strukturierte Ausgaben.

Die Wahrscheinlichkeit kürzerer Tokens in großen Sprachmodellen
Der Artikel untersucht die Wahrscheinlichkeit, mit der kürzere Tokens in großen Sprachmodellen ausgewählt werden, und die Auswirkungen der Tokenisierung auf die Textgenerierung.
