Beiträge

Artikelbild für den Artikel: Die OLMO 2 Modellfamilie: Ein Durchbruch in der offenen KI-Forschung

Die OLMO 2 Modellfamilie: Ein Durchbruch in der offenen KI-Forschung

/
Die OLMO 2 Modellfamilie von Ai2 stellt einen bedeutenden Fortschritt in der Entwicklung offener Sprachmodelle dar und bietet eine Vielzahl von Modellen, die auf unterschiedliche Forschungsbedürfnisse zugeschnitten sind.
Artikelbild für den Artikel: SmolLM3 Released by Hugging Face

SmolLM3 Released by Hugging Face

/
Hugging Face hat mit SmolLM3 ein neues, vollständig offenes Sprachmodell mit 3 Milliarden Parametern veröffentlicht, das in sechs Sprachen funktioniert und über starke Fähigkeiten im Bereich des logischen Denkens verfügt.
Artikelbild für den Artikel: Die bittere Lektion für die Tokenisierung steht bevor

Die bittere Lektion für die Tokenisierung steht bevor

/
Tokenisierung sollte durch eine allgemeine Methode ersetzt werden, die besser mit Rechenleistung und Daten umgeht. In diesem Artikel betrachten wir die Rolle der Tokenisierung und ihre Fragilität.
Artikelbild für den Artikel: Reinforcement Learning Teachers of Test Time Scaling

Reinforcement Learning Teachers of Test Time Scaling

/
Die Einführung von Reinforcement Learned Teachers revolutioniert die Ausbildung von KI-Modellen, indem sie sich auf das Lehren und die Bereitstellung klarer Erklärungen konzentrieren.
Artikelbild für den Artikel: Verbesserung der Natürlichkeit in generativen Sprachmodellen

Verbesserung der Natürlichkeit in generativen Sprachmodellen

/
In diesem Artikel wird ein neuartiges variationales Framework vorgestellt, das die Natürlichkeit in generativen Sprachmodellen verbessert, indem es automatisch prosodische Merkmale lernt.
Artikelbild für den Artikel: Tracing and Fixing Emergent Misalignment in Sprachmodellen

Tracing and Fixing Emergent Misalignment in Sprachmodellen

/
In diesem Artikel wird die Forschung von OpenAI zu emergenter Fehlanpassung in Sprachmodellen zusammengefasst und die Bedeutung für die KI-Sicherheit diskutiert.
Artikelbild für den Artikel: SELF-ADAPTING LANGUAGE MODELS: Ein neuer Ansatz für personalisierte KI

SELF-ADAPTING LANGUAGE MODELS: Ein neuer Ansatz für personalisierte KI

/
Self-Adapting Language Models (SEAL) revolutionieren die Anpassungsfähigkeit von KI durch die Möglichkeit, eigene Feinabstimmungsdaten zu generieren und sich selbst zu bearbeiten.
Artikelbild für den Artikel: ALPHAWRITE: Inferenzzeit-Compute-Skalierung für kreatives Schreiben

ALPHAWRITE: Inferenzzeit-Compute-Skalierung für kreatives Schreiben

/
AlphaWrite demonstriert, dass kreative Aufgaben von systematischer Inferenzzeit-Compute-Skalierung profitieren können, indem es Geschichten generiert, bewertet und über mehrere Generationen verbessert.
Artikelbild für den Artikel: Reinforcement Pre-Training: Ein neuer Ansatz für große Sprachmodelle

Reinforcement Pre-Training: Ein neuer Ansatz für große Sprachmodelle

/
Reinforcement Pre-Training (RPT) ist ein neues Skalierungsparadigma für große Sprachmodelle und Reinforcement Learning, das die Genauigkeit der Sprachmodellierung erheblich verbessert.