Beiträge

Artikelbild für den Artikel: Tinker API von Thinking Machines: Flexibles Fine-Tuning für Sprachmodelle

Tinker API von Thinking Machines: Flexibles Fine-Tuning für Sprachmodelle

/
Thinking Machines hat Tinker ins Leben gerufen, eine flexible API für das Fine-Tuning von Sprachmodellen mit offenen Gewichten. Diese Lösung abstrahiert die Komplexität der Infrastruktur und unterstützt große Modelle wie Qwen-235B.
Artikelbild für den Artikel: Die SANS Secure AI Blueprint für sichere KI-Nutzung

Die SANS Secure AI Blueprint für sichere KI-Nutzung

/
Die SANS Secure AI Blueprint bietet ein bewährtes Modell zur Risikominderung und sicheren Nutzung von Künstlicher Intelligenz (KI). In einer Zeit, in der die Einführung von KI schneller voranschreitet als die Sicherheitsvorkehrungen in Unternehmen, ist es entscheidend, dass Organisationen über die notwendigen Kontrollen und Governance-Modelle verfügen.
Artikelbild für den Artikel: Werdegang als Research Engineer bei einem großen LLM-Labor: 18 Monate strategische Jobsuche

Werdegang als Research Engineer bei einem großen LLM-Labor: 18 Monate strategische Jobsuche

/
Max Mynter beschreibt seinen 18-monatigen Weg zur Position als Research Engineer bei Mistral und teilt wertvolle Einblicke in den Bewerbungsprozess sowie Strategien zur Karriereentwicklung.
Artikelbild für den Artikel: Project Go-Big: Das größte humanoide Pretraining-Dataset der Welt

Project Go-Big: Das größte humanoide Pretraining-Dataset der Welt

/
Project Go-Big zielt darauf ab, das weltweit größte humanoide Pretraining-Dataset zu erstellen. Dieses ehrgeizige Vorhaben wird durch eine Partnerschaft mit Brookfield unterstützt und nutzt das KI-System Helix, um humanoide Roboter zu trainieren.
Artikelbild für den Artikel: Semantische IDs für Empfehlungs-LLMs

Semantische IDs für Empfehlungs-LLMs

/
Die Integration von semantischen IDs in Empfehlungs-LLMs verbessert die Nutzerinteraktion durch natürliche Sprache und ermöglicht präzisere Empfehlungen.
Artikelbild für den Artikel: RustGPT: Ein Sprachmodell vollständig in Rust implementiert

RustGPT: Ein Sprachmodell vollständig in Rust implementiert

/
RustGPT ist ein umfassendes großes Sprachmodell, das vollständig in der Programmiersprache Rust implementiert wurde. In diesem Artikel werden wir die Architektur, die Trainingsmethoden und die Implementierungsdetails von RustGPT näher beleuchten.
Artikelbild für den Artikel: Das vertikale KI-Playbook: Strategien für erfolgreiche AI-Integration in Unternehmen

Das vertikale KI-Playbook: Strategien für erfolgreiche AI-Integration in Unternehmen

/
In diesem Artikel wird das vertikale KI-Playbook vorgestellt, das Strategien zur erfolgreichen Integration von KI in Unternehmensstrukturen beleuchtet und Fallstudien erfolgreicher Unternehmen präsentiert.
Artikelbild für den Artikel: Set Block Decoding: Ein neuer Ansatz zur Beschleunigung der Sprachmodell-Inferenz

Set Block Decoding: Ein neuer Ansatz zur Beschleunigung der Sprachmodell-Inferenz

/
Set Block Decoding ist ein neuer Ansatz zur Beschleunigung der Inferenz von Sprachmodellen, der paralleles Sampling mehrerer zukünftiger Token ermöglicht und die Effizienz erheblich steigert.
Artikelbild für den Artikel: Google veröffentlicht EmbeddingGemma: Ein kompakter, mehrsprachiger Embedding-Modell

Google veröffentlicht EmbeddingGemma: Ein kompakter, mehrsprachiger Embedding-Modell

/
Google hat mit EmbeddingGemma ein neues, kompaktes und mehrsprachiges Embedding-Modell veröffentlicht, das sich durch seine Effizienz und Vielseitigkeit auszeichnet. Dieses Modell ist für Aufgaben wie semantische Ähnlichkeit, Klassifizierung und Clustering optimiert.