Artikelbild für den Artikel: NOUS RESEARCH'S PSYCHE NETWORK TAPS IDLE GPUS FOR AI TRAINING

NOUS RESEARCH’S PSYCHE NETWORK TAPS IDLE GPUS FOR AI TRAINING

/
Psyche ist ein auf Solana basierendes verteiltes Trainingssystem, das es jedem mit kompatibler Hardware ermöglicht, seine GPUs für das Training von KI-Modellen zur Verfügung zu stellen. Die erste Initiative des Projekts, 'Consilience', wird ein Modell mit 40 Milliarden Parametern unter Verwendung von 20 Billionen Tokens erstellen.
Artikelbild für den Artikel: BLIP3-O: Eine neue Ära der multimodalen Modelle

BLIP3-O: Eine neue Ära der multimodalen Modelle

/
BLIP3-o ist eine neue Diffusions-Transformer-Architektur, die herausragende Ergebnisse in multimodalen Benchmarks erzielt und die Integration von Bildverständnis und -generierung revolutioniert.
Artikelbild für den Artikel: OpenThinkIMG: Ein visuelles Werkzeug für KI-Agenten

OpenThinkIMG: Ein visuelles Werkzeug für KI-Agenten

/
OpenThinkIMG ist ein Open-Source-Framework, das es vision-language Modellen ermöglicht, aktiv mit visuellen Werkzeugen zu interagieren und komplexe visuelle Probleme zu lösen.
Artikelbild für den Artikel: ALPHAEVOLVE: DEEPMIND'S GEMINI-POWERED CODING AGENT FÜR ALGORITHMUSDESIGN

ALPHAEVOLVE: DEEPMIND’S GEMINI-POWERED CODING AGENT FÜR ALGORITHMUSDESIGN

/
Google DeepMind hat mit AlphaEvolve einen neuen evolutionären Coding-Agenten vorgestellt, der auf den Gemini-Modellen basiert und vollständige Algorithmuslösungen generiert und verbessert.
Artikelbild für den Artikel: Meta-Analyse zeigt: ChatGPT steigert signifikant das Lernen, besonders in problemorientierten Szenarien

Meta-Analyse zeigt: ChatGPT steigert signifikant das Lernen, besonders in problemorientierten Szenarien

/
Eine umfassende Meta-Analyse zeigt, dass ChatGPT die Lernleistung von Studierenden erheblich verbessert, insbesondere in problemorientierten Szenarien.
Artikelbild für den Artikel: Tencent stellt WizardLM-Team ein, eine Microsoft AI-Gruppe mit einer ungewöhnlichen Geschichte

Tencent stellt WizardLM-Team ein, eine Microsoft AI-Gruppe mit einer ungewöhnlichen Geschichte

/
WizardLM, eine ehemalige Microsoft AI-Gruppe, hat sich Tencent angeschlossen und ein neues AI-Modell veröffentlicht, das die Angebote von Google übertreffen soll.
Artikelbild für den Artikel: VISUAL AUTOREGRESSION WITHOUT QUANTIZATION (GITHUB REPO)

VISUAL AUTOREGRESSION WITHOUT QUANTIZATION (GITHUB REPO)

/
Die kontinuierliche visuelle autoregressive Generierung ist ein spannendes Forschungsfeld, das in den letzten Jahren an Bedeutung gewonnen hat. Mit der Einführung von EAR wird ein neuer Ansatz vorgestellt, der die Quantisierung vermeidet und stattdessen auf streng korrekte Bewertungsregeln setzt.
Artikelbild für den Artikel: Unified Training and Sampling für Generative Modelle: Ein Überblick über UCGM

Unified Training and Sampling für Generative Modelle: Ein Überblick über UCGM

/
UCGM bietet ein einheitliches Framework für das Training und Sampling von kontinuierlichen generativen Modellen, das sowohl multi-step als auch few-step Ansätze unterstützt.
Artikelbild für den Artikel: AI2s neues kleines KI-Modell übertrifft vergleichbare Modelle von Google und Meta

AI2s neues kleines KI-Modell übertrifft vergleichbare Modelle von Google und Meta

/
AI2 hat mit Olmo 2 1B ein neues KI-Modell vorgestellt, das in wichtigen Benchmarks besser abschneidet als vergleichbare Modelle von Google, Meta und Alibaba. Das Modell ist unter einer permissiven Lizenz verfügbar und kann auf weniger leistungsfähiger Hardware betrieben werden.