Beiträge

Artikelbild für den Artikel: Cloud Run GPUs: Jetzt allgemein verfügbar und erleichtern das Ausführen von KI-Workloads für alle

Cloud Run GPUs: Jetzt allgemein verfügbar und erleichtern das Ausführen von KI-Workloads für alle

/
NVIDIA GPU-Support für Cloud Run ist jetzt allgemein verfügbar und erleichtert Entwicklern das Ausführen von KI-Workloads. Erfahren Sie mehr über die Vorteile und neuen Anwendungsfälle.
Artikelbild für den Artikel: Cerebras übertrifft NVIDIA: Ein neuer Rekord in der KI-Inferenzgeschwindigkeit

Cerebras übertrifft NVIDIA: Ein neuer Rekord in der KI-Inferenzgeschwindigkeit

/
Cerebras hat einen neuen Rekord in der KI-Inferenzgeschwindigkeit aufgestellt und übertrifft damit NVIDIA's DGX B200 mit einer Geschwindigkeit von über 2.500 Tokens pro Sekunde.
Artikelbild für den Artikel: 1000-fache Steigerung der Nachfrage nach KI-Ressourcen

1000-fache Steigerung der Nachfrage nach KI-Ressourcen

/
NVIDIA berichtet von einem signifikanten Anstieg der Nachfrage nach KI-Ressourcen, da der Fokus von einfachen Anwendungen auf komplexere Denkprozesse wechselt.
Artikelbild für den Artikel: DeepSeek-V3: Einblicke in Hardware-Modell-Co-Design

DeepSeek-V3: Einblicke in Hardware-Modell-Co-Design

/
Die Forscher von DeepSeek haben Einblicke aus DeepSeek-V3 als Fallstudie im Bereich Hardware-Modell-Co-Design geteilt. Diese Studie beleuchtet die Herausforderungen, die beim Skalieren großer Sprachmodelle (LLMs) auftreten, und bietet Lösungen, die durch eine enge Zusammenarbeit zwischen Hardware und Software erreicht werden können.
Artikelbild für den Artikel: Jensen Huang über globale KI-Strategien und Chipkontrollen

Jensen Huang über globale KI-Strategien und Chipkontrollen

/
Jensen Huang, CEO von Nvidia, argumentiert, dass die Exportbeschränkungen für Chips in den USA die Wettbewerbsfähigkeit gefährden und die Innovationskraft der Branche beeinträchtigen könnten. Er betont die Notwendigkeit, die KI-Industrie proaktiv zu fördern.
Artikelbild für den Artikel: NVIDIA LAUNCHED NVLINK FUSION

NVIDIA LAUNCHED NVLINK FUSION

/
NVIDIA hat mit NVLink Fusion eine innovative Lösung zur Unterstützung hybrider KI-Infrastrukturen vorgestellt, die NVIDIA GPUs oder Grace CPUs mit Chips von Drittanbietern kombiniert.
Artikelbild für den Artikel: Optimierung von GEMM mit Thread Block Clustern auf NVIDIA Blackwell GPUs

Optimierung von GEMM mit Thread Block Clustern auf NVIDIA Blackwell GPUs

/
In diesem Artikel wird die Optimierung von GEMM mit Thread Block Clustern und 2-SM UMMA-Anweisungen auf NVIDIA Blackwell GPUs untersucht.
Artikelbild für den Artikel: COGNITION KEVIN-32B: Multi-Turn RL für die Erstellung von CUDA-Kernels

COGNITION KEVIN-32B: Multi-Turn RL für die Erstellung von CUDA-Kernels

/
In diesem Artikel wird das Modell KEVIN-32B vorgestellt, das Reinforcement Learning für die mehrstufige Codegenerierung nutzt und bestehende Modelle bei der Entwicklung von CUDA-Kernels übertrifft.
Artikelbild für den Artikel: NVIDIA RADIO EMBEDDING MODELS (HUGGING FACE HUB)

NVIDIA RADIO EMBEDDING MODELS (HUGGING FACE HUB)

/
NVIDIA hat eine Reihe von Text- und Bild-Embedding-Modellen entwickelt, die in vielen Fällen mit SigLIP konkurrieren können. Diese Modelle sind Teil der umfangreichen Sammlung von Hugging Face, die darauf abzielt, die Möglichkeiten der KI-gestützten Bild- und Textverarbeitung zu erweitern.