PyTorch - Trend Forge

Beiträge

Optimierung des Triton BF16 Grouped GEMM-Kernels für Mixture-of-Experts-Modelle

20. August 2025

Der Artikel behandelt die Optimierung des Triton BF16 Grouped GEMM-Kernels für Mixture-of-Experts-Modelle in PyTorch und beschreibt verschiedene Techniken zur Leistungssteigerung.

Optimierung des Checkpointings mit PyTorch DCP

3. Juli 2025

0 Kommentare

In diesem Artikel erfahren Sie, wie die Ingenieure von PyTorch die Größe von Checkpoints um 22 % reduzieren konnten, indem sie einen modularen Kompressionsansatz verwendet haben.

PyTorch und vLLM: Vertiefte Integration für effiziente LLM-Inferenz

30. Juni 2025

0 Kommentare

Die vertiefte Integration von PyTorch und vLLM bietet neue Möglichkeiten für die effiziente Inferenz von großen Sprachmodellen und optimiert generative KI-Anwendungen.

DeepNVMe Upgrade: Effiziente I/O-Skalierung für Deep Learning Anwendungen

19. Juni 2025

0 Kommentare

In diesem Artikel erfahren Sie alles über die neuesten Verbesserungen von DeepNVMe, einer Technologie zur Optimierung von I/O-Prozessen in Deep Learning Anwendungen.

LOW-BIT QUANTIZATION WITH PARETOQ

16. Juni 2025

0 Kommentare

ParetoQ ist ein neuer Trainingsalgorithmus, der binäre, ternäre und 2- bis 4-Bit-Quantisierung vereint und dabei erstklassige Ergebnisse auf allen Ebenen erzielt.

Hugging Face Safetensors jetzt in PyTorch Distributed Checkpointing unterstützt

10. Juni 2025

0 Kommentare

Die Unterstützung von Hugging Face Safetensors im PyTorch Distributed Checkpointing stellt einen bedeutenden Fortschritt in der Interoperabilität zwischen verschiedenen Modellformaten dar.

Die Entwicklung moderner Techniken seit ‘Attention Is All You Need’

26. Mai 2025

0 Kommentare

In diesem Artikel werfen wir einen Blick auf einige der wichtigsten Innovationen, die seit der Veröffentlichung des Papiers 'Attention Is All You Need' entstanden sind.

Die Rolle von PyTorch im KI-Stack

8. Mai 2025

0 Kommentare

PyTorch hat sich von einem Forschungs-Framework zu einer grundlegenden Plattform entwickelt, die generative KI antreibt. Die PyTorch Foundation wurde erweitert, um komplementäre Projekte zu integrieren und die skalierbare Entwicklung von KI zu unterstützen.

2025 PyTorch Docathon: Gemeinsam die Dokumentation verbessern

6. Mai 2025

0 Kommentare

Der 2025 PyTorch Docathon ist ein Community-Event zur Verbesserung der Dokumentation von PyTorch, das allen Interessierten die Möglichkeit bietet, aktiv teilzunehmen und ihre Fähigkeiten zu entwickeln.

Beiträge

Optimierung des Triton BF16 Grouped GEMM-Kernels für Mixture-of-Experts-Modelle

Optimierung des Checkpointings mit PyTorch DCP

PyTorch und vLLM: Vertiefte Integration für effiziente LLM-Inferenz

DeepNVMe Upgrade: Effiziente I/O-Skalierung für Deep Learning Anwendungen

LOW-BIT QUANTIZATION WITH PARETOQ

Hugging Face Safetensors jetzt in PyTorch Distributed Checkpointing unterstützt

Die Entwicklung moderner Techniken seit ‘Attention Is All You Need’

Die Rolle von PyTorch im KI-Stack

2025 PyTorch Docathon: Gemeinsam die Dokumentation verbessern

Über uns

Archive

Kategorien

Beiträge

Über uns

Archive

Kategorien

Schlagwörter