PyTorch - Trend Forge

Beiträge

PINA: Eine neue Ära im Scientific Machine Learning mit PyTorch

20. November 2025

PINA ist eine neue Open-Source-Bibliothek für Scientific Machine Learning, die auf PyTorch basiert und eine einheitliche Plattform für die Modellierung komplexer Systeme bietet.

FlashPack: Blitzschnelles Laden von Modellen für PyTorch

27. Oktober 2025

0 Kommentare

FlashPack ist ein neues Dateiformat und Ladeverfahren für PyTorch, das die Ladezeiten von Modell-Checkpoints erheblich verkürzt. In diesem Artikel werden die Funktionsweise, Vorteile und Einschränkungen von FlashPack erläutert.

Helion: Eine hochgradige DSL für leistungsfähige und portable ML-Kerne

23. Oktober 2025

0 Kommentare

Helion ist eine hochgradige, Python-embedded DSL für maschinelles Lernen, die eine neue Abstraktionsebene bietet, um benutzerdefinierte Kerne zu erstellen, die in Triton kompiliert werden. Der Artikel beleuchtet die Vorteile, die Programmiermodelle und die Leistungsanalyse von Helion.

Disaggregierte Inferenz mit PyTorch und vLLM

16. September 2025

0 Kommentare

Die Integration von PyTorch und vLLM durch Meta verbessert die Effizienz generativer KI-Anwendungen durch die Disaggregation von Prefill und Decode, was zu optimierter Inferenzgeschwindigkeit und -effizienz führt.

Die Optimierung von PyTorch-Inferenz auf Apple-Geräten durch KI-generierte Metal-Kernels

4. September 2025

0 Kommentare

Eine neue Studie zeigt, dass KI-generierte Metal-Kernels die Inferenzgeschwindigkeit von PyTorch auf Apple-Geräten um 87% steigern können.

Produktionstaugliche CUDA-Kernels erstellen

25. August 2025

0 Kommentare

In diesem Artikel erfahren Sie, wie Sie produktionstaugliche CUDA-Kernels mit der Kernel-Builder-Bibliothek von Hugging Face erstellen und bereitstellen können.

Optimierung des Triton BF16 Grouped GEMM-Kernels für Mixture-of-Experts-Modelle

20. August 2025

0 Kommentare

Der Artikel behandelt die Optimierung des Triton BF16 Grouped GEMM-Kernels für Mixture-of-Experts-Modelle in PyTorch und beschreibt verschiedene Techniken zur Leistungssteigerung.

Optimierung des Checkpointings mit PyTorch DCP

3. Juli 2025

0 Kommentare

In diesem Artikel erfahren Sie, wie die Ingenieure von PyTorch die Größe von Checkpoints um 22 % reduzieren konnten, indem sie einen modularen Kompressionsansatz verwendet haben.

PyTorch und vLLM: Vertiefte Integration für effiziente LLM-Inferenz

30. Juni 2025

0 Kommentare

Die vertiefte Integration von PyTorch und vLLM bietet neue Möglichkeiten für die effiziente Inferenz von großen Sprachmodellen und optimiert generative KI-Anwendungen.

Beiträge

PINA: Eine neue Ära im Scientific Machine Learning mit PyTorch

FlashPack: Blitzschnelles Laden von Modellen für PyTorch

Helion: Eine hochgradige DSL für leistungsfähige und portable ML-Kerne

Disaggregierte Inferenz mit PyTorch und vLLM

Die Optimierung von PyTorch-Inferenz auf Apple-Geräten durch KI-generierte Metal-Kernels

Produktionstaugliche CUDA-Kernels erstellen

Optimierung des Triton BF16 Grouped GEMM-Kernels für Mixture-of-Experts-Modelle

Optimierung des Checkpointings mit PyTorch DCP

PyTorch und vLLM: Vertiefte Integration für effiziente LLM-Inferenz

Über uns

Archive

Kategorien

Beiträge

Über uns

Archive

Kategorien

Schlagwörter