Artikelbild für den Artikel: GPT-Image-1.5: Das neue Bildgenerierungsmodell von OpenAI

GPT-Image-1.5: Das neue Bildgenerierungsmodell von OpenAI

/
OpenAI hat mit GPT-Image-1.5 ein neues, schnelleres und präziseres Bildgenerierungsmodell vorgestellt, das die Geschwindigkeit und Genauigkeit der Bildproduktion verbessert.
Artikelbild für den Artikel: OpenAI stellt den Modell-Router für ChatGPT-Nutzer ein

OpenAI stellt den Modell-Router für ChatGPT-Nutzer ein

/
OpenAI hat den automatischen Modell-Router für ChatGPT-Nutzer zurückgenommen, was Auswirkungen auf die Nutzererfahrung und die Konkurrenzsituation hat.
Artikelbild für den Artikel: Inference Economics 101: Reserved Compute versus Inference APIs

Inference Economics 101: Reserved Compute versus Inference APIs

/
In diesem Artikel beleuchten wir die Unterschiede zwischen Reserved Compute und Inference APIs, zwei wirtschaftlich attraktiven Ansätzen in der KI-Infrastruktur, die jeweils unterschiedliche Stärken bieten.
Artikelbild für den Artikel: Prompt Caching: 10x günstigere LLM-Token, aber wie?

Prompt Caching: 10x günstigere LLM-Token, aber wie?

/
Prompt Caching senkt die Kosten für LLM-Token erheblich und reduziert die Latenzzeiten. In diesem Artikel erfahren Sie, wie es funktioniert und welche Vorteile es bietet.
Artikelbild für den Artikel: Die Herausforderungen und Lösungen bei resumierbarem LLM-Streaming

Die Herausforderungen und Lösungen bei resumierbarem LLM-Streaming

/
In diesem Artikel werden die Herausforderungen und Lösungen bei der Implementierung von resumierbaren Streaming-Funktionen in großen Sprachmodellen (LLMs) behandelt.
Artikelbild für den Artikel: Google erweitert Gemini mit NotebookLM-Integration

Google erweitert Gemini mit NotebookLM-Integration

/
Die Integration von NotebookLM in Google Gemini ermöglicht es Nutzern, ihre Notizbücher als Live-Datenquellen zu verwenden und verbessert die Interaktion mit persönlichen Daten.
Artikelbild für den Artikel: Googles KI-Toolkit für Nachhaltigkeitsberichterstattung

Googles KI-Toolkit für Nachhaltigkeitsberichterstattung

/
Google hat ein KI-Playbook veröffentlicht, das Unternehmen bei der Verbesserung ihrer Nachhaltigkeitsberichterstattung unterstützt. Es bietet praktische Werkzeuge und Strategien zur Optimierung von Prozessen und zur Erhöhung der Transparenz.
Artikelbild für den Artikel: Cutlass in CUDA und Triton: Optimierung für maximale Leistung

Cutlass in CUDA und Triton: Optimierung für maximale Leistung

/
In diesem Artikel erfahren Sie, wie das Hinzufügen von 'cutlass' zu Ihrem CUDA- oder Triton-Kernelname die Leistung erheblich steigern kann. Wir untersuchen technische Details, Benchmarks und praktische Anwendungshinweise.
Artikelbild für den Artikel: NVIDIA und die Zukunft der KI-Modelle: Ein Blick auf GPT-5.2

NVIDIA und die Zukunft der KI-Modelle: Ein Blick auf GPT-5.2

/
OpenAI hat GPT-5.2 vorgestellt, das auf der NVIDIA Hopper- und GB200 NVL72-Infrastruktur trainiert wurde. Dieser Artikel beleuchtet die Rolle von NVIDIA in der KI-Entwicklung und die Bedeutung von Pretraining und Post-Training.