Artikelbild für den Artikel: Cloud Run GPUs: Jetzt allgemein verfügbar und erleichtern das Ausführen von KI-Workloads für alle

Cloud Run GPUs: Jetzt allgemein verfügbar und erleichtern das Ausführen von KI-Workloads für alle

NVIDIA GPU-Support für Cloud Run ist jetzt allgemein verfügbar. Mit dieser neuen Funktion können Entwickler GPU-beschleunigte Anwendungen einfacher, schneller und kosteneffizienter betreiben. Dies eröffnet neue Anwendungsfälle und verbessert die Leistung bestehender Anwendungen erheblich.

Einführung in Cloud Run mit GPU-Unterstützung

Die Unterstützung für GPUs in Cloud Run ist ein bedeutender Fortschritt, der es Entwicklern ermöglicht, KI-Anwendungen schneller und kostengünstiger in die Produktion zu bringen. Zu den Hauptvorteilen gehören:

  • Pay-per-Second Billing: Sie zahlen nur für die GPU-Ressourcen, die Sie tatsächlich nutzen, bis hinunter zur Sekunde.
  • Skalierung auf Null: Cloud Run skaliert Ihre GPU-Instanzen automatisch auf null, wenn keine Anfragen eingehen, wodurch Leerkosten vermieden werden.
  • Schneller Start und Skalierung: Von null auf eine Instanz mit einer GPU und installierten Treibern in weniger als 5 Sekunden.
  • Vollständige Streaming-Unterstützung: Erstellen Sie interaktive Anwendungen mit Unterstützung für HTTP- und WebSocket-Streaming.

GPU-Unterstützung für alle

Ein aufregender Aspekt dieser allgemeinen Verfügbarkeit ist, dass Cloud Run GPUs jetzt für alle verfügbar sind, ohne dass eine Quotenanfrage erforderlich ist. Dies beseitigt eine erhebliche Eintrittsbarriere und ermöglicht es Ihnen, sofort auf GPU-Beschleunigung für Ihre Cloud Run-Dienste zuzugreifen. Sie können einfach --gpu 1 in der Befehlszeile von Cloud Run verwenden oder das Kontrollkästchen „GPU“ in der Konsole aktivieren.

Produktionsbereit und SLA-geschützt

Mit der allgemeinen Verfügbarkeit ist Cloud Run mit GPU-Unterstützung nun durch die Service Level Agreement (SLA) von Cloud Run abgedeckt, was Ihnen Zuverlässigkeit und Verfügbarkeit garantiert. Standardmäßig bietet Cloud Run zonale Redundanz, um sicherzustellen, dass genügend Kapazität vorhanden ist, um Ihre Dienste auch bei einem zonalen Ausfall widerstandsfähig zu machen.

Multi-Regionale GPUs

Um globale Anwendungen zu unterstützen, sind Cloud Run GPUs in fünf Google Cloud-Regionen verfügbar: us-central1 (Iowa, USA), europe-west1 (Belgien), europe-west4 (Niederlande), asia-southeast1 (Singapur) und asia-south1 (Mumbai, Indien). Dies vereinfacht die Bereitstellung Ihrer Dienste über mehrere Regionen hinweg und sorgt für eine niedrigere Latenz und höhere Verfügbarkeit für globale Benutzer.

Neue Anwendungsfälle mit GPUs auf Cloud Run Jobs

Die Leistung von Cloud Run mit GPUs ist nicht nur für Echtzeit-Inferenz geeignet. Wir freuen uns, die Verfügbarkeit von GPUs für Cloud Run Jobs bekannt zu geben, was neue Anwendungsfälle, insbesondere für Batch-Verarbeitung und asynchrone Aufgaben, eröffnet. Beispiele hierfür sind:

  • Modell-Fine-Tuning: Feinabstimmung eines vortrainierten Modells auf spezifische Datensätze.
  • Batch-AI-Inferenz: Durchführung großangelegter Batch-Inferenzaufgaben.
  • Batch-Medienverarbeitung: Transkodierung von Videos oder komplexe Bildmanipulationen.

Was Kunden über Cloud Run GPUs sagen

Cloud Run hilft uns, KI-Anwendungen schnell zu iterieren und senkt unsere Betriebs- und Wartungskosten erheblich.“ – Guangchao Li, AI-Architekt, vivo

„L4 GPUs bieten wirklich starke Leistung zu einem vernünftigen Preis. Wir konnten unsere Kosten um 85 % senken.“ – John Gill, Sr. Software Engineer, Wayfair

„Die Skalierbarkeit von Cloud Run GPU ermöglicht es uns, Millionen von Bildern einfach zu analysieren und zu verarbeiten.“ – Sam Schickler, Data Team Lead, Midjourney

Fazit und Ausblick

Cloud Run mit GPU-Unterstützung ist bereit, Ihre nächste Generation von Anwendungen zu unterstützen. Tauchen Sie in die Dokumentation ein, erkunden Sie unsere Schnellstartanleitungen und überprüfen Sie unsere Best Practices zur Optimierung des Modellladens. Wir können es kaum erwarten zu sehen, was Sie entwickeln!

Quellenliste:

Dieser Artikel wurde mithilfe von KI verfasst und basiert auf automatisch gesammelten Informationen.
0 Kommentare

Hinterlasse einen Kommentar

An der Diskussion beteiligen?
Hinterlasse uns deinen Kommentar!

Schreibe einen Kommentar