Künstliche Intelligenz

xAI Grok Modelle jetzt auf Azure verfügbar

20. Mai 2025

Microsoft hat die xAI Grok 3 und Grok 3 Mini über die Azure AI Foundry verfügbar gemacht, was Unternehmen Zugang zu leistungsstarken KI-Tools bietet.

ParScale: Ein neuer Ansatz zum parallelen Skalieren von LLMs

19. Mai 2025

0 Kommentare

ParScale hat ein drittes Paradigma für das Skalieren von LLMs eingeführt, das parallele Berechnungen sowohl während des Trainings als auch der Inferenz nutzt. Dieser Artikel beleuchtet die wichtigsten Erkenntnisse und Vorteile von ParScale.

SUPERHUMAN CODERS IN AI 2027 – NOT SO FAST

19. Mai 2025

0 Kommentare

Die Entwicklung von übermenschlichen Codierern durch KI wird voraussichtlich länger dauern als viele optimistische Prognosen vermuten lassen. Die Herausforderungen sind vielfältig und erfordern sowohl technologische als auch strategische Lösungen.

Wie Hardware-Einschränkungen schnelle KI-Entwicklungen verhindern

19. Mai 2025

0 Kommentare

In diesem Artikel wird untersucht, wie Hardware-Einschränkungen die schnelle Entwicklung von KI-Systemen beeinflussen und welche Rolle algorithmische Fortschritte dabei spielen.

OpenThinkIMG: Ein visuelles Werkzeug für KI-Agenten

16. Mai 2025

0 Kommentare

OpenThinkIMG ist ein Open-Source-Framework, das es vision-language Modellen ermöglicht, aktiv mit visuellen Werkzeugen zu interagieren und komplexe visuelle Probleme zu lösen.

BLIP3-O: Eine neue Ära der multimodalen Modelle

16. Mai 2025

0 Kommentare

BLIP3-o ist eine neue Diffusions-Transformer-Architektur, die herausragende Ergebnisse in multimodalen Benchmarks erzielt und die Integration von Bildverständnis und -generierung revolutioniert.

NOUS RESEARCH’S PSYCHE NETWORK TAPS IDLE GPUS FOR AI TRAINING

16. Mai 2025

0 Kommentare

Psyche ist ein auf Solana basierendes verteiltes Trainingssystem, das es jedem mit kompatibler Hardware ermöglicht, seine GPUs für das Training von KI-Modellen zur Verfügung zu stellen. Die erste Initiative des Projekts, 'Consilience', wird ein Modell mit 40 Milliarden Parametern unter Verwendung von 20 Billionen Tokens erstellen.

AGENTS, TOOLS, AND SIMULATORS: Ein tiefgehender Blick auf die Konzepte der KI

16. Mai 2025

0 Kommentare

In diesem Artikel werden die drei konzeptionellen Linsen von KI – Agenten, Werkzeuge und Simulatoren – untersucht, um deren Unterschiede und Gemeinsamkeiten zu verstehen.

ALPHAEVOLVE: DEEPMIND’S GEMINI-POWERED CODING AGENT FÜR ALGORITHMUSDESIGN

15. Mai 2025

0 Kommentare

Google DeepMind hat mit AlphaEvolve einen neuen evolutionären Coding-Agenten vorgestellt, der auf den Gemini-Modellen basiert und vollständige Algorithmuslösungen generiert und verbessert.

AI2s neues kleines KI-Modell übertrifft vergleichbare Modelle von Google und Meta

14. Mai 2025

0 Kommentare

AI2 hat mit Olmo 2 1B ein neues KI-Modell vorgestellt, das in wichtigen Benchmarks besser abschneidet als vergleichbare Modelle von Google, Meta und Alibaba. Das Modell ist unter einer permissiven Lizenz verfügbar und kann auf weniger leistungsfähiger Hardware betrieben werden.

Unified Training and Sampling für Generative Modelle: Ein Überblick über UCGM

14. Mai 2025

0 Kommentare

UCGM bietet ein einheitliches Framework für das Training und Sampling von kontinuierlichen generativen Modellen, das sowohl multi-step als auch few-step Ansätze unterstützt.

VISUAL AUTOREGRESSION WITHOUT QUANTIZATION (GITHUB REPO)

14. Mai 2025

0 Kommentare

Die kontinuierliche visuelle autoregressive Generierung ist ein spannendes Forschungsfeld, das in den letzten Jahren an Bedeutung gewonnen hat. Mit der Einführung von EAR wird ein neuer Ansatz vorgestellt, der die Quantisierung vermeidet und stattdessen auf streng korrekte Bewertungsregeln setzt.

Tencent stellt WizardLM-Team ein, eine Microsoft AI-Gruppe mit einer ungewöhnlichen Geschichte

14. Mai 2025

0 Kommentare

WizardLM, eine ehemalige Microsoft AI-Gruppe, hat sich Tencent angeschlossen und ein neues AI-Modell veröffentlicht, das die Angebote von Google übertreffen soll.

BAMBA-9B-V2: Ein leistungsstarkes KI-Modell von IBM und Partnern

13. Mai 2025

0 Kommentare

BAMBA-9B-V2 ist ein neues KI-Modell von IBM und Partnern, das auf Mamba2 basiert und Llama 3.1 8B übertrifft. Der Artikel beleuchtet die Leistungssteigerungen, den Trainingsansatz und die Integration in die vLLM-Community.

Flow-GRPO: Integration von Reinforcement Learning in Flow Matching Modelle

12. Mai 2025

0 Kommentare

Flow-GRPO integriert Reinforcement Learning in Flow Matching Modelle, um die Effizienz und Genauigkeit zu steigern. Dieser Artikel beleuchtet die technischen Details und Implementierungsmöglichkeiten.

Mistral Medium 3: Die neue Ära der KI-Modelle für Unternehmen

9. Mai 2025

0 Kommentare

Mistral Medium 3 wurde eingeführt, um eine starke Unternehmensleistung zu einem erheblich niedrigeren Preis zu bieten. Es ist optimiert für flexible Bereitstellungen und Programmieraufgaben.

Artikelbild für den Artikel: oogle fhrt mplicit aching ein um den ugriff auf seine neuesten odelle gnstiger zu gestalten

Google führt ‘Implicit Caching’ ein, um den Zugriff auf seine neuesten KI-Modelle günstiger zu gestalten

9. Mai 2025

0 Kommentare

Google hat eine neue Funktion in seiner Gemini API eingeführt, die als 'implicit caching' bezeichnet wird und bis zu 75 % Kosteneinsparungen für Entwickler verspricht.

Artikelbild für den Artikel: smosis elbstverbesserung durch chtzeiterstrkungslernen

Osmosis: Selbstverbesserung durch Echtzeit-Verstärkungslernen

9. Mai 2025

0 Kommentare

Osmosis ist eine Plattform für KI-Selbstverbesserung durch Echtzeit-Verstärkungslernen. Das Team hat ein leichtgewichtiges Modell als Open Source veröffentlicht, das in der Lage ist, mit den besten Modellen für das Multi-Client-Processing (MCP) zu konkurrieren.

Artikelbild für den Artikel: ie llusion der estenliste erzerrungen im enchmarking von hatbots

Die Illusion der Bestenliste: Verzerrungen im Benchmarking von Chatbots

9. Mai 2025

0 Kommentare

Die Bewertung des Fortschritts in der KI-Entwicklung ist entscheidend, doch die Chatbot Arena zeigt systematische Verzerrungen durch ungleiche Datenzugänge und selektive Offenlegung. Dieser Artikel beleuchtet die Probleme und bietet Reformvorschläge für eine gerechtere Bewertungslandschaft.

Gibt es eine Halbwertszeit für die Erfolgsquoten von KI-Agenten?

9. Mai 2025

0 Kommentare

Die Leistung von KI-Agenten auf langen Aufgaben folgt einem Modell mit einer konstanten Fehlerrate, was zu einem exponentiellen Rückgang der Erfolgsquoten führt. Jeder Agent kann durch eine 'Halbwertszeit' charakterisiert werden.

xAI Grok Modelle jetzt auf Azure verfügbar

ParScale: Ein neuer Ansatz zum parallelen Skalieren von LLMs

SUPERHUMAN CODERS IN AI 2027 – NOT SO FAST

Wie Hardware-Einschränkungen schnelle KI-Entwicklungen verhindern

OpenThinkIMG: Ein visuelles Werkzeug für KI-Agenten

BLIP3-O: Eine neue Ära der multimodalen Modelle

NOUS RESEARCH’S PSYCHE NETWORK TAPS IDLE GPUS FOR AI TRAINING

AGENTS, TOOLS, AND SIMULATORS: Ein tiefgehender Blick auf die Konzepte der KI

ALPHAEVOLVE: DEEPMIND’S GEMINI-POWERED CODING AGENT FÜR ALGORITHMUSDESIGN

AI2s neues kleines KI-Modell übertrifft vergleichbare Modelle von Google und Meta

Unified Training and Sampling für Generative Modelle: Ein Überblick über UCGM

VISUAL AUTOREGRESSION WITHOUT QUANTIZATION (GITHUB REPO)

Tencent stellt WizardLM-Team ein, eine Microsoft AI-Gruppe mit einer ungewöhnlichen Geschichte

BAMBA-9B-V2: Ein leistungsstarkes KI-Modell von IBM und Partnern

Flow-GRPO: Integration von Reinforcement Learning in Flow Matching Modelle

Mistral Medium 3: Die neue Ära der KI-Modelle für Unternehmen

Google führt ‘Implicit Caching’ ein, um den Zugriff auf seine neuesten KI-Modelle günstiger zu gestalten

Osmosis: Selbstverbesserung durch Echtzeit-Verstärkungslernen

Die Illusion der Bestenliste: Verzerrungen im Benchmarking von Chatbots

Gibt es eine Halbwertszeit für die Erfolgsquoten von KI-Agenten?

Über uns

Archive

Kategorien

Über uns

Archive

Kategorien

Schlagwörter