Beiträge

MiniMax’s Hailuo 02 übertrifft Google Veo 3 in Benutzerbenchmarks zu deutlich niedrigeren Videokosten
/
0 Kommentare
MiniMax hat mit Hailuo 02 die zweite Generation seines Video-AI-Modells vorgestellt, das bedeutende Verbesserungen in Bezug auf Leistung und Preis bietet. Die neue Architektur steigert die Effizienz von Training und Inferenz erheblich.

Echtzeit-Gespräche und Antworten in Googles Search Live
Mit der Einführung von Search Live hat Google eine innovative Möglichkeit geschaffen, um mit der Suchmaschine über Sprachbefehle zu interagieren. Nutzer in den USA können nun über das neue Live-Symbol Fragen stellen und erhalten AI-generierte gesprochene Antworten sowie Folgefragen.

Ein Podcast über die Programmierfähigkeiten von Gemini
Im neuesten Podcast von Google diskutieren Connie Fan und Danny Tarlow die Designziele hinter der Code-Generierung von Gemini und wie diese das Programmieren revolutionieren könnten.

GEMINI 2.5: Aktualisierte Verfügbarkeit und neue Funktionen
Google hat die Modelle Gemini 2.5 Pro und Flash veröffentlicht und bietet nun auch Flash-Lite in der Vorschau an. Die neuen Denkbudgets ermöglichen eine verbesserte Genauigkeit und Flexibilität für Entwickler.

Haben LLMs endlich die Geolokalisierung gemeistert?
In einer aktuellen Untersuchung hat Bellingcat die Fähigkeiten von Large Language Models getestet, um herauszufinden, ob diese Technologien in der Lage sind, präzise geografische Informationen aus Bildern zu extrahieren.

GOOGLE’S VEO FOR LIVE-ACTION VIDEOS
Google DeepMind hat in Zusammenarbeit mit Filmemachern den Kurzfilm “ANCESTRA” produziert, der Live-Action mit von Veo generierten Videos kombiniert. Dieser innovative Ansatz zeigt, wie generative KI die Grenzen des Geschichtenerzählens erweitern kann.

Google testet Audio-Überblicke für Suchanfragen
Google hat angekündigt, dass es mit Audio-Überblicken für bestimmte Suchanfragen experimentiert, um Nutzern eine alternative Möglichkeit zu bieten, Informationen zu konsumieren.

INSTITUTIONAL BOOKS 1.0: Ein bedeutendes Dataset für die Forschung
Die Harvard Library und Google Books haben 242 Milliarden Tokens aus nahezu 1 Million gemeinfreier Bücher veröffentlicht, die als hochwertiges Trainingsdataset dienen.

Eine Einführung in Googles Ansatz zur Sicherheit von KI-Agenten
In einem kürzlich veröffentlichten Papier beschreibt Google die wesentlichen Risiken, die mit dem Einsatz von KI-Agenten verbunden sind, sowie den Rahmen des Unternehmens zur Sicherung dieser Systeme.
