Beiträge

TimeScope: Wie gut können multimodale Modelle lange Videos verarbeiten?
/
0 Kommentare
TimeScope ist ein neuer Open-Source-Benchmark zur Bewertung von Vision-Modellen und deren Fähigkeit, lange Videos zu verarbeiten. Der Benchmark untersucht nicht nur die Abrufbarkeit von Informationen, sondern auch die Synthese, Lokalisierung und feingranulare Bewegungsanalyse.