Top 5 This Week

Modelli multimodali apprendono il grounding senza supervisione

generative ai and innovation

Author: Redazione

Ottobre 18, 2025

Less than 1 min.read

Un recente studio mostra che i Large Multimodal Models (LMM) sviluppano capacità di grounding visivo anche senza dati supervisionati. Attraverso l’approccio attend-and-segment e il modello DiffLMM, è possibile ottenere segmentazioni accurate migliorando le performance in compiti di visione-linguaggio senza addestramenti specifici.

Leggi l’articolo

Modelli di linguaggio AI per diagnosi e triage: performance e sfide

Campagna AI manipola elettori israeliani sui social

Redazione https://aispotlights.org