L’ultima versione 3.2 di DeepSeek sperimenta un nuovo meccanismo di attenzione sparsa che diminuisce l’overhead computazionale e di memoria durante l’elaborazione di contesti lunghi, mantenendo alta la qualità. Supporta inoltre acceleratori cinesi e integrazioni runtime per un più ampio impiego in motori di inferenza mainstream.




