阿里開源全模態(tài)模型R1
阿里通義實驗室開源R1-Omni模型——業(yè)界首個將具有可驗證獎勵的強化學習(RLVR)應用于全能多模態(tài)大語言模型。研究人員利用RLVR對開源Omni模型HumanOmni-0.5B進行優(yōu)化,在推理能力、情感識別準確性和泛化能力三個關(guān)鍵方面顯著提高了其性能。R1-Omni能夠更清楚地理解視覺和聽覺信息如何促進情緒識別,能夠明確展示哪些模態(tài)信息對特定情緒的判斷起到了關(guān)鍵作用。
文章評價

發(fā)布
發(fā)布