阿里通義實(shí)驗(yàn)室開源R1-Omni模型——業(yè)界首個(gè)將具有可驗(yàn)證獎(jiǎng)勵(lì)的強(qiáng)化學(xué)習(xí)(RLVR)應(yīng)用于全能多模態(tài)大語言模型。研究人員利用RLVR對開源Omni模型HumanOmni-0.5B進(jìn)行優(yōu)化,在推理能力、情感識別準(zhǔn)確性和泛化能力三個(gè)關(guān)鍵方面顯著提高了其性能。R1-Omni能夠更清楚地理解視覺和聽覺信息如何促進(jìn)情緒識別,能