AMD推出完全開源的3B參數語言模型Instella,媲美Llama
3月6日消息,AMD今日宣布,為Radeon RX 9070系列開源Linux驅動程序,還宣布開源Instella —— 一個完全開源的3B參數語言模型。
AMD Instella代表“完全開源的尖端30億參數語言模型(LMs)”。這些模型在AMD Instinct MI300X GPU上進行了訓練,根據AMD發布的數據,其性能與Llama 3.2 3B、Gemma-2 2B和Qwen 2.5 3B等相媲美。
AMD Instella模型是在Instinct MI300X硬件上從頭開始訓練的,并且宣稱是完全開源的:
完全開源和可訪問:模型權重、訓練超參數、數據集和代碼的完全開源發布,促進人工智能社區內的創新與合作。
IT之家附開源地址如下:
https://github.com/AMD-AIG-AIMA/Instella
【來源: IT之家 】