往下拉回到首頁
阿里巴巴偷偷放出兩個超快 AI 模型,參數少一半但速度快兩倍

阿里巴巴偷偷放出兩個超快 AI 模型,參數少一半但速度快兩倍

Alibaba Just Dropped Marco-Mini and Marco-Nano: Sparse AI Models That Run Stupidly Fast

欸你知道嗎,阿里巴巴六天前放出了兩個新的 AI 模型,但根本沒人在討論。一個叫 Marco-Mini,一個叫 Marco-Nano,都用了一個超聰明的設計叫「混合專家」(MoE)。簡單來說就是,這些模型不會一次把全部的腦子都用上,而是根據你問的問題,只啟動需要的部分——就像你不會為了回答數學題而同時用上你的音樂知識一樣。Marco-Mini 看起來有 17.3 億個參數,但其實每次只用 0.86 億個;Marco-Nano 更小,8 億個參數只用 0.6 億個。這代表什麼?跑起來超快,成本超便宜,還能處理多種語言。說真的,如果你想要一個又聰明又省錢的 AI,這兩個根本是偷吃步的選擇。

相關標籤

language modelsparse MoEmultilingualinstruction-tunedefficient inferenceparameter efficiency