往下拉回到首頁
買 Mac Mini 跑 AI 模型到底該選誰?M4、M2 Pro、M1 Max 三選一,我也很困擾

買 Mac Mini 跑 AI 模型到底該選誰?M4、M2 Pro、M1 Max 三選一,我也很困擾

Mac Mini for local LLMs: M4 vs M2 Pro vs M1 Max — which actually wins for real work?

欸你知道嗎,我現在就在糾結這個問題。三台都在考慮,但根本選不出來。最扯的是,最新的 M4(32GB)速度反而最慢,結果舊一點的 M2 Pro(32GB)反而跑得更快?然後 M1 Max(64GB)雖然是老古董,但記憶體超大。如果你像我一樣每天都在用 Ollama、Qwen 或 Kimi 這些 AI 助手寫程式,有時候還要搞一些 RAG 的東西,光看規格表根本沒用。預算 2 到 3 千美元,不是沒錢,但真的不知道哪台才是最划算的。與其看規格,不如聽聽真的在用的人怎麼說,他們才知道哪台真的能用。

白話點評

Apple 的晶片規格根本在唬爛——那台「比較慢」的 M2 Pro 在 AI 工作上狂電 M4

欸不是,我跟你說,這件事會讓你重新審視一切:那台閃閃發亮的新 M4 Mac Mini 在跑本地大型語言模型(LLM)的時候,被老牌 M2 Pro 完全吊打。我講的是真實的每秒令牌數(tokens per second)測量,不是 Apple 那些行銷唬爛。M1 Max 配 64GB 記憶體就像黑馬一樣坐在那邊,記憶體頻寬大到爆炸,結果大家都在瘋新晶片。如果你每天用 Ollama 跑程式編寫助手或在建構檢索增強生成(RAG)管道,這個效能差距根本不是紙上談兵——它直接決定你的工作流是順暢還是一直在等待。最扯的是什麼?老晶片好像有什麼新架構遺失掉的秘密醬料。你那 2000-3000 美金的預算突然變得超複雜,因為最新的根本不是最快的。

結論別再讀那些基準測試了,直接去測實際工作量——趕快搞台 M2 Pro 趁還買得到,看它怎麼電爆那台「更強」的 M4。
7/10

AI 怎麼看

軟體開發

high
你可以做什麼

買之前一定要實際測試你的工作量在各個晶片上跑起來怎樣——推論速度根據模型大小和你的用途差超多的

重點是什麼

M2 Pro 在實際生成令牌的速度上狂電新的 M4,根本推翻了「越新越好」這個假設

為什麼要在乎

你用 AI 助手寫程式的日常工作流可能快 30% 或慢 30%,完全取決於你選哪台 Mac,但規格表根本看不出來

這跟你的工作有關嗎

AI 工程師

整個會變不一樣
為什麼會這樣

本地大型語言模型(LLM)的效能直接影響你建構檢索增強生成(RAG)管道和測試模型反應的迭代速度

你可以怎麼做

在決定買之前,一定要在各個晶片設定上跑一遍你實際用的模型——別傻傻相信行銷文案

軟體開發者

好消息
為什麼會這樣

在本地跑程式編寫助手代表沒有 API 費用,而且日常開發的回應速度快超多

你可以怎麼做

算一下你現在花在 AI API 的錢——本地推論可能六個月內就幫你回本

這些詞是什麼意思

Ollama(本地大語言模型運行工具)
就像是 AI 模型的 Docker,讓你在 Mac 上直接跑各種語言模型,完全不用靠雲端——簡單來說就是把 AI 模型裝在你自己的電腦裡。
Tokens per second(每秒令牌數)
這才是 AI 工作真正重要的速度指標——你的 Mac 能多快生成文字回應,直接影響程式編寫助手反應有多快。
RAG pipelines(檢索增強生成管道)
就像是把你自己的資料和 AI 模型結合在一起的工作流——比如說你要建一個懂你公司文件的聊天機器人,這需要超強的本地運算能力。
Memory bandwidth(記憶體頻寬)
M1 Max 在比較中的秘密武器——資料在記憶體和處理器之間移動的速度,對於有效率地處理大型 AI 模型超關鍵。