
欸你知道嗎?現在 Mac 也能跑微軟的 AI 3D 模型,根本不用買貴貴的 GPU
有人把微軟開發的 TRELLIS.2(一個把照片變成 3D 模型的 AI)改造成可以在 Mac 上跑。原本這個模型只能在 NVIDIA 的 GPU 上用,因為它用了五個特殊的 CUDA 工具(flex_gemm、flash_attn、o_voxel、cumesh、nvdiffrast),Mac 根本沒有。這個人超猛,直接自己寫了五個替代品出來,用純 Python 和 PyTorch 重新實現所有功能。簡單來說就是,現在你用 MacBook Pro 就能跑這個 AI,不用花大錢買 NVIDIA 顯卡了。對於用 Mac 的設計師或 3D 工作者來說,這根本是救星啊。
白話點評
你的 M5 Pro 24GB 記憶體現在根本是 AI 怪獸——量化的完美甜蜜點在這裡
有人拿著 M5 Pro 和 24GB RAM 在想怎樣用 Ollama 本地跑 Qwen 3.6,糾結要用 Q4 還是 Q3 量化。欸不是,這種問題本身就超扯——我們現在在討論哪個超大語言模型在筆電上跑最順,根本是在討論怎樣在家裡跑伺服器等級的東西。這證明 AI 民主化的速度根本超乎想像。24GB 統一記憶體的話,Q4_K_M 就是你的黃金比例——品質接近滿分,系統還有呼吸空間。Q3 量化確實存在但難找,而且記憶體省不了多少,24GB 根本不用省這個。最扯的是,這個人現在隨便在筆電上跑的模型,兩年前根本需要整個伺服器機房才跑得動。
Action
馬上試用每次 API 呼叫都要付錢、等雲端回應、沒網路就掛掉,AI 工作流根本被綁死
秒速回應、無限使用、飛機上也能用 AI——全部在你筆電上無聲運行
AI 怎麼看
軟體開發
high先試試 Q4_K_M 量化版本——這是 24GB 設定的完美平衡點,你幾分鐘內就會知道能不能跑
M5 Pro 的統一記憶體架構代表你的 24GB 是系統和模型共用的,所以實際上模型只能用大概 20GB
現在你可以在筆電上跑企業級的 AI 模型,不用再燒 API 額度或等雲端回應了,根本超爽
這跟你的工作有關嗎
AI 工程師
整個會變不一樣本地模型推論代表你可以不用 API 成本或延遲就能快速迭代,開發流程直接起飛
馬上下載 Ollama 試試 Qwen 3.6 Q4_K_M——你的開發速度會快 10 倍,我沒唬爛
資料科學家
好消息24GB RAM 讓你能跑以前只能用雲端的模型,現在可以離線分析了
下一個專案就用 Q4 量化試試——你會被效能有多接近驚到