
TRELLIS.2 圖像轉 3D 現在可在 Mac(Apple Silicon)上運行 - 無需 NVIDIA GPU
我將微軟的 TRELLIS.2 移植到 Apple Silicon 上,透過 PyTorch MPS 運行。原始版本依賴五個僅限 CUDA 的編譯擴展(flex_gemm、flash_attn、o_voxel、cumesh、nvdiffrast),在 Mac 上沒有對應版本。我從零開始編寫了替代後端:純 PyTorch 稀疏 3D 卷積(替代 flex_gemm)、使用空間雜湊的 Python 網格提取(替代 o_voxel 中的 CUDA 雜湊映射操作)、用於稀疏 Transformer 的 SDPA 注意力機制(替代 flash_attn),以及 GPU 加速的三線性插值(替代 cumesh 和 nvdiffrast)。
科技博主觀點
你的 M5 Pro 24GB 記憶體剛剛變成 AI 怪獸——量化的完美點在這裡
有人拿著 M5 Pro 和 24GB RAM 想搞清楚怎樣用 Ollama 在本地跑 Qwen 3.6,特別是 Q4 還是 Q3 量化哪個更適合。欸不是,這根本就是在討論哪個超大語言模型在筆電上跑得最順——這本身就超扯。這代表 AI 民主化的速度比誰都預測得快。24GB 統一記憶體的話,Q4_K_M 就是你的黃金比例——品質接近滿分,系統還有呼吸空間。Q3 量化版本是有啦,但根本找不到,而且品質掉幅不值得為了省那點記憶體去用,你都有 24GB 了。最扯的是這傢伙在筆電上跑的模型,兩年前根本需要整個伺服器機房才跑得動。
Action
馬上試用每次 API 呼叫都要付費、等雲端回應、沒網路就掛掉——AI 工作流根本是噩夢
秒速回應、無限使用、飛機上也能用 AI——全部在你筆電上無聲運行
AI 分析
軟體開發
high先試試 Q4_K_M 量化版本——這是 24GB 設置的完美平衡點,幾分鐘內就能知道行不行
M5 Pro 的統一記憶體架構代表你的 24GB 是系統和模型共用的,所以實際上模型只能用大約 20GB
你現在可以在筆電上跑企業級 AI 模型,不用再燒 API 額度或等雲端回應了
職位影響分析
AI 工程師
角色轉型本地模型推論代表你可以不用 API 成本或延遲就能快速原型和迭代
今天就下載 Ollama 試試 Qwen 3.6 Q4_K_M——你的開發週期會快 10 倍
資料科學家
機會24GB RAM 讓你能跑之前只能上雲端的模型,給你離線分析的能力
下一個專案就用 Q4 量化版本開始——你會被效能有多接近驚呆