往下拉回到首頁
Show HN: 在 Apple Silicon 上原生執行 TRELLIS.2 圖像轉 3D 生成模型

Show HN: 在 Apple Silicon 上原生執行 TRELLIS.2 圖像轉 3D 生成模型

Show HN: Run TRELLIS.2 Image-to-3D generation natively on Apple Silicon

我將微軟的 TRELLIS.2(40 億參數的圖像轉 3D 模型)移植到 Apple Silicon 上,透過 PyTorch MPS 執行。原始版本需要 CUDA 搭配 flash_attn、nvdiffrast 和自訂稀疏卷積核心——這些在 Mac 上都無法運作。我用純 PyTorch 替代方案取代了 CUDA 特定操作:包括 gather-scatter 稀疏 3D 卷積、用於稀疏 Transformer 的 SDPA 注意力機制,以及以 Python 實現的網格提取(取代 CUDA 雜湊表操作)。總共在 9 個檔案中修改了數百行程式碼。

科技博主觀點

有人剛剛破解了在 MacBook 上跑微軟 40 億參數 3D AI 的方法。這根本改變一切。

微軟丟出了 TRELLIS.2——一個超猛的模型可以把任何照片變成 3D 物體——但它被鎖在 NVIDIA GPU 上面,全是 CUDA 的黑魔法。Flash Attention、自訂稀疏卷積、CUDA 雜湊表——什麼都有。然後有個天才在 Show HN 上說「讓我來」,直接把整個東西移植到 Apple Silicon 上跑。我們在講的是幾百行程式碼,把所有 CUDA 專用的操作換成純 PyTorch。最扯的是?它真的動了。你現在可以在 M3 MacBook Pro 上跑一個 40 億參數的圖片轉 3D 模型。沒有雲端、沒有 NVIDIA 稅金、沒有排隊等 GPU 時間。這就是那種一夜之間讓整個產業轉向的民主化。

結論如果你有 M 系列 Mac,現在就 clone 這個 repo 然後看著你的筆電把照片變成 3D 模型——未來已經變成可以帶著走的東西了。
9/10

Action

馬上試用
1從 Show HN 貼文 clone Apple Silicon 移植版的 repo
2在你的 M 系列 Mac 上安裝支援 MPS 的 PyTorch
3用一張測試照片跑圖片轉 3D 生成腳本
Before

需要昂貴的 NVIDIA GPU 和雲端服務才能從照片生成 3D 模型

After

在你的 MacBook Pro 上幾分鐘內就能本地跑 40 億參數的 3D 生成

AI 分析

3D 內容創作

high
應採取行動

馬上下載這個版本然後在你的 M 系列 Mac 上測試——這根本可以取代你整個概念設計的 3D 建模流程

關鍵洞察

一個 40 億參數的模型現在可以在筆電上把照片變成 3D 物體,不用再靠那些要價 1 萬美金的 GPU 工作站

為什麼重要

你現在可以在客戶會議中直接做 3D 資產原型,不用再等好幾天的渲染農場

遊戲開發

high
應採取行動

拿這個來快速原型製作——想像一下把概念美術在幾分鐘內變成可以玩的 3D 資產

關鍵洞察

那些把 AI 3D 生成鎖在 NVIDIA 顯卡上的技術障礙現在被純 PyTorch 方案直接破掉了

為什麼重要

你的獨立遊戲工作室現在可以用只有 MacBook 就跟 3A 大廠的資產製作流程競爭

職位影響分析

3D 美術師

角色轉型
影響成因

微軟的 TRELLIS.2 可以從照片生成 3D 模型,現在它可以在你已經有的 MacBook Pro 上跑

應對策略

開始用這個做概念設計——它不會取代你的技能,但會讓你的迭代速度快 10 倍

iOS 開發者

機會
影響成因

Apple Silicon 最佳化代表你現在可以在本地生成 3D 內容給 AR 應用,不用靠雲端

應對策略

Fork 這個 repo 然後試試把 3D 生成直接整合進你的 ARKit 工作流

關鍵字

image-to-3Dmodel portingApple SiliconMPSCUDA alternativesparse convolutionmesh extraction

名詞解釋

TRELLIS.2(TRELLIS.2模型)
微軟的 40 億參數 AI 模型,可以從 2D 圖片生成 3D 物體,原本需要昂貴的 NVIDIA GPU,現在已經移植到 Apple Silicon 上跑
PyTorch MPS(PyTorch金屬性能著色器)
Apple 為 PyTorch 開發的 Metal Performance Shaders 後端,讓 AI 模型可以在 Apple Silicon 晶片上高效運行,是這次 CUDA 轉 Mac 移植的關鍵技術
Sparse Convolution(稀疏卷積)
一種記憶體高效的神經網路操作,只處理非零值,對 3D 生成很重要但原本是用 CUDA 專用程式碼寫的,這次移植用純 PyTorch 取代了
Flash Attention(快閃注意力機制)
一種記憶體高效的注意力機制,通常需要 CUDA,但這次移植用 PyTorch 的 SDPA 注意力取代,讓 3D 生成模型可以在 Mac 上跑