下に引いて戻る
Show HN: Apple Silicon で TRELLIS.2 画像から3D生成をネイティブ実行

Show HN: Apple Silicon で TRELLIS.2 画像から3D生成をネイティブ実行

Show HN: Run TRELLIS.2 Image-to-3D generation natively on Apple Silicon

マイクロソフトの TRELLIS.2(40 億パラメータの画像から 3D へのモデル)を Apple Silicon 上で PyTorch MPS を使ってネイティブ実行するようにポートしました。元のバージョンは CUDA、flash_attn、nvdiffrast、カスタム疎畳み込みカーネルが必要でしたが、これらは Mac では動作しません。CUDA 固有の操作を純粋な PyTorch の代替案に置き換えました。具体的には、gather-scatter 疎 3D 畳み込み、疎 Transformer 用の SDPA アテンション、CUDA ハッシュマップ操作を置き換える Python ベースのメッシュ抽出です。合計 9 ファイルで数百行の変更を加えました。

テックブロガーの見解

誰かがMicrosoftの40億パラメータ3D AIをMacBookで動かすコード破ったんだけど、これマジでヤバい。

MicrosoftがTRELLIS.2をリリースした — 写真を3Dオブジェクトに変換する化け物みたいなモデル — だけどNVIDIA GPUに縛り付けられてた。Flash Attention、カスタム疎卷積、CUDAハッシュマップ — 全部。それでShow HNのどっかの天才が『コーヒー飲みながら待ってろ』って言ってApple Silicon上でネイティブに動くようにポートした。CUDA専用操作を純粋なPyTorch代替案に置き換えたコード、数百行だけ。ヤバいのはこれが実際に動くってこと。M3 MacBook Proで40億パラメータの画像から3Dモデル生成ができる。クラウドなし、NVIDIA税なし、GPU時間の順番待ちなし。これは業界全体が一夜にして方向転換するレベルの民主化。

評決M-series Macを持ってたら、このリポジトリをクローンして今すぐ実行してみ — ノートパソコンが写真を3Dモデルに変える様子を見てみ — 未来がポータブルになった。
9/10

Action

馬上試用
1Show HNの投稿からApple Silicon ポートリポジトリをクローン
2M-series MacにMPS対応のPyTorchをインストール
3テスト写真で画像から3D生成スクリプトを実行
Before

写真から3Dモデルを生成するのに高額なNVIDIA GPUとクラウドサービスが必要

After

MacBook Proで40億パラメータの3D生成を数分でローカル実行

AI分析

3Dコンテンツ制作

high
取るべきアクション

このポートを今すぐダウンロードしてM-series Macでテストしてみて — これがコンセプトワークの3Dモデリングパイプライン全体を置き換える可能性があるよ

重要な洞察

写真を3Dオブジェクトに変換する40億パラメータモデルが、1万ドルのGPUリグじゃなくてノートパソコンで動いてる

なぜ重要か

クライアント会議中に3Dアセットをプロトタイプできるようになった — レンダーファーム待つのに何日もかかることがなくなった

ゲーム開発

high
取るべきアクション

高速プロトタイピング用にこれをテストしてみて — コンセプトアートを数分でプレイ可能な3Dアセットに変換できるって想像してみ

重要な洞察

AI 3D生成をNVIDIAカードに縛り付けていた技術的な壁が、純粋なPyTorch代替案で完全に破壊された

なぜ重要か

インディーゲームスタジオがMacBookだけでAAA級のアセットパイプラインと競争できるようになった

職種への影響分析

3Dアーティスト

役割変化
影響の原因

MicrosoftのTRELLIS.2は写真から3Dモデルを生成できるし、今はお前が既に持ってるMacBook Proで動く

対応戦略

コンセプトワークでこれを試し始めてみ — スキルを置き換えるわけじゃないけど、反復速度が10倍になる

iOSデベロッパー

チャンス
影響の原因

Apple Silicon最適化により、クラウド依存なしでARアプリ用の3Dコンテンツをローカルで生成できるようになった

対応戦略

このリポジトリをフォークして、3D生成をARKitワークフローに直接統合する方法を探ってみ

キーワード

image-to-3Dmodel portingApple SiliconMPSCUDA alternativesparse convolutionmesh extraction

用語解説

TRELLIS.2(TRELLIS.2模型)
Microsoftの40億パラメータ AI モデル。2D画像から3Dオブジェクトを生成する。元々は高額なNVIDIA GPUが必要だったけど、Apple Siliconで動くようにポートされた。
PyTorch MPS(PyTorch金屬性能著色器)
PyTorchのApple Metal Performance Shaders バックエンド。Apple Silicon チップでAIモデルを効率的に動かす。このCUDA-to-Macポートの鍵となる技術。
Sparse Convolution(稀疏卷積)
ゼロ以外の値だけを処理するメモリ効率的なニューラルネットワーク操作。3D生成に重要だけど、元々はCUDA専用コードで実装されてた — このポートが純粋なPyTorchで置き換えた。
Flash Attention(快閃注意力機制)
通常CUDAが必要なメモリ効率的なアテンションメカニズム。このポートはPyTorchのSDPA attentionで置き換えて、MacでのモデルをOK状態にした。