
TRELLIS.2の画像から3D生成がMac(Apple Silicon)で動作 - NVIDIA GPUは不要
MicrosoftのTRELLIS.2をApple SiliconでPyTorch MPSを使って動かせるようにしました。元のバージョンはCUDA専用の5つのコンパイル済み拡張機能(flex_gemm、flash_attn、o_voxel、cumesh、nvdiffrast)に依存していて、Macには対応版がありません。ゼロから代替バックエンドを作成しました:純粋なPyTorchの疎3D畳み込み(flex_gemmの代替)、空間ハッシュを使ったPythonメッシュ抽出(o_voxelのCUDAハッシュマップ操作の代替)、疎Transformerの注意機構(flash_attnの代替)、GPU加速三線形補間(cumeshとnvdiffrastの代替)です。
テックブロガーの見解
M5 Pro 24GBがAIパワーハウスになった — 量子化の最適ポイントはここだ
M5 ProとRAM 24GBを持ってる人がOllama経由でQwen 3.6をローカルで実行する最良の方法を考えてて、Q4かQ3量子化のどっちが自分のセットアップに合うかで悩んでるんだよね。これって本当にすごい質問で、ノートパソコンで巨大言語モデルのどれが最高に動くかを議論してるわけ。2年前だったらサーバーファームが必要だったモデルをノートパソコンで気軽に実行できるってのが、AI民主化がどんだけ速く進んでるかを証明してる。24GBの統一メモリなら、Q4_K_Mがあなたのゴルディロックスゾーン — ほぼフル品質を出しながら、システムが呼吸する余裕も残る。Q3量子化も存在するけど、見つけるのが難しいし、24GBあるときの微々たるメモリ節約のために品質を落とす価値はないんだよ。本当に狂ってるのは、この人が2年前だったらサーバーファームが必要だったモデルをノートパソコンで気軽に実行してるってこと。
Action
馬上試用APIコール単位で金払って、クラウドレスポンスを待って、インターネット接続が切れたらAIワークフロー終了
即座のレスポンス、無制限の使用、飛行機でも動くAI — すべてノートパソコンで静かに動作
AI分析
ソフトウェア開発
highまずQ4_K_M量子化を試してみて — 24GBのセットアップには最適で、数分で動作するかどうかわかるから
M5 Proの統一メモリアーキテクチャは、24GBがシステムとモデル間で共有されるってことだから、実際のモデルには約20GBしか使えないんだよね
APIクレジットを燃やしたりクラウドレスポンスを待つ代わりに、ノートパソコンでエンタープライズグレードのAIモデルを実行できるようになった
職種への影響分析
AIエンジニア
役割変化ローカルモデル推論はAPIコストやレイテンシーの心配なくプロトタイピングと反復ができるってこと
今すぐOllamaをダウンロードしてQwen 3.6 Q4_K_Mをテストしてみて — 開発サイクルが10倍速くなるから
データサイエンティスト
チャンス24GBのRAMでこれまでクラウド専用だったモデルが使えるようになって、オフライン分析能力が手に入る
次のプロジェクトでQ4量子化から始めてみて — フル精度との性能差に驚くと思うよ