
OpenAI 要開直播了,會不會又推出什麼新東西?
欸你知道嗎,OpenAI 最近要辦一場直播活動。雖然現在還不知道會講什麼,但根據他們過去的習慣,通常直播就代表有新東西要發表。可能是 ChatGPT 的新功能、新模型,或者什麼其他猛的東西。反正 OpenAI 的直播從來不會無聊,有興趣的話可以追蹤一下,說不定又會有什麼改變遊戲規則的公告。
The last time OpenAI did an unannounced livestream, they dropped GPT-4 Turbo and changed pricing overnight


白話點評
Apple 的晶片規格根本在唬爛——那台「比較慢」的 M2 Pro 在 AI 工作上狂電 M4
欸不是,我跟你說,這件事會讓你重新審視一切:那台閃閃發亮的新 M4 Mac Mini 在跑本地大型語言模型(LLM)的時候,被老牌 M2 Pro 完全吊打。我講的是真實的每秒令牌數(tokens per second)測量,不是 Apple 那些行銷唬爛。M1 Max 配 64GB 記憶體就像黑馬一樣坐在那邊,記憶體頻寬大到爆炸,結果大家都在瘋新晶片。如果你每天用 Ollama 跑程式編寫助手或在建構檢索增強生成(RAG)管道,這個效能差距根本不是紙上談兵——它直接決定你的工作流是順暢還是一直在等待。最扯的是什麼?老晶片好像有什麼新架構遺失掉的秘密醬料。你那 2000-3000 美金的預算突然變得超複雜,因為最新的根本不是最快的。
AI 怎麼看
軟體開發
high買之前一定要實際測試你的工作量在各個晶片上跑起來怎樣——推論速度根據模型大小和你的用途差超多的
M2 Pro 在實際生成令牌的速度上狂電新的 M4,根本推翻了「越新越好」這個假設
你用 AI 助手寫程式的日常工作流可能快 30% 或慢 30%,完全取決於你選哪台 Mac,但規格表根本看不出來
這跟你的工作有關嗎
AI 工程師
整個會變不一樣本地大型語言模型(LLM)的效能直接影響你建構檢索增強生成(RAG)管道和測試模型反應的迭代速度
在決定買之前,一定要在各個晶片設定上跑一遍你實際用的模型——別傻傻相信行銷文案
軟體開發者
好消息在本地跑程式編寫助手代表沒有 API 費用,而且日常開發的回應速度快超多
算一下你現在花在 AI API 的錢——本地推論可能六個月內就幫你回本