
OpenAI 要開直播了,會不會又推出什麼新東西?
欸你知道嗎,OpenAI 最近要辦一場直播活動。雖然現在還不知道會講什麼,但根據他們過去的習慣,通常直播就代表有新東西要發表。可能是 ChatGPT 的新功能、新模型,或者什麼其他猛的東西。反正 OpenAI 的直播從來不會無聊,有興趣的話可以追蹤一下,說不定又會有什麼改變遊戲規則的公告。
The last time OpenAI did an unannounced livestream, they dropped GPT-4 Turbo and changed pricing overnight



白話點評
有人剛破解了機器人即時視覺的密碼。你的車庫機器人專案要起飛了。
機器人圈等這一刻等超久。FastVLA—一個視覺語言動作模型,真的能即時思考和行動—剛開源,數字爆炸到不行。我們在講 L4 晶片上 5Hz 的性能,意思是你的機器人能在比不錯的電競筆電還便宜的硬體上,一秒看五次、理解五次、決定五次要幹嘛。這不是什麼學術論文裡挑選出來的漂亮 Demo—有真實的基準測試、真實的程式碼、真實的機器人在動。那個討論串裡滿滿都是技術細節,任何機器人工程師看了都會心跳加速。讓我最震驚的是,我們從「也許有一天機器人會看懂東西」一下子跳到「給你程式碼,去做東西吧」,感覺快到不行。有個酷機器人想法和真的做出來之間的牆,現在直接被砸爆了。
Action
馬上試用機器人專案被卡在慢吞吞的雲端 API,或是要花 10K 美金以上買硬體,還要等好幾個月才能搞定
即時機器人視覺在便宜硬體上本地跑,你在車庫裡就能快速迭代
AI 怎麼看
機器人與自動化
high馬上去 Clone FastVLA 的 Repo,然後拿它來跟你現在用的視覺語言模型比一下
這是第一個真的能在一般消費級硬體上跑出即時性能的開源視覺語言動作模型(VLA)—大多數團隊現在還在用雲端 API 或要花 10K 美金以上才能搞定的設備
你的機器人原型製作成本直接砍掉 10 倍,迭代速度快到不行
這跟你的工作有關嗎
機器人工程師
整個會變不一樣即時視覺語言處理在便宜硬體上跑起來,直接解決了自主機器人開發最大的瓶頸
這禮拜就開始玩 FastVLA—你下一個機器人展示可能會在比筆電還便宜的硬體上跑
AI 研究工程師
好消息開源視覺語言動作模型有實證的即時性能,給多模態 AI 應用一個新的基準線
研究他們的優化技術—這個效率突破可能能套用到你自己的模型架構上