
OpenAI ライブストリーム
OpenAIがライブストリーム配信イベントを開催します。放送中に具体的な発表、新製品発表、またはデモンストレーションが明かされる予定です。
OpenAIが前回予告なしのライブストリームをやった時、GPT-4 Turboをドロップして、一晩で価格設定を完全に変えました

FastVLAというビジョン言語モデル(VLA)がオープンソースで公開されました。驚くべきことに、L4チップ上でリアルタイムの5Hzロボット制御を実現しています。ロボット研究者にとってはこのレベルの効率は夢のような話。ベンチマークと詳細なコード情報は元のスレッドで確認できます。
テックブロガーの見解
誰かがロボットビジョンのリアルタイム化を解いた。あなたのガレージロボティクスプロジェクトが超面白くなろうとしてます。
ロボティクス業界は何年もこの瞬間を待ってました。FastVLA—実際にリアルタイムで考えて動作できるビジョン言語アクションモデル—がオープンソース化されたんですけど、数字がマジで狂ってます。L4チップで5Hz性能って話ですよ。つまりロボットが見て、理解して、何をするか決めるのを1秒に5回できるってことで、それがゲーミングノートパソコンより安いハードウェアで動くんです。これ学術論文の都合のいいデモじゃなくて、ちゃんとしたベンチマーク、ちゃんとしたコード、ちゃんと動いてるロボットがあります。スレッド見てるとロボティクス好きなら心臓バクバクする技術詳細がいっぱい。マジで頭おかしいのは「いつかロボットが見たものを理解するようになるかな」から「コードはここ、何か作ってみて」まで一瞬で来たってことです。ロボティクスのいい考え思いついてから実際に作るまでの壁が完全に消えました。
Action
馬上試用ロボティクスプロジェクトが遅いクラウドAPIか1万ドル以上のハードウェアセットアップに頼ってて、動くまで何ヶ月もかかる
リアルタイムロボットビジョンがローカルで手頃なハードウェアで動いて、ガレージで好きなだけイテレーションできる
AI分析
ロボティクス&オートメーション
highFastVLAのリポジトリを今すぐクローンして、現在のビジョン言語スタックとベンチマークを取ってみてください
これは初めての本当にリアルタイム性能を実現できるオープンソースVLA—ほとんどのチームはまだクラウドAPIか1万ドル以上のセットアップに頼ってます
ロボティクスプロトタイプの構築コストが10倍安くなって、イテレーションが無限に簡単になります
職種への影響分析
ロボティクスエンジニア
役割変化手頃なハードウェアでリアルタイムビジョン言語処理ができるようになったから、自律ロボット開発の最大のボトルネックが消えました
今週からFastVLAで実験を始めてください—次のロボットデモはノートパソコンより安いハードウェアで動かせます
AIリサーチエンジニア
チャンスリアルタイム性能が実証されたオープンソースVLAが、マルチモーダルAIアプリケーションの新しいベースラインを提供します
彼らの最適化テクニックを研究してください—この効率性の突破口はあなた自身のモデルアーキテクチャにも応用できます