MiniMax M3がSWE-Bench Proで59%を記録しGPT-5.5超え、100万トークン対応の初オープンウェイトモデル

MiniMaxは、単一のスパースアテンションアーキテクチャで100万トークンのコンテキストウィンドウとネイティブなマルチモーダル機能を備え、SWE-Bench ProでGPT-5.5を上回る59.0%を記録したオープンウェイトモデル「M3」をリリースした。オープンウェイトは10日以内にHugging Faceで公開される予定だ。これにより、外部API経由で独自のコードを送信できないチームでも、現在のクローズドな最先端モデルに匹敵するセルフホスト可能なモデルを利用できるようになる。

出典： marktechpost.com ↗

MSAは「KV outer gather Q」アプローチを使う。KVブロックは、それらにヒットするクエリを集約するためのアウターループとして機能する。各ブロックは一度だけ読み込まれ、メモリへのアクセスは連続的だ。

MiniMaxチーム

なぜ重要か

→ Open-weightモデルが、独自のAPIに依存せず、コーディングベンチマークで閉鎖的な最先端モデルに匹敵する
→ 100万トークンのコンテキストが15倍の高速化を伴い、長いコンテキストの自律タスクを可能にする
→ 独自のコードを保護するチーム向けの、自己ホスト可能な代替手段

Open weightsが最先端に追いつく

このエディションの他の記事