元OpenAI CTOのMira Murati氏が昨年設立したAIスタートアップThinking Machines Labは5月11日(米国時間)、「話しながら同時に聞ける」新世代AIモデル「Interaction Models」を発表した。応答速度0.4秒を実現し、OpenAIやGoogleの最新モデルを上回るとしている。

画像の出典:Tayfun Coskun/Anadolu / Getty Images

Thinking Machines Labは、2025年にOpenAIの最高技術責任者(CTO)を退社したMira Murati氏によって設立されたAI研究スタートアップだ。同社は月曜日、「Interaction Models(インタラクション・モデル)」と呼ぶ新しいAIモデルの研究プレビューを公開した。

|既存AIの「ターン制」を打破するフルデュプレックス方式

現在普及しているAIモデルはすべて同じ仕組みで動いている。「人が話す→AIが聞く→AIが応答する→人が聞く」という順番制(ターン制)だ。これに対しThinking Machinesは、AIが発言しながらユーザーの入力を同時に処理するモデルを開発した。

技術的には「フルデュプレックス(全二重)」と呼ばれ、電話の通話のように、いつでも割り込み(インタラプト)が可能なリアルタイム会話を実現する。

|TML-Interaction-Small:応答速度0.40秒、業界最速クラス

今回公開された試験版モデル「TML-Interaction-Small」は、応答遅延がわずか0.40秒を記録した。これは人間の自然な会話速度(約0.3~0.5秒)に匹敵し、OpenAIのGPT-Realtime-2.0(1.18秒)やGoogle Gemini(0.57秒)を大きく引き離す性能だと同社は主張する。

ベンチマークテスト(FD-bench V1.5)では、同モデルは77.8点を獲得し、GPT-Realtime-2.0(46.8点)の約2倍のスコアを達成した。

|研究プレビューに留まり、一般公開は年内予定

現時点でTML-Interaction-Smallは製品版ではなく、研究用プレビューと位置づけられている。同社はまだ一般公開を行っておらず、「今後数ヶ月以内に限定的な研究向けプレビューを実施し、年内に広く公開する」と発表した。

|「対話をモデルのネイティブ機能に」――創業者の狙い

Murati氏は声明で、「既存のAIは対話機能を後付けで追加しているが、真の協働パートナーになるには、対話をモデルの根幹(ネイティブ機能)にする必要がある」と強調した。

現時点では技術的な検証段階にあるが、ベンチマーク結果は印象的で、「リアルタイムでの相互作用をネイティブに扱う」というコンセプトは業界でも注目されている。実際の利用体験が技術的な主張に追いつくかは、公開されるまで待つ必要がある。