Thinking Machines、会話中に聞き続けるAI開発
原題: Thinking Machines wants to build an AI that actually listens while it talks
なぜ重要か
AIの会話体験を根本的に変える可能性があり、より自然な人間とAIの対話実現により新たな用途開拓が期待される。
元OpenAI CTOのMira Muratiが設立したThinking Machines Labは5月11日、従来の順番制会話ではなく同時に入力処理と応答生成を行う「インタラクションモデル」を発表した。応答速度は0.40秒で人間の会話速度に近く、OpenAIやGoogleのモデルより高速としている。
Thinking Machines Labは、従来のAIモデルが採用する「ユーザーが話す→AIが聞く→AIが応答する→ユーザーが聞く」という順番制の会話形式を変革しようとしている。同社が発表した「インタラクションモデル」は、ユーザーの入力処理と応答生成を同時に行う「フルデュプレックス」技術を採用し、テキストチェーンではなく電話での会話のような自然なやり取りを実現する。
同社のモデル「TML-Interaction-Small」は0.40秒で応答し、これは自然な人間の会話速度にほぼ等しく、OpenAIやGoogleの同等モデルと比較して大幅に高速だと主張している。同社は、インタラクティブ性をモデルに後付けするのではなく、ネイティブ機能として組み込むというアプローチの重要性を強調している。
ただし、これは研究プレビューであり、まだ一般公開されていない。今後数か月以内に「限定的な研究プレビュー」が予定されており、より広範なリリースは今年後半に設定されている。ベンチマーク結果は印象的であるものの、実際のユーザー体験が技術的な主張に見合うかどうかは、実際に使用可能になるまで不明である。