Thinking Machines, 대화 중 실시간 청취하는 AI 개발

원제: Thinking Machines wants to build an AI that actually listens while it talks

왜 중요한가

AI 대화의 패러다임을 바꿀 수 있는 실시간 인터랙션 기술로 음성 AI 시장의 새로운 기준점이 될 가능성

전 OpenAI CTO Mira Murati가 창립한 AI 스타트업 Thinking Machines Lab이 대화 중 동시에 듣고 응답하는 '인터랙션 모델' 기술을 발표했다. 0.4초 응답속도로 자연스러운 대화가 가능하며, 올해 말 출시 예정이다.

Thinking Machines Lab은 기존 AI의 순차적 대화 방식(사용자 발화→AI 청취→AI 응답→사용자 청취)을 벗어나 실시간으로 입력을 처리하면서 동시에 응답을 생성하는 '풀 듀플렉스' 기술을 개발했다고 발표했다. 이 회사의 TML-Interaction-Small 모델은 0.4초의 응답 속도를 달성해 자연스러운 인간 대화 수준에 근접했으며, OpenAI와 Google의 유사 모델보다 현저히 빠르다고 주장했다. 현재는 연구 프리뷰 단계로 일반 공개는 되지 않았으며, 향후 몇 달 내 제한적 연구 프리뷰를 거쳐 올해 말 광범위한 출시를 계획하고 있다. 회사는 상호작용성이 모델에 기본적으로 내장되어야 한다는 기본 아이디어를 제시했으나, 실제 사용자 경험이 기술적 성과와 일치하는지는 실제 사용 후에야 확인 가능할 것으로 보인다.

출처

techcrunch.com — 원문 읽기 →