Anthropic, AI 에이전트 간 실제 거래 실험 진행

원제: Anthropic created a test marketplace for agent-on-agent commerce

왜 중요한가

AI 에이전트의 상업적 거래 능력과 성능 격차 문제를 제시하는 중요한 실험 사례

Anthropic이 AI 에이전트가 구매자와 판매자를 대표하여 실제 상품과 돈으로 거래하는 테스트 마켓플레이스 'Project Deal'을 운영했다고 발표했다. 69명의 직원이 참여해 각각 100달러 예산으로 186건의 거래가 성사되어 총 4,000달러 이상의 거래가 이뤄졌다.

Anthropic이 AI 에이전트 간 상거래 실험인 'Project Deal'을 실시했다고 발표했다. 이 실험에서는 AI 에이전트가 구매자와 판매자를 대표하여 실제 상품을 실제 돈으로 거래하는 분류 광고 마켓플레이스를 구축했다. 실험에는 자발적으로 참여한 69명의 Anthropic 직원이 참여했으며, 각자 기프트카드 형태로 100달러의 예산을 받아 동료들로부터 물건을 구매했다. 그 결과 총 186건의 거래가 성사되어 4,000달러 이상의 거래 가치를 기록했다고 회사 측은 밝혔다. Anthropic은 서로 다른 모델을 사용하는 4개의 별도 마켓플레이스를 운영했는데, 하나는 '실제' 마켓플레이스(모든 참가자가 회사의 가장 진보된 모델로 대표되고 실험 후 거래가 실제로 이행됨)였고, 나머지 세 개는 연구용이었다. 흥미롭게도 더 진보된 모델로 대표된 사용자들이 '객관적으로 더 나은 결과'를 얻었지만, 사용자들은 이런 격차를 인지하지 못했다고 한다. 이는 '에이전트 품질 격차' 문제를 제기하는데, 불리한 입장의 사람들이 자신이 손해를 보고 있다는 것을 깨닫지 못할 가능성이 있다고 회사는 지적했다.

출처

techcrunch.com — 원문 읽기 →