OpenAI, 에이전트가 100만 줄 코드 작성한 제품 개발 공개

원제: Harness engineering: Leveraging Codex in an agent-first world

왜 중요한가

AI 에이전트가 실제 프로덕션 소프트웨어 개발을 완전히 대체할 수 있음을 입증한 첫 사례로 소프트웨어 개발 패러다임 변화를 예고한다.

OpenAI가 5개월간 Codex 에이전트만으로 내부 제품을 개발하는 실험을 진행했다고 발표했다. 인간이 직접 작성한 코드 없이 100만 줄의 코드와 1,500개의 풀 리퀘스트를 생성했으며, 엔지니어당 일평균 3.5개의 PR을 처리했다고 밝혔다.

OpenAI의 기술진이 Codex 에이전트만을 활용해 소프트웨어 제품을 개발하는 실험 결과를 공개했다. 2025년 8월부터 5개월간 진행된 이 프로젝트에서는 사람이 직접 작성한 코드 한 줄 없이 완전한 제품을 구축했다. 애플리케이션 로직, 테스트, CI 구성, 문서화, 모니터링, 내부 툴링 등 모든 코드가 GPT-5 기반의 Codex에 의해 작성되었다. 초기 3명의 엔지니어로 시작해 현재 7명으로 확장된 팀은 약 100만 줄의 코드를 생성하고 1,500개의 풀 리퀘스트를 처리했다. 이는 수작업 대비 약 1/10의 시간이 소요된 것으로 추산된다. 제품은 내부 수백 명의 사용자가 매일 사용하고 있으며, 외부 알파 테스터도 참여하고 있다. OpenAI는 이 실험을 통해 엔지니어의 역할이 코드 작성에서 환경 설계와 의도 명세화, 피드백 루프 구축으로 전환되고 있다고 설명했다.

출처

openai.com — 원문 읽기 →