OpenAI explique son architecture WebRTC pour l'IA vocale
Original : How OpenAI delivers low-latency voice AI at scale
Pourquoi c'est important
Innovation technique clé pour démocratiser l'IA vocale temps réel
OpenAI détaille sa solution technique pour fournir des interactions vocales IA à faible latence à 900+ millions d'utilisateurs actifs hebdomadaires via une architecture relay+transceiver WebRTC repensée.
OpenAI a restructuré son infrastructure WebRTC pour servir plus de 900 millions d'utilisateurs actifs hebdomadaires avec des interactions vocales IA en temps réel. L'équipe technique a développé une architecture 'split relay plus transceiver' pour résoudre trois contraintes d'échelle : la terminaison média un-port-par-session inadaptée à leur infrastructure, la nécessité de propriété stable pour les sessions ICE et DTLS, et le routage global maintenant une faible latence. Cette solution préserve le comportement WebRTC standard côté client tout en modifiant le routage des paquets dans l'infrastructure interne. L'architecture utilise le routage sur les identifiants ICE, des relais globaux et une signalisation géo-orientée pour optimiser les performances.