OpenAI explique son architecture WebRTC pour l'IA vocale

Original : How OpenAI delivers low-latency voice AI at scale

Pourquoi c'est important

Innovation technique clé pour démocratiser l'IA vocale temps réel

OpenAI détaille sa solution technique pour fournir des interactions vocales IA à faible latence à 900+ millions d'utilisateurs actifs hebdomadaires via une architecture relay+transceiver WebRTC repensée.

OpenAI a restructuré son infrastructure WebRTC pour servir plus de 900 millions d'utilisateurs actifs hebdomadaires avec des interactions vocales IA en temps réel. L'équipe technique a développé une architecture 'split relay plus transceiver' pour résoudre trois contraintes d'échelle : la terminaison média un-port-par-session inadaptée à leur infrastructure, la nécessité de propriété stable pour les sessions ICE et DTLS, et le routage global maintenant une faible latence. Cette solution préserve le comportement WebRTC standard côté client tout en modifiant le routage des paquets dans l'infrastructure interne. L'architecture utilise le routage sur les identifiants ICE, des relais globaux et une signalisation géo-orientée pour optimiser les performances.

Source

openai.com — Lire l'original →