OpenAI का स्केल पर लो-लेटेंसी वॉयस AI

मूल शीर्षक: How OpenAI delivers low-latency voice AI at scale

यह क्यों महत्वपूर्ण है

वॉयस AI के व्यापक अपनाने के लिए रियल-टाइम इंटरैक्शन की गुणवत्ता महत्वपूर्ण है।

OpenAI ने 900 मिलियन साप्ताहिक उपयोगकर्ताओं के लिए WebRTC आर्किटेक्चर को दुबारा डिज़ाइन किया। ChatGPT वॉयस और Realtime API में तेज़ कनेक्शन सेटअप और कम राउंड-ट्रिप टाइम प्रदान करने हेतु स्प्लिट रिले प्लस ट्रांसीवर आर्किटेक्चर विकसित किया गया।

OpenAI के इंजीनियरिंग टीम ने रियल-टाइम AI इंटरैक्शन के लिए WebRTC स्टैक को दुबारा डिज़ाइन किया है। कंपनी के 900 मिलियन से अधिक साप्ताहिक उपयोगकर्ताओं के लिए तीन मुख्य आवश्यकताएं हैं: ग्लोबल पहुंच, तेज़ कनेक्शन सेटअप, और कम व स्थिर मीडिया राउंड-ट्रिप टाइम। टीम ने तीन बाधाओं को संबोधित करने के लिए स्प्लिट रिले प्लस ट्रांसीवर आर्किटेक्चर बनाया: वन-पोर्ट-पर-सेशन मीडिया टर्मिनेशन OpenAI इंफ्रास्ट्रक्चर के साथ फिट नहीं बैठता, स्टेटफुल ICE और DTLS सेशन्स को स्थिर स्वामित्व की ज़रूरत है, और ग्लोबल रूटिंग को फर्स्ट-हॉप लेटेंसी कम रखनी होती है। WebRTC एक ओपन स्टैंडर्ड है जो ब्राउज़र, मोबाइल ऐप्स और सर्वरों के बीच लो-लेटेंसी ऑडियो, वीडियो और डेटा भेजने के लिए उपयोग होता है। यह ICE कनेक्टिविटी स्थापना, DTLS एन्क्रिप्शन, कोडेक नेगोशिएशन और RTCP क्वालिटी कंट्रोल जैसे इंटरैक्टिव मीडिया के कठिन हिस्सों को मानकीकृत करता है। OpenAI में अब Justin Uberti (WebRTC के मूल आर्किटेक्ट्स में से एक) और Sean DuBois (Pion के निर्माता) भी काम कर रहे हैं।

स्रोत

openai.com — मूल लेख पढ़ें →