OpenAI ने API में नई वॉयस इंटेलिजेंस सुविधाएं लॉन्च कीं
मूल शीर्षक: OpenAI launches new voice intelligence features in its API
यह क्यों महत्वपूर्ण है
एंटरप्राइज़ और डेवलपर्स के लिए वॉयस AI एप्लीकेशन विकास में नए अवसर खुलेंगे।
OpenAI ने गुरुवार को अपनी API में नई वॉयस इंटेलिजेंस सुविधाएं घोषित कीं जो डेवलपर्स को बातचीत, ट्रांसक्रिप्शन और अनुवाद ऐप बनाने में मदद करेंगी। इनमें GPT-Realtime-2, GPT-Realtime-Translate (70+ इनपुट भाषाओं के साथ) और GPT-Realtime-Whisper शामिल हैं।
OpenAI की नई API सुविधाओं में तीन मुख्य टूल्स शामिल हैं। GPT-Realtime-2 एक उन्नत वॉयस मॉडल है जो GPT-5-क्लास रीज़निंग के साथ बनाया गया है और जटिल उपयोगकर्ता अनुरोधों को संभाल सकता है। GPT-Realtime-Translate रियल-टाइम अनुवाद सेवा प्रदान करता है जो 70 से अधिक इनपुट भाषाओं को समझता है और 13 आउटपुट भाषाओं में अनुवाद कर सकता है। GPT-Realtime-Whisper लाइव स्पीच-टू-टेक्स्ट क्षमताएं प्रदान करता है। कंपनी के अनुसार ये मॉडल्स "सुनना, तर्क करना, अनुवाद करना, ट्रांसक्राइब करना और बातचीत के दौरान कार्य करना" संभव बनाते हैं। मुख्य लक्ष्य कस्टमर सेवा, शिक्षा, मीडिया और इवेंट कंपनियां हैं। दुरुपयोग रोकने के लिए कंपनी ने सुरक्षा गार्डरेल्स भी लगाए हैं जो हानिकारक सामग्री का पता लगने पर बातचीत रोक देते हैं।