OpenAI lance de nouvelles fonctionnalités vocales dans son API

Original : OpenAI launches new voice intelligence features in its API

Pourquoi c'est important

Évolution majeure des API vocales d'IA vers des interfaces conversationnelles complexes

OpenAI a annoncé jeudi le lancement de nouvelles fonctionnalités d'intelligence vocale dans son API, incluant GPT-Realtime-2 avec raisonnement GPT-5, GPT-Realtime-Translate supportant plus de 70 langues d'entrée et 13 de sortie, et GPT-Realtime-Whisper pour la transcription en temps réel.

OpenAI déploie trois nouveaux outils vocaux dans son API Realtime. GPT-Realtime-2 intègre un raisonnement de classe GPT-5 pour gérer des requêtes complexes, remplaçant GPT-Realtime-1.5. GPT-Realtime-Translate offre une traduction conversationnelle en temps réel avec plus de 70 langues d'entrée et 13 de sortie. GPT-Realtime-Whisper fournit une transcription vocale instantanée. Ces modèles visent à transformer les interfaces vocales simples en outils capables d'écouter, raisonner, traduire et agir durant les conversations. Les applications ciblent le service client, l'éducation, les médias et événements. OpenAI a intégré des garde-fous pour prévenir les abus, avec des déclencheurs arrêtant les conversations violant les directives de contenu.

Source

techcrunch.com — Lire l'original →