Microsoft lance VibeVoice : IA vocale open source

Original : Microsoft VibeVoice: Open-Source Frontier Voice AI

Pourquoi c'est important

Démocratise l'accès aux technologies vocales avancées via l'open source

Microsoft publie VibeVoice sur GitHub, une IA vocale open source incluant VibeVoice-ASR pour la reconnaissance vocale longue durée jusqu'à 60 minutes. Le modèle multilingue supporte 50+ langues avec transcription structurée.

Microsoft a publié VibeVoice, une solution d'IA vocale open source sur GitHub avec 44,4k étoiles. Le projet comprend VibeVoice-ASR, un modèle de reconnaissance vocale unifié capable de traiter des audios de 60 minutes en une seule passe. Il génère des transcriptions structurées incluant l'identification du locuteur, les timestamps et le contenu, avec support de contexte personnalisé. Le modèle est nativement multilingue avec support de plus de 50 langues. VibeVoice-ASR est désormais intégré à Hugging Face Transformers depuis mars 2026, permettant une intégration simplifiée dans les projets. Un playground est disponible pour tester les fonctionnalités.

Source

github.com — Lire l'original →