Microsoft Rilis VibeVoice AI Suara Open-Source
Judul asli: Microsoft VibeVoice: Open-Source Frontier Voice AI
Mengapa Ini Penting
Mendemokratisasi teknologi AI suara tingkat enterprise untuk komunitas developer
Microsoft merilis VibeVoice, AI suara open-source yang mendukung transkripsi audio 60 menit dalam satu kali proses. Model ASR mendukung lebih dari 50 bahasa dengan identifikasi pembicara dan timestamp.
Microsoft meluncurkan VibeVoice sebagai platform AI suara open-source di GitHub dengan 44.4k bintang. Fitur utama VibeVoice-ASR dapat memproses audio panjang hingga 60 menit dalam sekali jalan, menghasilkan transkripsi terstruktur yang mencakup identifikasi pembicara, timestamp, dan konten. Model ini mendukung lebih dari 50 bahasa secara native dan terintegrasi dengan Hugging Face Transformers library. Microsoft juga menyediakan playground untuk pengujian dan mendukung konteks yang dapat dikustomisasi pengguna.