Microsoft Rilis VibeVoice AI Suara Open-Source

Judul asli: Microsoft VibeVoice: Open-Source Frontier Voice AI

Mengapa Ini Penting

Mendemokratisasi teknologi AI suara tingkat enterprise untuk komunitas developer

Microsoft merilis VibeVoice, AI suara open-source yang mendukung transkripsi audio 60 menit dalam satu kali proses. Model ASR mendukung lebih dari 50 bahasa dengan identifikasi pembicara dan timestamp.

Microsoft meluncurkan VibeVoice sebagai platform AI suara open-source di GitHub dengan 44.4k bintang. Fitur utama VibeVoice-ASR dapat memproses audio panjang hingga 60 menit dalam sekali jalan, menghasilkan transkripsi terstruktur yang mencakup identifikasi pembicara, timestamp, dan konten. Model ini mendukung lebih dari 50 bahasa secara native dan terintegrasi dengan Hugging Face Transformers library. Microsoft juga menyediakan playground untuk pengujian dan mendukung konteks yang dapat dikustomisasi pengguna.

Sumber

github.com — Baca artikel asli →