Voice Engine Butuh Waktu 15 Detik untuk Hasilkan Suara AI Realistis

CUPERTINO – OpenAI baru saja mengumumkan akses terbatas ke platform generasi text-to-speech yang dikembangkannya yang disebut Voice Engine. Platform ini dapat menghasilkan suara sintetis yang realistis hanya dengan sampel suara seseorang berdurasi 15 detik.

Suara AI yang dihasilkan dapat membacakan teks dalam bahasa yang sama dengan pembicara atau bahkan beberapa bahasa lainnya. OpenAI menekankan bahwa platform ini bertujuan untuk “berguna di banyak industri berbeda”.

Seperti diberitakan The Verge, Minggu (31 Maret 2024), beberapa perusahaan yang telah mendapatkan akses Voice Engine antara lain:

Age of Learning: sebuah perusahaan teknologi pendidikan yang menggunakan Voice Engine untuk menghasilkan konten lisan dan tanggapan real-time yang dipersonalisasi untuk pelajar.

HeyGen: platform bercerita visual yang memanfaatkan Mesin Suara untuk menyampaikan cerita yang lebih menarik.

Dimagi: Pengembang perangkat lunak kesehatan garis depan yang menggunakan Voice Engine untuk meningkatkan akses masyarakat terhadap informasi kesehatan.

Livox: pembuat aplikasi perpesanan AI yang mengintegrasikan Mesin Suara untuk memberikan pengalaman komunikasi yang lebih alami.

Umur: Sistem kesehatan yang menggunakan mesin suara untuk meningkatkan akses pasien terhadap informasi kesehatan.

Sampel audio yang dibagikan oleh OpenAI menunjukkan kemampuan Mesin Suara dalam menghasilkan suara yang realistis dan alami.

Age of Learning menggunakan Voice Engine untuk menghasilkan konten lisan yang terdengar seperti guru sungguhan, sementara Livox menggunakannya untuk menghasilkan asisten virtual yang terdengar seperti manusia.

Meski akses terhadap Voice Engine masih terbatas, OpenAI berencana memperluas akses di masa mendatang. Hal ini menunjukkan potensi besar teknologi ini untuk mengubah cara kita berkomunikasi dan berinteraksi dengan dunia sekitar kita.

Leave a Reply

Your email address will not be published. Required fields are marked *