Jaringan saraf Audio Stabil baru menghasilkan musik berdasarkan deskripsi teks
Miscellanea / / September 14, 2023
Dari pencipta Difusi Stabil.
Stabilitas AI, yang dikenal terutama karena jaringan saraf untuk menghasilkan gambar (Difusi Stabil, Coretan Stabil dan tidak hanya), dilepaskan jaringan saraf baru, Audio Stabil. Seperti namanya, ini menghasilkan klip audio.
Semuanya bekerja dengan cara yang sama seperti generator gambar berdasarkan deskripsi teks. Pengguna menentukan kata kunci (misalnya, "melodic lo-fi hip-hop, melodic, 85 BPM" atau “death metal dengan riff gitar yang kuat dan drum yang cepat”), durasi yang diinginkan dan menunggu hasilnya.
Kami menggunakan model yang sama seperti pada Difusi Stabil sebagai dasar, namun melatihnya pada komposisi musik, bukan gambar. Secara total, dia diberi sekitar 800 ribu lagu dari stok situs musik AudioSparx - atau sekitar 19.500 jam suara berbeda.
Pembuatnya mencatat bahwa fitur utama Stable Audio adalah kemampuan untuk menghasilkan komposisi dengan panjang tertentu. Sebelumnya, jaringan saraf hanya bekerja dengan durasi tetap: jika dilatih pada klip audio berdurasi 30 detik, mereka hanya dapat menghasilkan komposisi berdurasi 30 detik. Untuk dapat mengatur durasi suatu lagu, pengembang harus mengubah model dan menambahkan metadata untuk awal dan akhir komposisi.
Audio Stabil ditawarkan dalam tiga model. Versi gratisnya memungkinkan Anda menghasilkan tidak lebih dari 20 lagu yang berdurasi hingga 45 detik per bulan. Ada juga langganan Profesional yang memungkinkan Anda membuat hingga 500 lagu berdurasi hingga 90 detik dengan biaya $12 per bulan (≈1.200 rubel) dan opsi Perusahaan untuk perusahaan dengan kemampuan untuk memilih volume dan harga pembangkitan secara individual Oke. Anda tidak dapat menggunakan musik yang dihasilkan untuk tujuan komersial tanpa berlangganan berbayar.
Seperti jaringan saraf serupa lainnya, Stable Audio lebih ditujukan untuk pembuat konten daripada musisi profesional. Alat tersebut cocok untuk membuat musik latar untuk podcast dan video dengan cepat saat Anda tidak memiliki waktu atau anggaran untuk berkolaborasi dengan komposer. Itu juga dapat menggantikan suara stok jika Anda menginginkan suara tawa atau suara keramaian yang unik.
Anda dapat mencoba Stable Audio di situs resminya. Anda harus mendaftar atau masuk dengan akun Google. Pada awalnya, mungkin ada gangguan akses karena beban berat di server.
Audio Stabil →
Lebih banyak jaringan saraf baru🦾✨
- Asisten virtual AIDA dari Sber akan mendiagnosis pasien di klinik Moskow
- Aplikasi baru Artisse menghasilkan foto keren dengan wajah pengguna
- Stability AI memperkenalkan chatbot Obrolan Stabil - analog gratis dari ChatGPT