Learning Timeline
Key Insights
Had Kualiti Lirik Muzik
Buat masa ini, kualiti lirik yang dijana oleh UniAudio 2.0 mungkin kedengaran seperti bahasa merepek (gibberish) dan tidak berapa jelas, walaupun muziknya kedengaran baik.
Kelebihan Model Bersepadu
UniAudio 2.0 adalah 'unified audio language model', bermakna anda boleh melakukan pelbagai tugas seperti TTS, SFX, dan suntingan suara hanya menggunakan satu model yang sama tanpa perlu menukar tool.
Prompts
Prompt Menjana Kesan Bunyi (SFX)
Target:
UniAudio 2.0
large crowd cheers and applauds
Prompt Menjana Muzik Mengikut Genre
Target:
UniAudio 2.0
energetic Punjabi folk song
Prompt Menjana Lagu Arab
Target:
UniAudio 2.0
Arabic dance song
Step by Step
Cara Memasang dan Menjalankan UniAudio 2.0 Secara Lokal
- Layari laman GitHub UniAudio 2.0 melalui pautan yang disediakan dalam deskripsi.
- Tatal (scroll) ke bawah sehingga anda menjumpai bahagian 'Instructions'.
- Ikuti langkah-langkah muat turun (download) fail model yang diperlukan ke dalam komputer anda.
- Pasang dependencies yang dinyatakan dalam fail dokumentasi GitHub.
- Jalankan (run) skrip utama mengikut arahan terminal yang diberikan untuk memulakan model audio.
Menjana Kesan Bunyi (SFX) dan Muzik
- Pilih mod 'Text-to-Audio' atau 'Text-to-Music' pada antara muka program.
- Masukkan deskripsi bunyi yang anda inginkan ke dalam kotak input prompt (contoh: 'large crowd cheers').
- Jika ingin menjana lagu dengan lirik, masukkan lirik teks yang spesifik ke dalam ruangan input yang disediakan.
- Tekan butang 'Generate' untuk memulakan proses sintesis audio.
- Mainkan (play) hasil audio dan klik 'Download' atau 'Save' untuk menyimpan fail tersebut ke komputer.
Menyunting Gaya Suara (Speech Style Editing)
- Sediakan fail audio rujukan (reference dialogue) yang ingin anda ubah gayanya.
- Muat naik (upload) fail audio rujukan tersebut ke dalam sistem UniAudio.
- Taipkan gaya suara sasaran yang anda inginkan (contoh: 'whisper style') pada ruangan prompt.
- Klik butang 'Edit' atau 'Convert' untuk memproses suara rujukan ke dalam gaya baru.
- Tunggu sehingga proses selesai dan dengar hasil suntingan suara tersebut.