Learning Timeline
Key Insights
Kelebihan Gemini Berbanding TTS Biasa
Model ini bukan sekadar membaca teks secara robotik; ia mampu menghasilkan 'micro pauses', bunyi nafas, dan intonasi yang kedengaran seperti rakaman manusia sebenar di studio.
Tips Gaya Percakapan Natural
Apabila menggunakan 'Multi-speaker mode', pastikan anda memberikan Style Prompt yang spesifik seperti 'energetic' atau 'professional' untuk memastikan dinamika antara dua suara tersebut tidak kedengaran hambar.
Prompts
Style Prompt Penjanaan Audio
Target:
Google AI Studio Audio Model
Casual, conversational, like a tech podcast host talking to a guest.
Skrip Contoh FAQ (Multi-speaker)
Target:
Google AI Studio Audio Model
Speaker 1: So, a lot of people are asking, does this tool actually understand context, or is it just reading keywords?
Speaker 2: That's the big question, right? It's not just looking for keywords anymore.
Step by Step
Akses Google AI Studio & Model Gemini 1.5 Pro
- Buka pelayar web dan layari laman portal Google AI Studio.
- Log masuk menggunakan akaun Google anda.
- Klik pada tab 'Home' yang terletak di bar sisi (sidebar) sebelah kiri skrin.
- Cari dan klik pada pilihan untuk mengakses model 'text-to-speech' atau audio generation Gemini.
- Pastikan 'Gemini 1.5 Pro' dipilih sebagai model utama pada bahagian dropdown model untuk kualiti penjanaan terbaik.
Menjana Audio Multivokal (Podcast Mode)
- Tukar tetapan mod daripada 'Single Speaker' kepada 'Multi-speaker mode' menggunakan switch toggle yang disediakan.
- Masukkan skrip dialog anda ke dalam kotak teks utama.
- Pilih 'Voice 1' (Male) dan 'Voice 2' (Female) daripada menu dropdown suara yang tersedia.
- Masukkan 'Style Prompt' untuk memberikan arahan emosi atau nada suara (contoh: casual, conversational).
- Klik butang 'Run' untuk memulakan proses penjanaan audio.
- Klik butang 'Play' pada pemain audio yang muncul untuk mendengar hasil akhir.
- Klik ikon tiga titik atau butang 'Download' untuk menyimpan fail audio tersebut.