Transkrip fail audio secara automatik dengan Gemini dan n8n
Tekan play pada video. Ia akan terus lompat ke bahagian yang menjawab tajuk di
atas — tak perlu tonton video penuh.
Panduan setup automasi untuk menukar fail rakaman suara dalam Google Drive kepada teks transkrip lengkap menggunakan kemampuan multimodal Gemini.
Kelebihan Multimodal Gemini
Berbeza dengan model tradisional yang memerlukan langkah penukaran Audio-to-Text yang berasingan (seperti Whisper), Gemini boleh memproses fail audio secara terus sebagai input multimodal, menjadikannya lebih pantas dan mudah diurus dalam satu node sahaja.
Tips Folder Organisasi
Pastikan fail audio dan transkrip disimpan dalam folder yang sama atau folder khusus untuk mengelakkan kekeliruan apabila menguruskan beratus-ratus fail rakaman.
More from Bina & Deploy Ejen AI
View All
Import JSON Workflow ke dalam n8n untuk Backend AI App
n8n
Analisa pasaran bisnes tempatan dengan n8n Google Maps Scraper
n8n
Google Maps
Sambung n8n ke Server Jauh Guna SSH Node
n8n
Simpan History Chat dalam n8n guna Session ID Claude Code
Claude
n8n
Kustomisasi branding ejen dan pilih model AI di Chatbase
Chatbase
ChatGPT
Bina workflow automasi AI dengan Google Opal
Google Opal
Gemini