Ekstrak data invois PDF ke Google Sheets dengan Gemini API dan n8n | Alpha | PandaiTech

Ekstrak data invois PDF ke Google Sheets dengan Gemini API dan n8n

Cara automasi pengeluaran data berstruktur (seperti jumlah, tarikh, sender) daripada fail PDF invois dalam Google Drive menggunakan Gemini API dan simpan terus ke Google Sheets.

Learning Timeline
Key Insights

Kenapa Guna Gemini API Berbanding Node Standard?

Node 'Analyze Document' yang standard dalam n8n mempunyai pilihan yang terhad. Dengan menggunakan Gemini API terus, anda mendapat akses kepada 'hidden settings' dan kawalan prompt yang lebih granular untuk output data yang lebih tepat.

Kelebihan Multimodal AI

Gemini sangat berkesan untuk tugasan ini kerana ia bersifat multimodal—ia boleh 'melihat' susun atur visual invois. Walaupun format invois berubah-ubah (layout berbeza), AI tetap dapat mencari posisi 'Total Amount' tanpa perlu kita set koordinat spesifik seperti software extraction tradisional.
Prompts

Ekstraksi Data Invois Berstruktur

Target: Gemini API
Extract the following fields from the attached invoice PDF: invoice_sender, sender_address, invoice_number, invoice_date, total_amount, and currency. Requirements: - Return the data in a clean JSON format. - Ensure the date is in YYYY-MM-DD format. - If a field is missing, return 'N/A'. - Identify the currency symbol and convert it to the 3-letter ISO code (e.g., EUR, USD).
Step by Step

Cara Setup Aliran Kerja Automasi Invois n8n

  1. Cipta Google Drive folder khusus untuk menyimpan fail PDF invois.
  2. Sediakan fail Google Sheets dengan kolum tajuk: Invoice Sender, Address, Invoice Number, Date, Total Amount, dan Currency.
  3. Dalam n8n, tambah node 'Google Drive' dan set 'Watch for New Files' untuk trigger apabila PDF baru dimuat naik.
  4. Gunakan node 'Google Drive' kedua dengan action 'Download File' untuk menarik data binary PDF tersebut.
  5. Tambah node 'Google Gemini' dan pilih model yang menyokong pemprosesan dokumen (seperti Gemini 1.5 Pro/Flash).
  6. Sambungkan 'Gemini API' menggunakan API Key yang sah dari Google AI Studio.
  7. Dalam konfigurasi node Gemini, muat naik fail PDF sebagai input context.
  8. Tulis prompt berstruktur untuk mengarahkan Gemini mengekstrak data dalam format JSON (rujuk Prompt Card).
  9. Tambah node 'Edit Fields' (Set) untuk memetakan (mapping) output JSON daripada Gemini ke format data yang sesuai.
  10. Tambah node 'Google Sheets' dengan action 'Append Row' untuk memasukkan data yang telah diekstrak ke dalam baris baru.

More from Bina & Deploy Ejen AI

View All