Automasi pipeline pengurusan fail pintar ikut jenis dokumen | Alpha | PandaiTech

Automasi pipeline pengurusan fail pintar ikut jenis dokumen

Membina sistem 'router' yang mengesan jenis fail (SEC filing, kontrak, atau imej infrastruktur) dan menghantarnya ke proses yang betul secara automatik.

Learning Timeline
Key Insights

Pemilihan Model Berdasarkan Task

Gunakan model besar (seperti Gemini) untuk task visual yang kompleks, tetapi gunakan model yang lebih kecil dan murah untuk task pengekstrakan data berstruktur seperti Form 4 extraction bagi menjimatkan kos operasional.

Teknik Routing Pintar

Jangan proses semua fail dengan cara yang sama. Dengan mengklasifikasikan fail di peringkat awal (router), anda boleh menggunakan prompt dan model yang berbeza untuk setiap jenis dokumen, yang menjadikan pipeline lebih efisien dan tepat.
Prompts

Document Classification Logic

Target: DSPy Signature / LLM
Given these images (the first few pages of a document), identify the type. Options: [SEC filing, Contract, City Infrastructure Image]. Return only the document type.
Step by Step

Membina Pipeline Klasifikasi Fail Automatik dengan DSPy

  1. Import library DSPy dan library attachments untuk mengendalikan input pelbagai jenis media secara seragam.
  2. Sediakan konfigurasi API key untuk dua jenis model: Model standard (LLM) untuk teks dan Visual Model (seperti Gemini) untuk pengecaman imej.
  3. Gunakan fungsi 'classify_file' untuk menghantar dokumen (PDF atau Imej) ke program DSPy.
  4. Ekstrak tiga muka surat pertama atau beberapa imej pertama daripada dokumen asal sebagai input field.
  5. Tentukan 'Document Type' sebagai signature output untuk menentukan sama ada fail tersebut adalah SEC filing, kontrak, atau imej infrastruktur.
  6. Gunakan logik 'if-else' atau 'switch' berdasarkan hasil klasifikasi untuk menentukan laluan (routing) proses seterusnya.
  7. Untuk fail SEC Filing: Jalankan fungsi 'form4 extraction' menggunakan model yang lebih kecil untuk menjimatkan kos.
  8. Untuk fail Kontrak: Panggil fungsi 'recursive summarization' untuk merumus keseluruhan dokumen dan kesan sempadan (boundaries) dokumen.
  9. Untuk imej Infrastruktur: Hantar fail ke Visual Model untuk melakukan tafsiran visual (visual interpretation) yang lebih mendalam.