Learning Timeline
Key Insights
Eksplorasi Data vs Skema Tegas
Jika anda tidak pasti struktur dokumen, anda boleh menggunakan dictionary object kosong untuk membiarkan LLM menentukan 'key-value pairs' yang penting secara autonomi.
Kelebihan Dot Notation
Menggunakan Pydantic membolehkan anda mengakses hasil AI seperti objek kod biasa (dot notation), yang jauh lebih bersih dan kurang ralat berbanding parsing JSON secara manual.
Debugging dengan Inspect History
Sentiasa gunakan 'inspect_history' untuk melihat bagaimana prompt dibina secara automatik. Ini membantu anda memahami bagaimana field input dan output dipetakan sebelum sampai ke LLM.
Step by Step
Mendefinisikan Skema Pydantic untuk Ekstraksi Data Dokumen
- Takrifkan kelas Pydantic (typical Pydantic classes) untuk menentukan struktur data yang ingin diekstrak (contoh: filing date, form type, transactions).
- Bina 'Signature' penganalisis dokumen dengan menetapkan 'Input Field' yang akan menerima dokumen (teks dan imej via attachments).
- Masukkan parameter 'document_schema' ke dalam Signature tersebut menggunakan kelas Pydantic yang telah dicipta untuk memaksa format output yang spesifik.
- Gunakan 'Chain of Thought' (CoT) bersama Signature tersebut untuk memproses dokumen secara mendalam.
- Akses data hasil ekstraksi menggunakan 'dot notation' (cth: response.document_schema.filing_date) untuk integrasi terus ke dalam kod anda.
- Gunakan fungsi 'inspect_history' untuk melihat 'raw dump' mesej sistem dan bagaimana AI memproses input tersebut di sebalik tabir.