Learning Timeline
Key Insights
Faktor Nasib (Gacha System)
Akses kepada model ini adalah rawak. Anda tidak boleh memilihnya secara manual daripada senarai dropdown; anda perlu terus mencuba di dalam 'Arena' sehingga model tersebut muncul secara automatik.
Pendedahan Identiti Model
Identiti sebenar model (seperti GPT-4, Claude 3 Opus, atau gpt2-chatbot) hanya akan didedahkan selepas anda memberikan undian atau maklum balas terhadap jawapan mereka.
Prestasi Luar Biasa
Ramai pengguna melaporkan bahawa model misteri ini menunjukkan peningkatan prestasi 'incremental' berbanding GPT-4, terutamanya dalam menyelesaikan masalah logik dan pengaturcaraan.
Prompts
Prompt Ujian Keupayaan Coding
Target:
gpt2-chatbot
Create a complex Python function to handle asynchronous API requests with retry logic and error logging.
Step by Step
Cara Mencari dan Menguji Model gpt2-chatbot
- Buka pelayar web dan layari laman web chat.lmsys.org.
- Klik pada tab 'Arena' (biasanya dilabel sebagai 'Arena (Battle)') pada bar navigasi atas.
- Taipkan sebarang prompt, soalan, atau tugasan coding ke dalam kotak input sembang.
- Tekan 'Enter' atau klik butang hantar untuk memulakan sesi.
- Tunggu sistem menjana jawapan daripada dua model misteri secara serentak (Model A dan Model B).
- Pilih dan klik butang undian (seperti 'A is better', 'B is better', atau 'Tie') berdasarkan kualiti jawapan yang diberikan.
- Lihat pada label nama model yang muncul di bahagian atas setiap kotak jawapan selepas undian dibuat.
- Jika nama yang muncul bukan 'gpt2-chatbot' atau 'im-also-a-good-gpt2-chatbot', klik 'New Round' untuk mencuba nasib sekali lagi.