Analisis Perbandingan Kemampuan Pemahaman Instruksi Kompleks pada Model Gemini Thinking dan Copilot Think Deeper Menggunakan Metode Benchmark Testing
DOI:
https://doi.org/10.62017/merdeka.v3i5.7699Keywords:
Benchmark Testing, Copilot Think Deeper, Gemini Thinking, Instruksi Kompleks, Model Bahasa BesarAbstract
Penelitian ini menganalisis perbandingan kemampuan pemahaman instruksi kompleks antara model Gemini Thinking dan Copilot Think Deeper menggunakan metode Benchmark Testing. Pengujian dilakukan melalui lima dimensi evaluasi pemahaman konseptual, penalaran logis dan teknis, konsistensi konteks, efisiensi performa, dan adaptasi personalisasi. Hasil penelitian menunjukkan bahwa Gemini Thinking secara konsisten memberikan respons yang lebih mendalam dan teknis dengan penanganan instruksi kompleks yang lebih komprehensif, sementara Copilot Think Deeper menunjukkan keunggulan dalam kecepatan respons namun dengan konten yang lebih umum. Analisis data mengindikasikan trade-off signifikan antara kualitas dan kecepatan Gemini Thinking lebih optimal untuk tugas-tugas yang memerlukan presisi tinggi, riset, dan pengembangan teknis, sedangkan Copilot Think Deeper lebih efisien untuk interaksi cepat dan administratif. Penelitian ini memberikan rekomendasi praktis bagi pengguna dan pengembang dalam memilih model AI yang sesuai dengan karakteristik tugas.










