Kesulitan dalam membuat deskripsi permainan Upin Ipin Universe APK menggunakan Gemini API

Halo komunitas Google AI Developer,

Saya sedang mengembangkan sebuah proyek yang berkaitan dengan pembuatan deskripsi permainan berdasarkan tema “Upin Ipin Universe” menggunakan Gemini API. Ide saya adalah memanfaatkan kemampuan multimodal dari Gemini untuk menghasilkan deskripsi permainan yang menarik, menggabungkan teks, gambar, dan bahkan mungkin suara dari dunia Upin & Ipin. Namun, saya menghadapi beberapa masalah berikut:

Hasil yang tidak konsisten: Saat menggunakan Gemini API (khususnya Gemini 1.5 Pro), deskripsi permainan yang dihasilkan sering kali tidak konsisten dalam nada dan gaya. Misalnya, beberapa deskripsi bersifat lucu dan cocok untuk anak-anak, tetapi beberapa lainnya terlalu serius atau tidak sesuai dengan semangat dari Upin & Ipin.

Pemrosesan gambar: Saya telah mencoba mengunggah gambar dari serial animasi Upin & Ipin (misalnya: gambar Upin, Ipin atau karakter lainnya) untuk meminta API membuat deskripsi berdasarkan gambar-gambar tersebut. Namun, API tampaknya tidak sepenuhnya memahami konteks budaya atau latar belakang karakter-karakter ini, sehingga menghasilkan deskripsi yang terlalu umum atau tidak akurat. Bagaimana cara meningkatkan kemampuan API dalam mengenali konteks budaya?

Optimasi prompt: Saya telah mencoba prompt seperti:

  • “Buat deskripsi game petualangan berdasarkan Upin Ipin Universe, cocok untuk anak-anak, gunakan gambar yang disediakan.”
  • “Tulis skenario pendek untuk game berdasarkan Upin & Ipin, gabungkan elemen budaya Malaysia.”

Namun, hasilnya masih belum memuaskan. Apakah ada yang punya pengalaman dalam mengoptimalkan prompt untuk proyek yang berhubungan dengan konten budaya tertentu? Apakah sebaiknya menggunakan teknik few-shot prompting atau memberikan lebih banyak contoh?

Keterbatasan bahasa: Karena Upin & Ipin adalah konten yang populer di Malaysia dan menggunakan bahasa Melayu, saya menemukan bahwa API terkadang menghasilkan hasil dalam bahasa Inggris atau tidak memahami istilah-istilah lokal dengan baik. Apakah ada cara untuk meningkatkan pemrosesan bahasa daerah pada Gemini API?

Saya telah merujuk ke Panduan Pemecahan Masalah Gemini API dan mencoba menyesuaikan parameter seperti temperature dan top-p, namun hasilnya masih belum sesuai harapan. Saya juga telah mengaktifkan Grounding dengan Google Search untuk meningkatkan akurasi, tetapi tampaknya tidak terlalu efektif untuk konten lokal seperti Upin & Ipin.

Saya sangat berharap mendapatkan saran dari komunitas! Jika ada yang pernah bekerja pada proyek serupa atau memiliki pengalaman dengan konten multimodal, silakan bagikan cara Anda mendesain prompt atau mengatur konfigurasi API. Saya juga ingin tahu apakah sebaiknya mencoba model lain seperti Gemini 2.5 Pro atau menambahkan data pelatihan kustom.

Terima kasih semuanya!

Hi @Yaro_Lisitsyn .Welcome to the community.
Please try using gemini 2.5 Pro as it is the more advanced model. For advanced prompt engineering techniques check this out Prompt Engineering | Kaggle.
You can try using few shot examples and explain the malay culture in detail in the prompts. Let me know once you tried it .