Google Rilis Gemma 4 12B, Model AI Multimodal untuk Laptop

AKURAT.CO Google DeepMind meluncurkan Gemma 4 12B, model kecerdasan buatan (AI) open-weight terbaru untuk penggunaan lokal. Model ini mampu menjalankan berbagai tugas AI di laptop dengan kebutuhan memori yang lebih efisien.

Gemma 4 12B hadir sebagai varian menengah dalam keluarga Gemma 4. Posisinya berada di antara model E4B yang lebih ringan dan model 26B Mixture-of-Experts (MoE) yang lebih besar.

Salah satu pembaruan utama yang dibawa Gemma 4 12B adalah dukungan input audio bawaan. Fitur tersebut menjadi yang pertama tersedia pada model Gemma ukuran menengah.

Google mengungkapkan bahwa keluarga Gemma kini telah mencatat lebih dari 150 juta unduhan. Model-model dalam keluarga ini telah digunakan untuk berbagai kebutuhan, mulai dari robotika hingga sistem keamanan berbasis AI.

Dari sisi arsitektur, Gemma 4 12B mengusung desain multimodal terpadu. Pendekatan ini memungkinkan pemrosesan teks, gambar dan audio tanpa encoder terpisah.

Untuk pemrosesan visual, Google mengganti encoder tradisional dengan modul embedding yang lebih ringan. Upaya ini membantu mengurangi penggunaan memori sekaligus meningkatkan efisiensi pemrosesan.

Sementara itu, data audio dapat diproses langsung ke ruang token yang sama dengan teks. Cara kerja tersebut menghilangkan kebutuhan akan encoder audio khusus.

Dikutip dari laman resminya, Jumat (5/6/2026), Google mengklaim performa Gemma 4 12B mendekati model 26B MoE yang lebih besar. Meski demikian, kebutuhan memorinya disebut kurang dari setengah model tersebut.

Kemampuan ini dapat membuat agen AI dan proses penalaran bertahap berjalan di perangkat dengan RAM atau VRAM 16 GB. Pengguna dapat menjalankan berbagai tugas AI tanpa harus bergantung pada server cloud.

Gemma 4 12B dirilis menggunakan lisensi Apache 2.0 yang bersifat terbuka. Model ini juga dibekali teknologi Multi-Token Prediction (MTP) untuk mempercepat proses inferensi.

Teknologi tersebut membantu mengurangi latensi saat model menghasilkan respons. Hasilnya, interaksi dengan AI dapat berlangsung lebih cepat dan responsif.

Model ini mendukung berbagai kemampuan agen AI, termasuk pemrosesan data otomatis dan pembuatan halaman web. Selain itu, Gemma 4 12B juga dapat melakukan analisis visual dan penggunaan alat digital secara mandiri.

Google turut memperkenalkan Gemma Skills Repository sebagai pelengkap ekosistemnya. Repositori ini menyediakan berbagai kemampuan siap pakai yang dapat digunakan pengembang untuk membangun sistem agen AI.

Dalam bidang pemrograman, Gemma 4 12B mampu menghasilkan kode Python dari instruksi bahasa alami. Model ini juga dapat menjalankan analisis data, membuat grafik dan menyusun halaman web secara otomatis.

Gemma 4 12B kini tersedia melalui berbagai platform seperti LM Studio, Ollama, Hugging Face, Kaggle dan Google Cloud. Google mengoptimalkan model ini untuk laptop dengan memori 16 GB serta mendukung pemrosesan AI multimodal secara offline.