Saya tetap terjaga untuk mengikuti ceramah I/O, dan ketika Google memperkenalkan Gemini 3.5 Flash, saya harus mengulangnya.
Tingkat Flash selalu menjadi yang terbaik “cukup bagus, murah, cepat” dalam jajaran produk. Kali ini Google mengklaim bahwa ia mengalahkan tingkat Pro sebelumnya - bukan pada metrik yang dipilih sendiri, tetapi di sebagian besar tolok ukur pengkodean dan agen.
Pengumuman seperti itu biasanya terjadi karena salah satu dari dua hal. Entah vendor memilih grafik yang sesuai dengan keinginan mereka, atau ada sesuatu yang benar-benar berubah. Jadi, setelah kami menambahkan Gemini 3.5 Flash ke GlobalGPT, saya menghabiskan waktu sekitar dua minggu untuk mendorongnya melalui pekerjaan nyata - penelitian, slide deck, tugas multi-langkah gaya agen, jenis hal yang biasanya saya bagi di tiga langganan yang berbeda. Inilah yang saya temukan, dan bagaimana perbandingannya secara langsung dengan GPT-5.5 dan Claude Opus 4.7.
TL; DR
Versi cepat, untuk orang-orang yang membaca sekilas:
- Jika pekerjaan Anda adalah digerakkan oleh agen - penelitian multi-langkah, mengambil dari berbagai sumber, membaca bagan dan PDF - beralih ke 3.5 Flash. Ini adalah yang terbaik di kelasnya saat ini.
- Jika Anda menulis salinan bentuk panjang atau menganalisis basis kode yang sebenarnya, tetap dengan Claude Opus 4.7.
- Jika Anda membutuhkan penalaran tingkat perbatasan (Teka-teki gaya ARC-AGI, masalah penelitian baru), tunggu Gemini 3.5 Pro bulan depan.
- Jika Anda membutuhkan model sehari-hari yang cepat, pilih Gemini 3.5 Flash sekarang. Kamera ini menghasilkan sekitar 4× kecepatan output GPT-5.5 dan Claude Opus 4.7.
Ingin mencobanya? Gemini 3.5 Flash sudah tersedia di GlobalGPT. Akun baru mendapatkan 3 kali percobaan gratis - tidak perlu kartu kredit. Hal yang membuat platform ini berguna untuk perbandingan seperti ini adalah GPT-5.5, Claude Opus 4.7, dan ~100 model lainnya ada di sana dalam jendela obrolan yang sama. Satu langganan, satu antarmuka, tidak perlu repot.

Apa yang dimaksud dengan Gemini 3.5 Flash?
Gemini 3.5 Flash adalah model pertama dalam keluarga Gemini 3.5 yang baru, diluncurkan di Google I/O pada tanggal 19 Mei 2026. Gemini 3.5 Pro ada di peta jalan untuk bulan depan, meskipun Google tidak menjelaskan tanggal pastinya.

Secara historis, “Flash” dalam bahasa Gemini berarti: lebih cepat, lebih murah, dan lebih cerdas. Rilis ini mematahkan pola tersebut. Pembingkaian Google adalah “Kecerdasan tingkat pro pada kecepatan Flash,” yang merupakan klaim yang berani dari vendor mana pun. Sebagian besar data mendukungnya.
Memperkenalkan Keluarga Gemini 3.5
The Keluarga Gemini 3.5 merupakan lompatan besar Google berikutnya dalam kecerdasan buatan, model rekayasa yang menggabungkan kecerdasan tingkat tinggi dengan eksekusi secepat kilat. Dibangun secara khusus untuk mendukung alur kerja agen yang kompleks dan multi-langkah serta rekayasa perangkat lunak tingkat lanjut, keluarga Gemini 3.5 dirancang untuk bertindak, bukan hanya merespons.

Model & Fitur Utama
- Gemini 3.5 Flash: Model kecepatan dan efisiensi unggulan. Model ini memberikan kinerja tercanggih dalam pembuatan kode, penalaran, dan pemrosesan konteks panjang (mendukung Jendela konteks 1 juta token), sementara beroperasi hingga 4 kali lebih cepat daripada model frontier yang sebanding. Mesin ini unggul dalam pengangkatan berat dalam waktu yang lama tanpa memaksa pengguna untuk memilih antara kualitas dan kecepatan.
- Gemini 3.5 Pro: Model tugas berat Google yang akan datang (awalnya digunakan secara internal dan diluncurkan secara luas), dirancang untuk kedalaman penalaran maksimum, pemahaman multimodal yang masif, dan menangani alur kerja perusahaan yang sangat canggih.
Fokus pada AI “Agentic”: Tidak seperti LLM statis yang lama, ekosistem Gemini 3.5 dioptimalkan secara native untuk agen otonom. Ekosistem ini berkembang pesat pada proyek multi-langkah, pengkodean getaran, ekstraksi data, dan integrasi alat melalui platform pengembang terbaru Google.
Lembar Spesifikasi Gemini 3.5 Flash
| Fitur Flash Gemini 3.5 | Spesifikasi |
|---|---|
| Tanggal rilis | 19 Mei 2026 (Google I/O) |
| Keluarga model | Gemini 3.5 (Tingkat Flash) |
| Jendela konteks | 1.048.576 token (~ 1M) |
| Output maksimal | 65.536 token |
| Modalitas masukan | Teks, gambar, audio, video, PDF |
| Batas akhir pengetahuan | Januari 2026 |
| Kecepatan keluaran | ~4x lebih cepat dari flagship pesaing |
| Terbaik dalam | Alur kerja agen, multimodal, pengkodean, penalaran keuangan |
Jendela konteks 1M itu lebih penting daripada yang ditunjukkan oleh angka judul. Sebagian besar model unggulan membatasi pengambilan yang berguna pada sekitar 128K. Flash menangani lebih banyak lagi, yang sangat besar untuk alur kerja apa pun yang melibatkan PDF panjang atau penelitian yang dijahit.
Tolok ukur Gemini 3.5 Flash: di mana ia menang, di mana ia tidak menang
Mari kita mulai dengan kemenangannya. Pada tabel benchmark yang dipublikasikan Google, 3.5 Flash mengalahkan Gemini 3.1 Pro, Claude Opus 4.7, DAN GPT-5.5 di lima benchmark secara bersamaan. Model yang lebih kecil yang mengalahkan tiga pesaing utama sekaligus, belum pernah terjadi dalam beberapa tahun terakhir.
Di mana Gemini 3.5 Flash menuntun semua orang
| Patokan | Gemini 3.5 Flash | 3.1 Pro | Apa yang diuji |
|---|---|---|---|
| Atlas MCP | 83.6% | 78.2% | Pemanggilan alat yang andal pada skala besar |
| Toolathlon | 56.5% | - | Orkestrasi multi-alat |
| Agen Keuangan v2 | 57.9% | 43.0% | Agen penalaran keuangan |
| Penalaran CharXiv | 84.2% | - | Grafik dan pemahaman gambar |
| MMMU-Pro | 83.6% | - | Pemahaman multimodal |
| GDPval-AA (Elo) | 1656 | 1314 | Tugas-tugas agen di dunia nyata |
| Terminal-Bangku 2.1 | 76.2% | 70.3% | Pengkodean terminal/CLI |
Angka-angka itu abstrak, jadi inilah sesuatu yang konkret. Minggu lalu saya memberikan tugas: menarik 10-Q terbaru dari tiga perusahaan SaaS publik, mengekstrak marjin kotor dan pengeluaran S&M, membuat tabel perbandingan, menandai perubahan YoY terbesar. 3.5 Flash merencanakan langkah-langkahnya sendiri - mencari arsip, mengurai angka, menghasilkan tabel. Satu kali pemotretan, sekitar 90 detik. Saya memberikan perintah yang sama kepada Claude Opus 4.7 di tab berikutnya dan terhenti pada perusahaan kedua, mengharuskan saya untuk mendorongnya dengan istilah pencarian yang lebih baik sebelum menemukan apa yang dibutuhkan.
Kesenjangan itu - Flash pada 83.6% pada MCP Atlas vs sebagian besar pesaing yang bertahan di tahun 70-an - muncul secepat itu dalam pekerjaan nyata.
Di mana Gemini 3.5 Flash masih mengekor 3.1 Pro
- Ujian Terakhir Umat Manusia (penalaran perbatasan)
- ARC-AGI-2 (penalaran abstrak)
- 128K MRCR v2 (pengambilan konteks yang sangat panjang)
Ini adalah tolok ukur kecerdasan murni yang paling sulit, dan 3.5 Flash kalah dalam ketiganya.
Ini brilian dalam mengorkestrasi alat dan menyatukan informasi, tetapi ini bukan model untuk penalaran abstrak yang baru. Hal ini juga menjelaskan mengapa beberapa pengembang masih peduli dengan Gemini 3.1 Pengkodean Pro kinerja: 3.1 Pro mungkin tidak terasa secepat atau se-agent-native Flash, tetapi tetap relevan dalam tugas-tugas di mana penalaran yang lebih dalam dan keandalan konteks jangka panjang lebih penting daripada kecepatan. Google kurang lebih mengakui hal tersebut - 3.5 Pro akan hadir bulan depan, dan mungkin di sanalah mereka menutup kesenjangan penalaran.
Dua minggu berjalan: apa yang tidak tertangkap oleh tolok ukur
Tolok ukur memberi tahu Anda satu cerita. Penggunaan sehari-hari menceritakan hal lain. Inilah yang menonjol di luar angka-angka.
Apa yang dilakukannya dengan baik
- Pemanggilan alat adalah judul utama. Saya menjalankan alur kerja penelitian biasa di mana model harus mencari, mengambil beberapa URL, mengurai konten, melakukan beberapa perhitungan, dan mengembalikan output terstruktur. Pada GPT-5.5, alur kerja tersebut berhasil mungkin 80% dari waktu - kegagalan biasanya terjadi karena model melewatkan satu langkah atau mengarang jawaban ketika pencarian tidak menghasilkan apa yang diinginkan. Pada Gemini 3.5 Flash, ini lebih dekat ke 95% keberhasilan percobaan pertama. Saya memindahkan seluruh alur kerja.
- Tugas-tugas yang sudah berjalan lama selesai. Google menggambarkan hal ini sebagai “tugas agenik cakrawala panjang,” yang terdengar seperti salinan pemasaran, tetapi tidak salah. Tugas 6-8 langkah yang terkadang dihentikan oleh 3.1 Pro di tengah jalan dapat diselesaikan secara menyeluruh oleh Gemini 3.5 Flash. Bagi siapa pun yang menjalankan alur kerja produksi, itu bukanlah tolok ukur - ini adalah perbedaan antara sesuatu yang berfungsi dan sesuatu yang membutuhkan pengasuhan yang konstan.
- Kecepatannya memang nyata. Dalam penggunaan interaktif, perbedaan antara Flash dan flagships yang lebih lambat terlihat jelas. Untuk apa pun yang berbasis obrolan atau berulang - menyusun, curah pendapat, membandingkan opsi - ini mengubah cara penggunaan model.
Apa yang tidak dilakukannya dengan baik
- Tulisan bentuk panjang terasa lebih lemah daripada Claude. Saya memintanya untuk membuat analisis pasar sepanjang 5.000 kata. Strukturnya bagus; prosa itu datar. Claude Opus 4.7 menulis dengan ritme - kalimat dengan panjang yang berbeda, transisi yang bervariasi secara alami, jenis tulisan yang tidak Anda sadari. Flash menulis seperti seseorang yang memenuhi kriteria penugasan. Jika Anda menghasilkan banyak konten tertulis untuk publikasi, Claude masih merupakan alat yang tepat.
- Memodifikasi basis kode yang sebenarnya adalah bagian yang paling sulit. Saya memberinya sebuah proyek sumber terbuka dan memintanya untuk menutup sebuah masalah. Itu akan memperbaiki bug tetapi memperkenalkan regresi di tempat lain. Opus 4.7 tidak membuat kesalahan itu - itulah yang dicerminkan oleh celah yang diverifikasi oleh SWE-bench. Untuk pekerjaan rekayasa yang serius, tetaplah menggunakan Claude untuk saat ini.
- Performa non-Inggris: Saya kebanyakan menguji dalam bahasa Inggris. Hasil bahasa Mandarin jauh lebih baik daripada generasi Gemini 3, tetapi masih lebih kering daripada Claude Sonnet 4.6 pada prosa. Saya ingin sampel yang lebih besar sebelum mengatakan lebih banyak lagi - menandainya untuk siapa pun yang menjalankan konten multibahasa.
Kecepatan, harga, dan mengapa hal ini penting bagi kebanyakan orang
Klaim kecepatan Google adalah bagian yang paling mengejutkan saya dalam penggunaan sehari-hari. Gemini 3.5 Flash kira-kira 4 kali lebih cepat pada token keluaran daripada flagship pesaing. Dalam tolok ukur, itu adalah angka. Dalam penggunaan sebenarnya, ini adalah perbedaan antara “langsung terkunci kembali” dan “hang selama satu ketukan” - dan ketukan itu bertambah ketika Anda melakukan 20-30 prompt dalam satu sore.

Dalam Analisis Buatan’ tolok ukur kecepatan output resmi, Gemini 3.5 Flash peringkat ketiga, berada di belakang GPT-OSS-120B dan GPT-OSS-20B. Ini berarti GPT-OSS lebih cepat dalam token output mentah per detik, tetapi bukan berarti klaim kecepatan Gemini menyesatkan.
- “Cepat” bukan hanya tentang kecepatan output; ini juga tergantung pada latensi keseluruhan, pemrosesan multimodal, penanganan konteks panjang, kualitas penalaran, stabilitas, dan keandalan produksi.
- GPT-OSS sangat baik untuk menghasilkan teks yang sangat cepat dan berkinerja tinggi, sementara Gemini 3.5 Flash menyeimbangkan kecepatan yang kuat dengan kemampuan yang lebih luas seperti input multimodal, pemahaman konteks yang panjang, dan kinerja tugas tujuan umum yang lebih canggih.

Sebagai konteks, berikut ini adalah perbandingan harga API publik dengan flagship 2026 lainnya (inilah yang dikenakan biaya oleh Google, Anthropic, dan OpenAI secara langsung melalui API mereka):
| Model | Masukan ($/1M) | Keluaran ($/1M) | Catatan |
|---|---|---|---|
| Gemini 3.5 Flash | $1.50 | $9.00 | Subjek artikel ini |
| Claude Opus 4.7 | $5.00 | $25.00 | Unggulan antropik |
| GPT-5.5 | $5.00 | $30.00 | Unggulan OpenAI |
| Claude Soneta 4.6 | ~$3 | ~$15 | Tingkat menengah antropis |
| DeepSeek V4 Pro | Lebih rendah | Lebih rendah | Opsi bobot terbuka termurah |
Mengapa hal ini penting meskipun Anda tidak membeli kredit API secara langsung: ini adalah ekonomi yang mendasari yang membentuk model mana yang bisa Anda akses, dan pada tingkat apa. ChatGPT Plus dengan harga $20/bulan mencakup keluarga GPT. Claude Pro dengan harga $20/bulan mencakup Claude. Gemini Advanced dengan harga $20/bulan mencakup Gemini. Jika Anda menginginkan ketiganya ditambah Perplexity dan model gambar yang bagus, Anda membayar $80+/bulan untuk empat langganan - dan Anda beralih di antara empat UI yang berbeda setiap kali Anda ingin membandingkan jawaban.
Itulah bagian yang diselesaikan oleh GlobalGPT. Satu langganan, semuanya dalam obrolan yang sama. Anda akan mengetahui mengapa saya selalu kembali ke hal tersebut pada bagian di bawah ini.
Gemini 3.5 Flash vs GPT-5.5 vs Claude Opus 4.7: kapan harus menggunakan apa
Ini adalah pertanyaan yang paling sering saya dapatkan. Berikut ini adalah lembar contekan berdasarkan apa yang sebenarnya saya lihat selama dua minggu pengujian berdampingan:
| Jenis tugas | Gunakan | Mengapa |
|---|---|---|
| Penelitian multi-langkah | Gemini 3.5 Flash | 83.6% MCP Atlas - perutean alat terbaik di pasar |
| Bagan, gambar, video, PDF | Gemini 3.5 Flash | CharXiv 84.2%, MMMU-Pro 83.6% - multimodal adalah asli dan kuat |
| Penulisan bentuk panjang (esai, laporan) | Claude Opus 4.7 | Ritme dan struktur prosa yang lebih baik |
| Rekayasa perangkat lunak pada basis kode nyata | Claude Opus 4.7 | 87.6% SWE-bench Terverifikasi - masih standar |
| Tugas pengkodean cepat, skrip, CLI | Gemini 3.5 Flash | 76.2% Terminal-Bench, dan cukup cepat untuk merasa interaktif |
| Pengambilan konteks panjang (>128K) | Gemini 3.1 Pro | 3.1 Pro masih menang pada MRCR v2 melewati 128K |
| Penalaran tingkat perbatasan | Tunggu 3.5 Pro atau gunakan 3.1 Pro | Flash kalah dalam Ujian Terakhir Kemanusiaan dan ARC-AGI-2 |
| Apa pun yang membutuhkan kecepatan | Gemini 3.5 Flash | Output ~4x lebih cepat dari flagships lainnya |
Berikut ini adalah catatan yang ingin saya sampaikan: untuk sebagian besar beban kerja produksi nyata, Gemini 3.5 Flash sekarang seharusnya menjadi standar Anda, dengan Opus 4.7 atau GPT-5.5 sebagai pengecualian yang Anda raih ketika Flash tidak cukup. Enam bulan yang lalu saya akan membalikkan hal itu - tingkatan Pro adalah standar, Flash adalah pilihan anggaran. Gemini 3.5 Flash membalikkan hubungan tersebut.
Bukan berarti Claude Opus 4.7 sudah mati. Ini masih merupakan model untuk rekayasa perangkat lunak pada basis kode yang sebenarnya, dan menulis prosa yang lebih baik. Tetapi jika pekerjaan Anda sebagian besar melibatkan pencarian, menarik data terstruktur, membandingkan sumber, dan menghasilkan output yang siap untuk keputusan - Flash adalah alat yang lebih baik sekarang.
Cara mencoba Gemini 3.5 Flash
Ada beberapa jalur, tergantung apa yang ingin Anda lakukan:
- Aplikasi Gemini atau Mode AI Pencarian. Gratis, membutuhkan akun Google. Baik untuk petunjuk kasual tetapi tidak ada cara untuk membandingkannya dengan model lain

- Gemini Advanced ($20/bulan). Langganan konsumen Google. Memberi Anda tingkatan Gemini 3.5 Flash dan Pro, tetapi Anda terkunci hanya pada model Google.
Namun demikian, terdapat masalah yang signifikan dengan kedua metode penggunaan Gemini 3.5 Flash, karena Gemini memiliki batasan akses regional yang ketat, sehingga menyulitkan banyak pengguna untuk masuk atau menggunakan layanan secara langsung.

Oleh karena itu, saya merekomendasikan metode ketiga kepada Anda.
- GlobalGPT. Semua di bawah satu langganan, semua dalam jendela obrolan yang sama. Pendaftar baru mendapatkan 3 kali Gemini 3.5 Flash gratis. Tidak perlu kartu kredit untuk memulai.
- Pengguna dapat mengakses Gemini tanpa menyiapkan VPN, sekaligus menjelajahi berbagai model AI tingkat lanjut dalam satu platform.
- Gemini 3.5 Flash bersanding dengan GPT-5.5, Claude Opus 4.7, Claude Soneta 4.6, GPT Image 2, Seedance 2.0, dan ~100 model lainnya.
Opsi ketiga itulah yang sejujurnya saya gunakan dalam melakukan perbandingan untuk artikel ini. Untuk menjalankan prompt yang sama di Gemini 3.5 Flash, GPT-5.5, dan Claude Opus 4.7 dengan cara lain, Anda harus berlangganan Gemini Advanced ($20), ChatGPT Plus ($20), dan Claude Pro ($20) secara terpisah - $60/bulan, tiga akun terpisah, tiga antarmuka obrolan yang berbeda, dan perulangan salin-tempel setiap kali Anda ingin membandingkan jawaban. Di GlobalGPT, ini adalah menu tarik-turun.
Itulah nilai dari platform all-in-one secara umum: platform ini tidak menggantikan model yang mendasarinya, hanya saja menghemat waktu Anda dalam mengaksesnya. Jika Anda hanya menggunakan satu model, langganan satu vendor tidak masalah. Jika Anda membandingkan model - atau Anda ingin akses ke yang terbaik untuk setiap tugas - agregator membayar sendiri dengan cepat.
Coba Gemini 3.5 Flash di GlobalGPT - 3 generasi gratis saat mendaftar. Ditambah GPT-5.5, Claude Opus 4.7, dan 100+ model dalam obrolan yang sama.

Kesimpulan:Haruskah Anda beralih?
- Jika pekerjaan utama Anda adalah penelitian multi-langkah, analisis multimodal, atau segala jenis tugas gaya agen dengan penggunaan alat - ya. Ini lebih cepat, benchmark mendukungnya, dan dua minggu pengujian nyata mengkonfirmasikannya. Tidak ada alasan yang baik untuk tetap menggunakan GPT-5.5 atau Opus 4.7 untuk pekerjaan semacam itu.
- Jika pekerjaan utama Anda adalah penulisan tingkat publikasi atau rekayasa basis kode, tetaplah menggunakan Claude Opus 4.7.
- Jika pekerjaan utama Anda adalah penalaran tingkat penelitian, tunggu Gemini 3.5 Pro bulan depan.
Cara tercepat untuk memutuskan adalah dengan mengambil beberapa petunjuk aktual minggu lalu dan menjalankannya melalui ketiga model. Tolok ukur adalah agregat. Alur kerja Anda adalah milik Anda.
Cara termudah untuk melakukan perbandingan tersebut adalah di GlobalGPT - satu langganan, ketiga model dalam obrolan yang sama, ditambah 100 model lainnya. Akun baru mendapatkan 3 generasi Gemini 3.5 Flash gratis sebagai permulaan. Tidak memerlukan kartu kredit.
TANYA JAWAB: Informasi Lebih Lanjut Mengenai Gemini 3.5 Flash
Apakah Gemini 3.5 Flash lebih baik dari Gemini 3.1 Pro?
Untuk alur kerja agen, tugas pengkodean, analisis multimodal, dan penggunaan alat, Gemini 3.5 Flash memiliki kinerja yang lebih baik daripada Gemini 3.1 Pro di sebagian besar tolok ukur yang dibahas di atas. Ini juga jauh lebih cepat dalam penggunaan sehari-hari. Namun, Gemini 3.1 Pro masih memiliki keunggulan dalam beberapa penalaran yang lebih sulit dan tugas pengambilan konteks yang sangat panjang.
Kapan Gemini 3.5 Pro akan tersedia?
Gemini 3.5 Pro diperkirakan akan diluncurkan bulan depan, namun Google belum memberikan tanggal rilis yang pasti. Berdasarkan posisi saat ini, Gemini 3.5 Pro kemungkinan akan lebih fokus pada penalaran frontier, pemecahan masalah abstrak, dan tugas-tugas gaya penelitian yang paling sulit, sementara Gemini 3.5 Flash sudah tersedia untuk alur kerja agen yang cepat dan penggunaan multimodal.
Apa perbedaan antara Gemini Flash dan Gemini Pro?
Seri Flash didesain untuk kecepatan, biaya yang lebih rendah, dan alur kerja praktis bervolume tinggi. Seri ini paling cocok untuk penelitian, penggunaan alat, analisis multimodal, tugas pengkodean cepat, dan pekerjaan gaya agen sehari-hari. Seri Pro biasanya diposisikan sebagai tingkat penalaran yang lebih kuat, lebih cocok untuk masalah abstrak yang lebih sulit, penalaran tingkat frontier, dan tugas-tugas yang lebih kompleks di mana kecerdasan maksimum lebih penting daripada kecepatan.



