Gemini 3.5 Flash, duas semanas depois: O Google realmente superou seu próprio nível profissional?

2026-05-25
02:37
Chloe Murphy
Última atualização em 2026-06-08

Fiquei acordado para assistir à apresentação do I/O e, quando o Google apresentou o Gemini 3.5 Flash, tive que voltar a assistir.

A camada do Flash sempre foi a “Bom o suficiente, barato, rápido” na linha de produtos. Desta vez, o Google afirmou que ele superou o nível Pro anterior, não em uma métrica escolhida a dedo, mas na maioria dos benchmarks de codificação e de agentes.

Anúncios como esse costumam ser feitos de duas maneiras. Ou o fornecedor escolheu o gráfico que o agrada ou algo realmente mudou. Assim, depois que adicionamos o Gemini 3.5 Flash ao GlobalGPT, passei cerca de duas semanas trabalhando de verdade com ele - pesquisas, apresentações de slides, tarefas de várias etapas no estilo de agente, o tipo de coisa que eu normalmente dividiria em três assinaturas diferentes. Eis o que descobri e como ele se compara ao GPT-5.5 e ao Claude Opus 4.7.

TL;DR

Versão rápida, para as pessoas que estão lendo:

Se seu trabalho for orientado por agentes - pesquisa em várias etapas, extraindo dados de diversas fontes, lendo gráficos e PDFs - mudar para o Flash 3.5. É o melhor da categoria no momento.
Se você estiver escrever textos longos ou analisar bases de código reais, ficar com Claude Opus 4.7.
Se você precisar raciocínio de nível de fronteira (quebra-cabeças no estilo ARC-AGI, novos problemas de pesquisa), aguarde Gemini 3.5 Pro no próximo mês.
Se você precisar um modelo rápido para o dia a dia, escolher Gemini 3.5 Flash agora. Ele oferece aproximadamente 4 vezes a velocidade de saída do GPT-5.5 e do Claude Opus 4.7.

Quer experimentar? O Gemini 3.5 Flash está disponível no GlobalGPT. As novas contas recebem 3 execuções gratuitas, sem necessidade de cartão de crédito. O que torna a plataforma útil para uma comparação como essa é o fato de o GPT-5.5, o Claude Opus 4.7 e cerca de 100 outros modelos estarem na mesma janela de bate-papo. Uma assinatura, uma interface, sem malabarismos.

Quer experimentar? O Gemini 3.5 Flash está disponível no GlobalGPT. Novas contas ganham 3 rodadas grátis - não é necessário cartão de crédito. O que torna a plataforma útil para uma comparação como essa é o fato de o GPT-5.5, o Claude Opus 4.7 e cerca de 100 outros modelos estarem na mesma janela de bate-papo. Uma assinatura, uma interface, sem malabarismos.

Experimente o Gemini 3.5 Flash gratuitamente no GlobalGPT

O que é o Gemini 3.5 Flash?

O Gemini 3.5 Flash é o primeiro modelo da nova família Gemini 3.5, lançado no Google I/O em 19 de maio de 2026. O Gemini 3.5 Pro está no roteiro para o próximo mês, embora o Google tenha sido vago quanto à data exata.

Historicamente, “Flash” na terra dos Gêmeos significava: mais rápido, mais barato e menos inteligente. Esta versão quebra esse padrão. O enquadramento do Google é “Inteligência de nível profissional na velocidade do Flash” o que é uma afirmação ousada de qualquer fornecedor. Os dados, em sua maioria, confirmam essa afirmação.

Apresentando a família Gemini 3.5

O Família Gemini 3.5 O Gemini 3.5 representa o próximo grande avanço do Google em inteligência artificial, com modelos de engenharia que combinam inteligência de nível avançado com execução extremamente rápida. Criada especificamente para potencializar fluxos de trabalho agênticos complexos de várias etapas e engenharia de software avançada, a família Gemini 3.5 foi projetada para agir em vez de apenas responder.

A família Gemini 3.5 representa o próximo grande salto do Google em inteligência artificial, modelos de engenharia que combinam inteligência de nível avançado com execução extremamente rápida. Criada especificamente para potencializar fluxos de trabalho agênticos complexos de várias etapas e engenharia de software avançada, a família Gemini 3.5 foi projetada para agir em vez de apenas responder.

Principais modelos e recursos

Gemini 3.5 Flash: O principal modelo de velocidade e eficiência. Ele oferece desempenho de última geração em geração de código, raciocínio e processamento de contexto longo (suportando um Janela de contexto de 1 milhão de tokens), enquanto opera até 4 vezes mais rápido do que os modelos de fronteira comparáveis. Ele se destaca no trabalho pesado por períodos prolongados, sem forçar os usuários a escolher entre qualidade e velocidade.
Gemini 3.5 Pro: O próximo modelo de serviço pesado do Google (inicialmente implantado internamente e implementado de forma ampla), adaptado para a máxima profundidade de raciocínio, compreensão multimodal maciça e manipulação de fluxos de trabalho empresariais altamente sofisticados.

O foco na IA “agêntica”: Diferentemente dos LLMs estáticos mais antigos, o ecossistema Gemini 3.5 é nativamente otimizado para agentes autônomos. Ele prospera em projetos de várias etapas, codificação vibrante, extração de dados e integração de ferramentas por meio das mais novas plataformas de desenvolvedores do Google.

A folha de especificações do Gemini 3.5 Flash

Recurso Flash do Gemini 3.5	Especificação
Data de lançamento	19 de maio de 2026 (Google I/O)
Família de modelos	Gemini 3.5 (nível Flash)
Janela de contexto	1.048.576 tokens (~1M)
Saída máxima	65.536 tokens
Modalidades de entrada	Texto, imagem, áudio, vídeo, PDF
Limite de conhecimento	Janeiro de 2026
Velocidade de saída	~4× mais rápido do que os carros-chefe da concorrência
Melhor em	Fluxos de trabalho de agentes, multimodais, codificação, raciocínio financeiro

Essa janela de contexto de 1 milhão é mais importante do que o número da manchete sugere. A maioria dos modelos principais limita a recuperação útil a cerca de 128K. O Flash é capaz de lidar com um volume consideravelmente maior, o que é muito importante para qualquer fluxo de trabalho que envolva PDFs longos ou pesquisas costuradas.

Benchmarks do Gemini 3.5 Flash: onde ele ganha, onde não ganha

Vamos começar com as vitórias. Na tabela de benchmark publicada pelo Google, o 3.5 Flash supera o Gemini 3.1 Pro, o Claude Opus 4.7 e o GPT-5.5 em cinco benchmarks simultaneamente. Um modelo menor vencendo três concorrentes principais de uma só vez não aconteceu nos últimos anos.

Onde o Gemini 3.5 Flash leva todo mundo

Referência	Gemini 3.5 Flash	3.1 Pro	O que ele testa
Atlas da MCP	83.6%	78.2%	Chamada de ferramenta confiável em escala
Toolathlon	56.5%	—	Orquestração com várias ferramentas
Agente financeiro v2	57.9%	43.0%	Agentes de raciocínio financeiro
Raciocínio CharXiv	84.2%	—	Compreensão de gráficos e figuras
MMMU-Pro	83.6%	—	Compreensão multimodal
PIBval-AA (Elo)	1656	1314	Tarefas do agente no mundo real
Banco de terminais 2.1	76.2%	70.3%	Codificação de terminal/CLI

Os números são abstratos, portanto, aqui está algo concreto. Na semana passada, eu lhe dei uma tarefa: obter os 10-Qs mais recentes de três empresas públicas de SaaS, extrair a margem bruta e os gastos com S&M, criar uma tabela de comparação e sinalizar as maiores alterações anuais. 3.5 O Flash planejou as etapas por conta própria - pesquisar os arquivos, analisar os números, gerar a tabela. Uma única tentativa, cerca de 90 segundos. Dei o mesmo aviso ao Claude Opus 4.7 na guia seguinte e ele parou na segunda empresa, precisando que eu o estimulasse com termos de pesquisa melhores antes de encontrar o que precisava.

Essa diferença - Flash a 83,6% no MCP Atlas em comparação com a maioria dos concorrentes que ficam na casa dos 70 - aparece rapidamente no trabalho real.

Onde o Gemini 3.5 Flash ainda está atrás do 3.1 Pro

O último exame da humanidade (raciocínio de fronteira)
ARC-AGI-2 (raciocínio abstrato)
128K MRCR v2 (recuperação de contexto muito longo)

Esses são os benchmarks de inteligência pura mais difíceis, e o 3.5 Flash perde em todos os três.

Ele é excelente para orquestrar ferramentas e reunir informações, mas não é o modelo para um raciocínio abstrato inovador. Isso também explica por que alguns desenvolvedores ainda se preocupam com Codificação do Gemini 3.1 Pro desempenho: O 3.1 Pro pode não parecer tão rápido ou nativo quanto o Flash, mas continua sendo relevante em tarefas em que o raciocínio mais profundo e a confiabilidade do contexto longo são mais importantes do que a velocidade. O Google admite mais ou menos esse ponto: o 3.5 Pro será lançado no próximo mês e, presumivelmente, será nele que a lacuna de raciocínio será eliminada.

Duas semanas depois: o que os benchmarks não capturam

Os benchmarks contam uma história. O uso diário conta outra. Aqui está o que se destacou além dos números.

O que ele faz bem

A chamada de ferramentas é a manchete. Executo um fluxo de trabalho de pesquisa regular em que o modelo precisa pesquisar, buscar alguns URLs, analisar o conteúdo, fazer algumas contas e retornar uma saída estruturada. No GPT-5.5, esse fluxo de trabalho foi bem-sucedido em cerca de 80% das vezes - as falhas eram geralmente o modelo pulando uma etapa ou inventando a resposta quando uma pesquisa não retornava o que ele queria. No Gemini 3.5 Flash, o sucesso na primeira tentativa está mais próximo de 95%. Mudei todo o fluxo de trabalho.
As tarefas de longa duração são concluídas. O Google descreve isso como “tarefas agênticas de longo prazo”, o que soa como um texto de marketing, mas não está errado. Uma tarefa de 6 a 8 etapas que o 3.1 Pro às vezes deixaria de lado no meio do caminho é concluída de ponta a ponta pelo Gemini 3.5 Flash. Para qualquer pessoa que esteja executando fluxos de trabalho de produção, isso não é um benchmark - é a diferença entre algo que funciona e algo que precisa de cuidados constantes.
A questão da velocidade é real. No uso interativo, a diferença entre o Flash e os carros-chefe mais lentos é óbvia. Para qualquer coisa baseada em bate-papo ou iterativa (elaboração de rascunhos, brainstorming, comparação de opções), isso muda a sensação de usabilidade do modelo.

O que ele não faz bem

A redação de formato longo é visivelmente mais fraca do que a do Claude. Eu lhe pedi uma análise de mercado de 5.000 palavras. A estrutura era boa, mas a prosa era plana. O Claude Opus 4.7 escreve com ritmo - frases com comprimentos diferentes, transições naturalmente variadas, o tipo de escrita que você não percebe. O Flash escreve como alguém que atende aos critérios da tarefa. Se você estiver produzindo muito conteúdo escrito para publicação, o Claude ainda é a ferramenta certa.
A modificação de bases de código reais é o ponto fraco. Dei a ele um projeto de código aberto e pedi que fechasse um problema. Ele corrigia o bug, mas introduzia uma regressão em outro lugar. O Opus 4.7 não comete esse erro - é isso que o SWE-bench Verified gap reflete. Para trabalhos sérios de engenharia, fique com o Claude por enquanto.
Desempenho fora do inglês: Testei principalmente em inglês. A saída em chinês é significativamente melhor do que a geração Gemini 3, mas ainda mais seca do que a do Claude Sonnet 4.6 em prosa. Eu gostaria de ter uma amostra maior antes de dizer mais - sinalizando-o para qualquer pessoa que esteja executando conteúdo multilíngue.

Velocidade, preço e por que isso é importante para a maioria das pessoas

A alegação de velocidade do Google é a parte que mais me surpreendeu no uso diário. O Gemini 3.5 Flash é cerca de 4 vezes mais rápido em tokens de saída do que os carros-chefe da concorrência. Nos benchmarks, isso é um número. No uso real, é a diferença entre “voltar instantaneamente” e “ficar parado por um tempo” - e esse tempo aumenta quando você está fazendo de 20 a 30 prompts em uma tarde.

Em Análise Artificial’ referência oficial de velocidade de saída, Gemini 3.5 Flash classificações terceiro, atrás do GPT-OSS-120B e do GPT-OSS-20B. Isso significa que o GPT-OSS é mais rápido em tokens de saída brutos por segundo, mas não significa que as declarações de velocidade da Gemini sejam enganosas.

“Rápido” não se refere apenas à velocidade de saída; também depende de latência geral, processamento multimodal, manuseio de contextos longos, qualidade do raciocínio, estabilidade e confiabilidade da produção.
O GPT-OSS é excelente para geração de texto ultrarrápida e de alto rendimento, enquanto o Gemini 3.5 Flash Equilibra a alta velocidade com recursos mais amplos, como entrada multimodal, compreensão de contextos longos e desempenho mais avançado de tarefas de uso geral.

Para fins de contexto, veja como o preço da API pública se compara aos outros carros-chefe de 2026 (isso é o que o Google, a Anthropic e a OpenAI cobram diretamente por meio de suas APIs):

Modelo	Entrada ($/1M)	Saída ($/1M)	Notas
Gemini 3.5 Flash	$1.50	$9.00	O assunto deste artigo
Claude Opus 4.7	$5.00	$25.00	Carro-chefe antrópico
GPT-5.5	$5.00	$30.00	Carro-chefe da OpenAI
Soneto de Claude 4.6	~$3	~$15	Nível intermediário antrópico
DeepSeek V4 Pro	Mais baixo	Mais baixo	Opção mais barata de pesos abertos

Por que isso é importante, mesmo que você não esteja comprando créditos de API diretamente: esses são os aspectos econômicos subjacentes que moldam os modelos aos quais você pode realmente ter acesso e em que nível. O ChatGPT Plus, a $20/mês, abrange a família GPT. O Claude Pro, a $20/mês, abrange o Claude. O Gemini Advanced, a $20/mês, abrange o Gemini. Se você quiser todos os três, mais o Perplexity e um bom modelo de imagem, terá que pagar mais de $80/mês em quatro assinaturas - e terá que alternar entre quatro interfaces de usuário diferentes sempre que quiser comparar as respostas.

Essa é a parte que o GlobalGPT resolve. Uma assinatura, todas elas no mesmo chat. Você verá por que sempre volto a esse assunto na seção abaixo.

Gemini 3.5 Flash vs GPT-5.5 vs Claude Opus 4.7: quando usar o quê

Essa é a pergunta que mais recebo. Aqui está a folha de dicas com base no que eu realmente vi em duas semanas de testes lado a lado:

Tipo de tarefa	Uso	Por que
Pesquisa em várias etapas	Gemini 3.5 Flash	83.6% MCP Atlas - o melhor roteamento de ferramentas do mercado
Gráficos, figuras, vídeos, PDFs	Gemini 3.5 Flash	CharXiv 84.2%, MMMU-Pro 83.6% - o multimodal é nativo e forte
Redação de textos longos (ensaios, relatórios)	Claude Opus 4.7	Melhor ritmo e estrutura da prosa
Engenharia de software em bases de código reais	Claude Opus 4.7	87.6% SWE-bench Verificado - ainda é o padrão
Tarefas de codificação rápida, scripts, CLI	Gemini 3.5 Flash	76,2% Terminal-Bench e rápido o suficiente para parecer interativo
Recuperação de contextos longos (>128K)	Gemini 3.1 Pro	O 3.1 Pro ainda vence no MRCR v2 após 128K
Raciocínio de nível de fronteira	Aguarde o 3.5 Pro ou use o 3.1 Pro	Flash perde no Último Exame da Humanidade e no ARC-AGI-2
Qualquer coisa em que a velocidade seja importante	Gemini 3.5 Flash	Saída ~4× mais rápida do que os outros carros-chefe

Quero deixar registrado o seguinte: para a maioria das cargas de trabalho reais de produção, o Gemini 3.5 Flash deve ser o padrão, com o Opus 4.7 ou o GPT-5.5 como exceção quando o Flash não for suficiente. Seis meses atrás, eu teria invertido essa situação: os níveis Pro eram o padrão, o Flash era a opção econômica. O Gemini 3.5 Flash inverteu a relação.

Isso não significa que o Claude Opus 4.7 esteja morto. Ele ainda é o modelo para engenharia de software em bases de código reais e escreve melhor. Porém, se o seu trabalho envolve principalmente pesquisa, extração de dados estruturados, comparação de fontes e produção de resultados prontos para a tomada de decisões - o Claude Opus 4.7 é um modelo de engenharia de software para bases de código reais. O Flash é a melhor ferramenta atualmente.

Como testar de fato o Gemini 3.5 Flash

Alguns caminhos, dependendo do que você está tentando fazer:

Aplicativo Gemini ou modo Search AI. Gratuito, requer uma conta do Google. Bom para solicitações casuais, mas não há como comparar com outro modelo
Gemini Advanced ($20/mês). Assinatura do Google para consumidores. Oferece os níveis Gemini 3.5 Flash e Pro, mas você fica restrito apenas aos modelos do Google.

No entanto, há problemas significativos com os dois métodos de uso do Gemini 3.5 Flash, porque O Gemini tem limitações rígidas de acesso regional, tornando difícil para muitos usuários fazer login ou usar o serviço diretamente.

No entanto, há problemas significativos com os dois métodos de uso do Gemini 3.5 Flash, porque o Gemini tem limitações estritas de acesso regional, o que dificulta para muitos usuários fazer login ou usar o serviço diretamente.

Portanto, recomendo a você um terceiro método.

GlobalGPT. Tudo em uma única assinatura, tudo na mesma janela de bate-papo. Os novos usuários recebem 3 corridas Flash Gemini 3.5 gratuitas. Não é necessário cartão de crédito para começar.
- Os usuários podem acessar o Gemini sem configurar uma VPN e, ao mesmo tempo, explorar uma ampla variedade de modelos avançados de IA em uma única plataforma.
- O Gemini 3.5 Flash fica ao lado do GPT-5.5, Claude Opus 4.7, Claude Sonnet 4.6, GPT Image 2, Seedance 2.0 e cerca de 100 outros modelos.

Sinceramente, foi com essa terceira opção que fiz o trabalho de comparação para este artigo. Para executar o mesmo prompt no Gemini 3.5 Flash, no GPT-5.5 e no Claude Opus 4.7 de qualquer outra forma, é necessário assinar o Gemini Advanced ($20), o ChatGPT Plus ($20) e o Claude Pro ($20) separadamente. $60/mês, três contas separadas, três interfaces de bate-papo diferentes e um loop de copiar e colar toda vez que você quiser comparar respostas. No GlobalGPT, é um menu suspenso.

Esse é o valor das plataformas multifuncionais em geral: elas não substituem os modelos subjacentes, apenas poupam o atrito de acessá-los. Se você usa apenas um modelo, uma assinatura de um único fornecedor é suficiente. Se você compara modelos ou deseja ter acesso ao melhor modelo para cada tarefa um agregador se paga rapidamente.

Experimente o Gemini 3.5 Flash no GlobalGPT - 3 gerações grátis ao se registrar. Além disso, GPT-5.5, Claude Opus 4.7 e mais de 100 modelos no mesmo chat.

Experimente o Gemini 3.5 Flash gratuitamente no GlobalGPT

Conclusão:Você deve mudar?

Se o seu trabalho principal for pesquisa em várias etapas, análise multimodal ou qualquer tipo de tarefa no estilo de agente com uso de ferramentas, sim. É mais rápido, os benchmarks confirmam isso e duas semanas de testes reais confirmaram esse fato. Não há razão para continuar no GPT-5.5 ou no Opus 4.7 para esse tipo de trabalho.
Se seu trabalho principal for escrever em nível de publicação ou engenharia de base de código, fique com o Claude Opus 4.7.
Se o seu trabalho principal for o raciocínio de nível de pesquisa, aguarde o Gemini 3.5 Pro no próximo mês.

A maneira mais rápida de decidir é pegar um punhado de prompts reais da última semana e executá-los em todos os três modelos. As referências são agregadas. Seu fluxo de trabalho é seu.

A maneira mais fácil de fazer essa comparação é no GlobalGPT - uma assinatura, todos os três modelos no mesmo chat, além de 100 outros. As novas contas recebem 3 gerações Gemini 3.5 Flash gratuitas para começar. Sem cartão de crédito.

PERGUNTAS FREQUENTES: Mais informações sobre o Gemini 3.5 Flash

O Gemini 3.5 Flash é melhor do que o Gemini 3.1 Pro?

Para fluxos de trabalho de agentes, tarefas de codificação, análise multimodal e uso de ferramentas, o Gemini 3.5 Flash tem um desempenho melhor do que o Gemini 3.1 Pro na maioria dos benchmarks discutidos acima. Ele também é muito mais rápido no uso diário. No entanto, o Gemini 3.1 Pro ainda tem uma vantagem em algumas tarefas mais difíceis de raciocínio e de recuperação de contextos muito longos.

Quando o Gemini 3.5 Pro estará disponível?

Espera-se que o Gemini 3.5 Pro seja lançado no próximo mês, mas o Google ainda não informou uma data exata de lançamento. Com base no posicionamento atual, o Gemini 3.5 Pro provavelmente se concentrará mais no raciocínio de fronteira, na solução de problemas abstratos e nas tarefas mais difíceis do tipo pesquisa, enquanto o Gemini 3.5 Flash já está disponível para fluxos de trabalho rápidos de agentes e uso multimodal.

Qual é a diferença entre o Gemini Flash e o Gemini Pro?

A série Flash foi projetada para velocidade, custo mais baixo e fluxos de trabalho práticos de alto volume. É melhor para pesquisa, uso de ferramentas, análise multimodal, tarefas rápidas de codificação e trabalho cotidiano no estilo de agente. A série Pro geralmente é posicionada como a camada de raciocínio mais forte, mais adequada para problemas abstratos mais difíceis, raciocínio de nível de fronteira e tarefas mais complexas em que a inteligência máxima é mais importante do que a velocidade.

Compartilhe a postagem:

Publicações relacionadas

GPT-5.6 Pricing Explained: Plans, API Cost, Codex Credits, and Real Token Usage

Updated July 11, 2026. GPT-5.6 pricing is not one simple number. The real cost depends on whether you use ChatGPT

GPT-5.6 vs Fable 5 vs GPT-5.5: Real Tests, Pricing, and Best Uses

If you are searching for GPT-5.6 vs Fable 5, you probably do not want another abstract benchmark summary. You want to