Gemini 3 vs ChatGPT 5.1: Google's schokkende sprong voorwaarts voorbij het beste model van OpenAI
Claude McKenzie
Laatst bijgewerkt op 20-11-2025
De nieuwe Google Gemini 3 Pro is zo'n enorme sprong voorwaarts dat het voelt alsof er een hele generatie wordt overgeslagen — alsof het rechtstreeks voorbij is gesprongen. 2.5 Pro en landde ergens in de buurt van GPT-5.1 (geen grap).
In bijna elke benchmark presteert het model nu beter dan GPT-5.1 en Claude 4.5, zelfs de moeilijkste AGI-gerichte tests zoals ARC-AGI-2 en de “laatste examens.” Op de AIME 2025 wiskundige benchmark, scoorde het een perfecte 100 met ingeschakelde tools en brak het zelfs de beruchte LiveCodeBench Pro record — een test die alle andere grote modellen tot nu toe niet hadden kunnen doorstaan.
In de door gebruikers gekozen AI-arena-ranglijst is het verhaal hetzelfde. Grok 4.1 van Elon Musk stond gisteren nog bovenaan de hitlijsten — en vandaag, Gemini 3 Pro heeft het al ingehaald.
Zelfs Sam Altman en Musk kon niet anders dan het respectvol goedkeuren, zowel publiekelijk als door het team van Google te feliciteren.
Van het simuleren van OS-interfaces tot het bouwen van echte software
Tijdens interne tests werd Gemini 3 gezien terwijl het een volledige simulatie uitvoerde. Windows, macOS, en Linux interfaces. Aanvankelijk dachten mensen dat het slechts een demo van een front-endontwerp was, maar het bleek dat de programma's die het creëerde ook echt werkten.
In één demo bouwde het een compleet LEGO-editor vanaf nul bij de eerste poging — het ontwerpen van de interface, het ruimtelijke logicasysteem en alle kernbewerkingsfuncties in één keer.
En dat was nog maar het begin.
In een andere showcase gebruikte Google Gemini 3 Pro om een speelbaar spel helemaal zelf te ontwerpen — en het op YouTube uit te brengen. De AI had in feite een miniversie van “Small Game Hub” helemaal alleen.
Slimmere agenten, resultaten in de praktijk
Gemini 3 Pro is niet alleen een krachtpatser op het gebied van coderen, maar ook veel beter in langetermijnplanning en realistische taaksimulatie.
In één test simuleerde het een jaar lang het beheer van een automaatbedrijf, waarbij een $5.000 winst — de hoogste van alle geteste modellen.
Van boven naar beneden: Gemini 3 Pro, Claude Sonnet 4.5, GPT-5.1, Gemini 2.5 Pro.
Lancering op volledige bedrijfsschaal
Vanaf vandaag heeft Google aangekondigd dat het de volledige Gemini 3-serie “op bedrijfsniveau.” Op dag één was Gemini:
Volledig geïntegreerd in Google Zoeken,
Gegeven een standalone mobiele app, en
Vergezeld van een nieuwe AI-agentontwikkelingsplatform.
En dat is nog niet alles — een krachtigere Gemini 3 “Deep Think” De modus is al onderweg.
Wat betreft de vraag hoe zo'n enorme sprong in capaciteit tot stand is gekomen, zegt de vicepresident Onderzoek van Google Oriol Vinyals onthulde slechts één aanwijzing:
“De vooropleiding is nog niet afgerond en de nascholing kan nog aanzienlijk worden verbeterd.”
De evolutie van Gemini: van oprichting tot fusie
Terugkijkend, de Gemini-serie Het voelt als een gamepersonage dat een niveau hoger komt: elke generatie verbetert de zwakke punten van de vorige en maakt alles weer helemaal klaar voor de volgende.
Tweelingen 1 legde de basis — door multimodaal begrip en ultralange context met elkaar te verbinden. Het werd het eerste model dat miljoenen tokens aan context kon verwerken.
Tweelingen 2 verkregen invloed — nadat het zich de kunst van het opslaan van enorme hoeveelheden informatie eigen had gemaakt, begon het die kennis te synthetiseren en te plannen, waarmee het de basis legde voor echte AI-agent gedrag.
Tweelingen 2.5 gericht op redeneren — Google heeft een “denkmachine” toegevoegd, die diepgaandere logische analyses, redeneringen in gedachtegangen en mensachtige stapsgewijze probleemoplossing mogelijk maakt.
Tweelingen 3 is het hoogtepunt — niet alleen ruwe schaalvergroting, maar diepe integratie over modaliteiten, redeneringen en agentische capaciteiten heen. Het motto zou kunnen zijn: “Jij bedenkt het. Ik maak het waar.”
Het meest opvallend is dat, Gemini 3 voelt zich eindelijk menselijk bewust — het “begrijpt” wat je bedoelt, niet alleen wat je typt.
Je hoeft je niet langer druk te maken over het schrijven van de perfecte prompt. Voer gewoon je rommelige verzoek in en het begrijpt je bedoeling, leest de context en antwoordt met een duidelijk, rechttoe rechtaan antwoord — zonder onnodige opsmuk.
Multimodale mogelijkheden op Overdrive
Het multimodale begrip van Gemini 3 bevindt zich op een ander niveau. Het kan nu tekst, afbeeldingen, video, audio en code naadloos samen verwerken.
Geef het bijvoorbeeld een volledige sportwedstrijdvideo en het kan de strategie samenvatten, de technieken van spelers analyseren en je zelfs leren hoe je hun bewegingen kunt nabootsen.
Het is niet moeilijk om je een nabije toekomst voor te stellen waarin je je eigen trainingsbeelden kunt uploaden — en Gemini 3 wordt je persoonlijke coach.
In zoeksituaties gaat het ook verder dan alleen het dumpen van links. In plaats daarvan organiseert het realtime informatie in interactieve, bruikbare inhoud dat direct antwoord geeft op uw vraag.
Antigravity: het nieuwe agent-first ontwikkelingsplatform van Google
“Ontwikkelaars bevrijden van repetitieve coderingstaken en hen in staat stellen om als architecten op hoog niveau te fungeren.”
Tijdens de demo van Google bouwde Antigravity een app voor het volgen van vluchten in minder dan een minuut.
In tegenstelling tot AI IDE's zoals Cursor, Antigravity tilt de AI-agent naar een zelfstandige omgeving met volledige toegang tot de redacteur, terminal, en browser. Agenten kunnen zelfstandig end-to-end software plannen, coderen, testen en verifiëren — allemaal namens de gebruiker.
Een nieuwe Beheerderweergave laat gebruikers meerdere agents tegelijkertijd aansturen, die elk semi-autonoom werken.
De ambitie van Google is hier duidelijk: dit is niet alleen een tool, het is een nieuwe generatie van AI-gestuurde software-engineering.
Open ecosysteem en stormloop van ontwikkelaars
Antigravity ondersteunt niet alleen Gemini-modellen, maar ook modellen van derden, zoals GPT-OSS en Claude.
Het is momenteel in openbare preview en gratis te gebruiken, met “royale limieten” voor Gemini 3 Pro. Het was geen verrassing dat ontwikkelaars zich meteen na de lancering haastten om gratis gebruik te “farmen”.
Ter context:, Claude Code maakt al ongeveer 21% van de totale omzet van Anthropic, en OpenAI blijft zich uitbreiden rond op Codex gebaseerde producten.
Het is geen verrassing dat AI-codeertools lijken het volgende grote strijdtoneel te worden.
Conclusie
Gemini 3 Pro betekent een keerpunt — een model dat niet alleen beter denken, maar handelt slimmer. In combinatie met Antigravity geeft Google duidelijk aan dat het niet alleen de multimodale race wil leiden, maar ook het tijdperk van intelligente agents.
Ja-Perplexity Max is de moeite waard voor gebruikers die onbeperkte toegang nodig hebben tot geavanceerde AI-modellen, onbeperkt gebruik van Labs, en vroege producten.
Je kunt Perplexity Pro niet legaal gratis krijgen door de betaling te omzeilen, maar je kunt er wel toegang toe krijgen bij $0 via officiële aanbiedingen. De meest