Gemini 3 frente a ChatGPT 5.1: el sorprendente salto de Google más allá del mejor modelo de OpenAI
Claude McKenzie
Última actualización: 20 de noviembre de 2025
El nuevo de Google Géminis 3 Pro Es un avance tan grande que parece que se ha saltado toda una generación, como si hubiera pasado directamente de 2.5 Pro y aterrizó en algún lugar cercano. GPT-5.1 (no es broma).
En casi todas las pruebas comparativas, el modelo ahora supera a GPT-5.1 y Claude 4.5, superando incluso las pruebas más difíciles orientadas a la AGI, como ARC-AGI-2 y el “exámenes finales para humanos”.” En el AIME 2025 En la prueba de matemáticas, obtuvo una puntuación perfecta de 100 con las herramientas activadas, e incluso superó el famoso LiveCodeBench Pro récord: una prueba que anteriormente había dejado perplejos a todos los demás modelos importantes.
En las clasificaciones de la arena de IA votadas por los usuarios, la historia es la misma. Grok 4.1 de Elon Musk Ayer encabezó las listas de éxitos, y hoy, Géminis 3 Pro ya lo ha superado.
Incluso Sam Altman y Almizcle No pude evitar mostrar mi respeto, tanto públicamente como felicitando al equipo de Google.
De la simulación de interfaces de sistemas operativos a la creación de software real
Durante las pruebas internas, se vio al Gemini 3 simulando una Ventanas, macOS, y Linux interfaces. Al principio, la gente pensó que solo se trataba de una demostración de diseño front-end, pero resultó que los programas que creaba realmente funcionaban.
En una demostración, construyó un completo Editor LEGO desde cero en el primer intento: diseñar la interfaz, el sistema de lógica espacial y todas las funciones básicas de edición de una sola vez.
Y eso fue solo el comienzo.
En otra presentación, Google utilizó Géminis 3 Pro diseñar un juego jugable desde cero y lo publicó en YouTube. La IA había creado básicamente una versión reducida de “Centro de caza menor” por sí solo.
Agentes más inteligentes, resultados reales
Gemini 3 Pro no solo es una potente herramienta de programación, sino que también es mucho mejor en Planificación a largo plazo y simulación de tareas del mundo real..
En una prueba, simuló la gestión de un negocio de máquinas expendedoras durante todo un año, convirtiendo un $5,000 de beneficio — el más alto entre todos los modelos probados.
De arriba abajo: Géminis 3 Pro, Claude Sonnet 4.5, GPT-5.1, Gemini 2.5 Pro.
Lanzamiento a escala de toda la empresa
A partir de hoy, Google ha anunciado que lanzará la totalidad de Serie Gemini 3 “a escala de la empresa”. El primer día, Gemini era:
Totalmente integrado en Búsqueda en Google,
Dado un sistema autónomo aplicación móvil, y
Acompañado por un nuevo Plataforma de desarrollo de agentes de IA.
Y eso no es todo: un más potente Gemini 3 “Deep Think” El modo ya está en camino.
En cuanto a cómo se logró un aumento tan grande en la capacidad, el vicepresidente de Investigación de Google Oriol Vinyals reveló solo una pista:
“El preentrenamiento aún no ha terminado, y el postentrenamiento todavía tiene mucho margen de mejora”.”
La evolución de Gemini: desde su fundación hasta la fusión
Mirando hacia atrás, el Serie Géminis Es como si un personaje de videojuego subiera de nivel: cada generación corrige las debilidades de la anterior y luego lo perfecciona todo de nuevo para la siguiente.
Géminis 1 sentó las bases, conectando la comprensión multimodal y el contexto ultralargo. Se convirtió en el primer modelo capaz de manejar contextos de millones de tokens.
Géminis 2 adquirió capacidad de acción: tras dominar la retención masiva de información, comenzó a sintetizar y planificar a partir de ese conocimiento, sentando las bases para una verdadera agente de IA comportamiento.
Géminis 2.5 Centrado en el razonamiento: Google añadió un “motor de pensamiento” que permite un análisis lógico más profundo, un razonamiento en cadena y una resolución de problemas paso a paso similar a la humana.
Géminis 3 es la culminación, no solo una simple ampliación, sino integración profunda en todas las modalidades, razonamientos y capacidades de agencia. Su lema podría ser: “Tú lo imaginas. Yo lo hago realidad”.”
En particular, Gemini 3 finalmente parece consciente de los seres humanos. — “entiende” lo que quieres decir, no solo lo que escribes.
Ya no tendrás que preocuparte por escribir la pregunta perfecta. Solo tienes que introducir tu solicitud, sin importar lo desordenada que sea, y el sistema captará tu intención, leerá el contexto y responderá con una respuesta clara y directa, sin florituras innecesarias.
Capacidades multimodales en Overdrive
La comprensión multimodal de Gemini 3 está a otro nivel. Ahora puede procesar sin problemas texto, imágenes, vídeo, audio y código, todo al mismo tiempo.
Por ejemplo, si le proporcionas un vídeo completo de un partido deportivo, puede resumir la estrategia, analizar las técnicas de los jugadores e incluso enseñarte a replicar sus movimientos.
No es difícil imaginar un futuro cercano en el que puedas subir tus propios vídeos de entrenamiento y... Gemini 3 se convierte en tu entrenador personal.
En los escenarios de búsqueda, también va más allá de simplemente volcar enlaces. En su lugar, organiza la información en tiempo real en contenido interactivo y útil que responde directamente a tu pregunta.
Antigravity: la nueva plataforma de desarrollo centrada en los agentes de Google
“Libera a los desarrolladores de tareas de programación repetitivas y dales la posibilidad de actuar como arquitectos de alto nivel”.”
Durante la demostración de Google, Antigravity construyó un Aplicación de seguimiento de vuelos en menos de un minuto..
A diferencia de los IDE de IA como Cursor, Antigravity eleva al agente de IA a un entorno independiente con acceso completo al editor, terminal, y navegador. Los agentes pueden planificar, codificar, probar y verificar de forma autónoma software de extremo a extremo, todo ello en nombre del usuario.
Un nuevo Vista del administrador permite a los usuarios coordinar varios agentes a la vez, cada uno de los cuales trabaja de forma semiautónoma.
La ambición de Google en este caso es clara: no se trata solo de una herramienta, sino de una nueva generación de Ingeniería de software basada en inteligencia artificial.
Ecosistema abierto y fiebre de desarrolladores
Antigravity es compatible no solo con los modelos Gemini, sino también con otros de terceros, como GPT-OSS y Claude.
Actualmente se encuentra en vista previa pública y de uso gratuito, con “límites de tarifa generosos” para Gemini 3 Pro. Como era de esperar, los desarrolladores se apresuraron a “aprovechar” el uso gratuito en cuanto se lanzó.
Para contextualizar, Código Claude ya representa aproximadamente 21% de los ingresos totales de Anthropic, y OpenAI continúa expandiéndose en torno a los productos basados en el Codex.
No es de extrañar que Herramientas de codificación de IA se perfilan como el próximo gran campo de batalla.
En resumen
Gemini 3 Pro representa un momento decisivo: un modelo que no solo pensar mejor, pero actúa de forma más inteligente. En combinación con Antigravity, Google está dejando clara su intención de liderar no solo la carrera multimodal, sino también la era de los agentes inteligentes.
El mejor modelo de ChatGPT en 2025 depende totalmente de tu flujo de trabajo específico, más que de un número de versión concreto. Para tareas complejas