Gemini 3 против ChatGPT 5.1: шокирующий скачок Google, превосходящий лучшую модель OpenAI
Клод МакКензи
Последнее обновление 2025-11-20
Новый продукт Google Gemini 3 Pro это такой огромный скачок вперед, что кажется, будто пропущено целое поколение — как будто он перескочил прямо через 2.5 Pro и приземлился где-то рядом GPT-5.1 (без шуток).
Почти по всем показателям эта модель теперь превосходит GPT-5.1 и Клод 4.5, превосходя даже самые сложные тесты, ориентированные на AGI, такие как ARC-AGI-2 и “итоговые экзамены”.” На AIME 2025 в тесте по математике он набрал идеальные 100 баллов с включенными инструментами и даже побил печально известный LiveCodeBench Pro рекорд — тест, который ранее ставил в тупик все другие крупные модели.
В рейтинге AI-арен, составленном по результатам голосования пользователей, ситуация аналогична. Grok 4.1 от Илона Маска вчера возглавил чарты — а сегодня, Gemini 3 Pro уже обогнал его.
Даже Сэм Альтман и Мускус не мог не выразить свое уважение, публично похвалив и поздравив команду Google.
От моделирования интерфейсов ОС до создания реального программного обеспечения
Во время внутренних испытаний Gemini 3 был замечен, имитируя полный Окна, macOS, и Linux интерфейсов. Сначала люди думали, что это просто демонстрация дизайна интерфейса, но оказалось, что созданные программы действительно работают.
В одной демонстрации он построил полный Редактор LEGO с нуля с первой попытки — разработка интерфейса, системы пространственной логики и всех основных функций редактирования за один раз.
И это было только начало.
В другой демонстрации Google использовал Gemini 3 Pro создать с нуля игровую игру и выпустить ее на YouTube. ИИ по сути создал мини-версию “Центр мелкой дичи” само по себе.
Более умные агенты, реальные результаты
Gemini 3 Pro — это не только мощный инструмент для программирования, но и гораздо более эффективный долгосрочное планирование и моделирование реальных задач.
В одном из тестов он моделировал управление бизнесом по продаже товаров через торговые автоматы в течение всего года, превратив $5000 прибыли — самый высокий показатель среди всех протестированных моделей.
Сверху вниз: Gemini 3 Pro, Claude Sonnet 4.5, GPT-5.1, Gemini 2.5 Pro.
Запуск в полном масштабе компании
Начиная с сегодняшнего дня, Google объявила о выпуске всего Серия Gemini 3 “на уровне компании”. В первый день Gemini был:
Полностью интегрирован в Поиск Google,
Учитывая автономность мобильное приложение, и
В сопровождении нового Платформа для разработки ИИ-агентов.
И это еще не все — более мощный Gemini 3 “Deep Think” режим уже включен.
Что касается того, как был достигнут такой огромный скачок в производительности, вице-президент Google по исследованиям Ориол Виньяльс раскрыл только одну зацепку:
“Предварительная подготовка еще не завершена, а последующая подготовка все еще имеет большой потенциал для улучшения”.”
Эволюция Gemini: от основания до слияния
Оглядываясь назад, Серия Gemini Это похоже на повышение уровня персонажа в игре — каждое поколение исправляет слабые стороны предыдущего, а затем снова дорабатывает все для следующего.
Близнецы 1 заложила основу — соединив мультимодальное понимание и сверхдлинный контекст. Она стала первой моделью, способной обрабатывать контексты с миллионами токенов.
Близнецы 2 приобрела способность действовать — после освоения массового хранения информации она начала синтезировать и планировать на основе этих знаний, заложив основу для истинного ИИ-агент поведение.
Близнецы 2.5 сосредоточен на рассуждениях — Google добавил “мыслительный движок”, позволяющий проводить более глубокий логический анализ, цепочку рассуждений и пошаговое решение проблем, подобное человеческому.
Близнецы 3 является кульминацией — не просто грубое масштабирование, а глубокая интеграция по всем модальностям, способам мышления и способностям агента. Его девиз мог бы звучать так: “Вы представляете это. Я воплощаю это в реальность”.”
В частности, Gemini 3 наконец-то научился понимать людей — он “понимает” то, что вы имеете в виду, а не только то, что вы набираете.
Вам больше не нужно переживать по поводу написания идеального запроса. Просто введите свой беспорядочный запрос, и он поймет ваш замысел, прочитает контекст и ответит четким, прямым ответом — без лишних слов.
Мультимодальные возможности на Overdrive
Мультимодальное понимание Gemini 3 вышло на новый уровень. Теперь он может беспрепятственно обрабатывать текст, изображения, видео, аудио и код одновременно.
Например, загрузите в него полное видео спортивного матча, и он сможет обобщить стратегию, проанализировать технику игроков и даже научить вас повторять их движения.
Несложно представить себе ближайшее будущее, в котором вы сможете загружать свои собственные тренировочные видеозаписи — и Gemini 3 станет вашим личным тренером.
В сценариях поиска он также выходит за рамки простого вывода ссылок. Вместо этого он организует информацию в режиме реального времени в интерактивный, полезный контент который напрямую отвечает на ваш вопрос.
Антигравитация: новая платформа Google для разработки с приоритетом на агентах
“Освободите разработчиков от повторяющихся задач кодирования и дайте им возможность действовать как высококлассные архитекторы”.”
Во время демонстрации Google компания Antigravity создала приложение для отслеживания рейсов менее чем за минуту.
В отличие от IDE с искусственным интеллектом, таких как Курсор, Antigravity поднимает ИИ-агента на уровень автономной среды с полным доступом к редактор, терминал, и браузер. Агенты могут самостоятельно планировать, кодировать, тестировать и проверять программное обеспечение от начала до конца — и все это от имени пользователя.
Новый Вид менеджера позволяет пользователям координировать работу нескольких агентов одновременно, каждый из которых работает полуавтономно.
Амбиции Google в этом случае ясны: это не просто инструмент — это новое поколение Программная инженерия на основе искусственного интеллекта.
Открытая экосистема и ажиотаж разработчиков
Antigravity поддерживает не только модели Gemini, но и модели сторонних производителей, такие как GPT-OSS и Клод.
В настоящее время он находится в публичный предварительный просмотр и бесплатно использовать, с “щедрыми лимитами” для Gemini 3 Pro. Неудивительно, что разработчики поспешили “накопить” бесплатное использование сразу же после запуска.
Для контекста, Код Клода уже составляет около 21% от общей выручки Anthropic, и OpenAI продолжает расширяться вокруг продуктов, основанных на Codex.
Неудивительно, что Инструменты для кодирования ИИ становятся следующим крупным полем битвы.
Итог
Gemini 3 Pro представляет собой переломный момент — модель, которая не просто думать лучше, но действует умнее. В сочетании с Antigravity Google явно сигнализирует о своем намерении лидировать не только в мультимодальной гонке, но и в эпохе интеллектуальных агентов.
Poe AI - это инструмент, созданный Quora, который позволяет использовать множество различных моделей искусственного интеллекта, таких как Claude и GPT.