Gemini 3.5 Flash, две недели спустя: Действительно ли Google только что победила свой собственный профессиональный уровень?

2026-05-25
02:37
Хлоя Мерфи
Последнее обновление: 08.06.2026

Я не сомкнул глаз во время презентации I/O, и когда Google представила Gemini 3.5 Flash, мне пришлось перемотать запись.

Ярус "Флэш" всегда был “Достаточно хорошо, дешево, быстро” в линейке. На этот раз Google утверждала, что он превосходит предыдущий уровень Pro - не по каким-то отдельным показателям, а по большинству бенчмарков кодирования и агентов.

Подобные объявления обычно проходят по одному из двух путей. Либо поставщик выбирает график, который ему нравится, либо что-то действительно изменилось. Поэтому, как только мы добавили Gemini 3.5 Flash в GlobalGPT, я потратил около двух недель на реальную работу с ним - исследования, слайд-деки, многоступенчатые задания в стиле агента, то есть на то, что я обычно распределяю между тремя разными подписками. Вот что я обнаружил, а также сравнение с GPT-5.5 и Claude Opus 4.7.

TL;DR

Краткая версия, для тех, кто читает:

Если ваша работа управляемый агентами - многоэтапное исследование, получение информации из нескольких источников, чтение графиков и PDF-файлов - переключитесь на 3.5 Flash. На данный момент это лучшее в своем классе.
Если вы написание длинных текстов или анализ реальных кодовых баз, придерживаться Клод Опус 4.7.
Если вам нужно рассуждения пограничного класса (головоломки в стиле ARC-AGI, новые исследовательские проблемы), ждать Gemini 3.5 Pro в следующем месяце.
Если вам нужно быстрая повседневная модель, выбирать Gemini 3.5 Flash сейчас. Он обеспечивает скорость вывода примерно в 4 раза выше, чем GPT-5.5 и Claude Opus 4.7.

Хотите попробовать? Gemini 3.5 Flash в прямом эфире на GlobalGPT. Новые аккаунты получают 3 бесплатных запуска - кредитная карта не требуется. Платформа удобна для сравнения, поскольку GPT-5.5, Claude Opus 4.7 и ~100 других моделей находятся в одном окне чата. Одна подписка, один интерфейс, никакого жонглирования.

Хотите попробовать? Gemini 3.5 Flash в прямом эфире на GlobalGPT. Новые аккаунты получают 3 бесплатных запуска - кредитная карта не требуется. Что делает платформу полезной для подобного сравнения, так это то, что GPT-5.5, Claude Opus 4.7 и ~100 других моделей находятся прямо в одном окне чата. Одна подписка, один интерфейс, никакого жонглирования.

Попробуйте Gemini 3.5 Flash Free на GlobalGPT

Что такое Gemini 3.5 Flash?

Gemini 3.5 Flash - первая модель нового семейства Gemini 3.5, представленная на Google I/O 19 мая 2026 года.. Gemini 3.5 Pro появится в дорожной карте в следующем месяце, хотя Google не уточнила точную дату.

Gemini 3.5 Flash - первая модель нового семейства Gemini 3.5, представленного на Google I/O 19 мая 2026 года.

Исторически “вспышка” в стране Близнецов означала: быстрее, дешевле, менее умные. Этот выпуск ломает эту схему. Google использует следующие принципы “Интеллект профессионального уровня на скорости Flash”.” что является смелым заявлением для любого производителя. Данные в основном подтверждают его.

Представляем семейство Gemini 3.5

Сайт Семейство Gemini 3.5 Представляет собой следующий большой скачок Google в области искусственного интеллекта, создавая модели, сочетающие в себе интеллект передового уровня и молниеносное исполнение. Созданное специально для выполнения сложных многоэтапных агентских рабочих процессов и передовой программной инженерии, семейство Gemini 3.5 предназначено для того, чтобы действовать, а не просто реагировать.

Семейство Gemini 3.5 представляет собой следующий значительный скачок Google в области искусственного интеллекта. В нем реализованы модели, сочетающие в себе передовой уровень интеллекта и молниеносное исполнение. Созданное специально для выполнения сложных, многоэтапных агентских рабочих процессов и передовой программной инженерии, семейство Gemini 3.5 предназначено для того, чтобы действовать, а не просто реагировать.

Основные модели и характеристики

Gemini 3.5 Flash: Флагманская модель по скорости и эффективности. Она обеспечивает современную производительность при генерации кода, рассуждениях и обработке длинных контекстов (поддерживая Контекстное окно на 1 миллион жетонов), при этом работая в 4 раза быстрее, чем аналогичные модели Frontier. Он отлично справляется с тяжелой работой в течение длительного времени, не заставляя пользователей выбирать между качеством и скоростью.
Gemini 3.5 Pro: Готовящаяся к выпуску сверхмощная модель Google (первоначально развернутая внутри компании и распространяемая повсеместно), предназначенная для максимальной глубины рассуждений, масштабного мультимодального понимания и обработки сложных корпоративных рабочих процессов.

Фокус на “агентном” ИИ: В отличие от старых статических LLM, экосистема Gemini 3.5 изначально оптимизирована для автономных агентов. В ней процветают многоэтапные проекты, виброкодирование, извлечение данных и интеграция инструментов с помощью новейших платформ разработчиков Google.

Спецификация Gemini 3.5 Flash

Gemini 3.5 Flash Feature	Спецификация
Дата выхода	19 мая 2026 года (Google I/O)
Семейство моделей	Gemini 3.5 (уровень Flash)
Окно контекста	1,048,576 токенов (~1M)
Максимальная производительность	65 536 токенов
Входные модальности	Текст, изображение, аудио, видео, PDF
Отбор знаний	Январь 2026 года
Скорость выхода	На ~4× быстрее, чем у конкурирующих флагманов
Лучшее в	Агентские рабочие процессы, мультимодальные, кодирование, финансовые рассуждения

Контекстное окно 1M имеет большее значение, чем можно предположить по заголовку. В большинстве флагманских моделей объем полезного поиска составляет около 128 Кбайт. Flash справляется со значительно большим объемом, что очень важно для любого рабочего процесса, связанного с длинными PDF-файлами или сшитыми исследованиями.

Бенчмарки Gemini 3.5 Flash: где он выигрывает, где нет

Начнем с побед. В опубликованной Google таблице бенчмарков 3.5 Flash выигрывает у Gemini 3.1 Pro, Claude Opus 4.7 и GPT-5.5 в пяти бенчмарках одновременно. Маленькая модель, побеждающая сразу трех флагманских конкурентов, не случалась в последние пару лет.

Куда ведет Gemini 3.5 Flash

Эталон	Gemini 3.5 Flash	3.1 Про	Что проверяет
Атлас MCP	83.6%	78.2%	Надежный вызов инструмента в масштабе
Toolathlon	56.5%	-	Оркестровка с помощью нескольких инструментов
Финансовый агент v2	57.9%	43.0%	Агенты, рассуждающие о финансах
CharXiv Reasoning	84.2%	-	Понимание диаграмм и рисунков
MMMU-Pro	83.6%	-	Мультимодальное понимание
ВВПвал-АА (Эло)	1656	1314	Реальные задачи агентов
Terminal-Bench 2.1	76.2%	70.3%	Кодирование с помощью терминала/CLI

Цифры - это абстракция, так что вот вам кое-что конкретное. На прошлой неделе я дал ему задание: взять последние 10-квартальные отчеты трех публичных SaaS-компаний, извлечь валовую маржу и расходы на садо-мазо, построить сравнительную таблицу, отметить самые большие изменения по сравнению с прошлым годом. 3.5 Flash самостоятельно спланировал все шаги - поиск по записям, разбор чисел, создание таблицы. Одна попытка, около 90 секунд. Я дал тот же запрос Claude Opus 4.7 на следующей вкладке, и он заглох на втором предприятии, мне пришлось подталкивать его лучшими условиями поиска, прежде чем он нашел то, что ему нужно.

Этот разрыв - Flash с 83,6% на MCP Atlas против большинства конкурентов, болтающихся в районе 70-х - так быстро проявляется в реальной работе.

Gemini 3.5 Flash все еще отстает от 3.1 Pro

Последний экзамен человечества (Пограничные рассуждения)
ARC-AGI-2 (абстрактное мышление)
128K MRCR v2 (очень длинный контекстный поиск)

Это самые сложные бенчмарки для чистого интеллекта, и 3.5 Flash проигрывает во всех трех.

Он отлично справляется с оркестровкой инструментов и объединением информации, но это не модель для новых абстрактных рассуждений. Это также объясняет, почему некоторые разработчики все еще заботятся о Кодирование Gemini 3.1 Pro производительность: 3.1 Pro, возможно, не так быстр и агент-натив, как Flash, но он остается актуальным в задачах, где более глубокие рассуждения и надежность длинного контекста имеют большее значение, чем скорость. Google более или менее признает это - 3.5 Pro выходит в следующем месяце, и, предположительно, именно в нем они ликвидируют пробел в рассуждениях.

Две недели спустя: что не отражают контрольные показатели

Контрольные показатели - это одна история. Повседневное использование рассказывает другую. Вот что выделяется помимо цифр.

Что она делает хорошо

Вызов инструмента - это заголовок. Я регулярно провожу исследования, в ходе которых модель должна выполнить поиск, получить несколько URL-адресов, разобрать содержимое, выполнить некоторые математические вычисления и вернуть структурированный результат. На GPT-5.5 этот рабочий процесс удавался примерно в 80% случаев - неудачи обычно заключались в том, что модель пропускала шаг или придумывала ответ, когда поиск не давал желаемого результата. На Gemini 3.5 Flash успех с первой попытки приближается к 95%. Я перенес весь рабочий процесс.
Долго выполняемые задания завершаются. Google описывает это как “долгосрочные агентурные задачи”, что звучит как маркетинговая копия, но это не так. Задача из 6-8 шагов, которую 3.1 Pro иногда бросала на полпути, завершается Gemini 3.5 Flash. Для тех, кто работает с производственными рабочими процессами, это не показатель - это разница между тем, что работает, и тем, что нуждается в постоянном присмотре.
Скорость - это реальность. При интерактивном использовании разница между Flash и более медленными флагманами очевидна. Для всего, что основано на чате или итерациях - составление проекта, мозговой штурм, сравнение вариантов - это меняет то, насколько удобной кажется модель.

Что у нее не получается

Длинноформатное письмо заметно слабее, чем у Клода. Я попросил его провести анализ рынка объемом 5 000 слов. Структура была прекрасной, но проза - плоской. Claude Opus 4.7 пишет ритмично - предложения разной длины, естественные разнообразные переходы, такой стиль письма, который не замечаешь. Flash пишет так, будто кто-то попал в критерии задания. Если вы готовите много письменного контента для публикации, Claude все равно будет правильным инструментом.
Модификация реальных кодовых баз - вот где его недостаток. Я дал ему проект с открытым исходным кодом и попросил закрыть проблему. Он исправлял ошибку, но вносил регрессию в другое место. Opus 4.7 не допускает такой ошибки - об этом говорит разрыв в SWE-bench Verified. Для серьезной инженерной работы пока остановитесь на Claude.
Неанглийское исполнение: Я тестировал в основном на английском языке. Вывод на китайском значительно лучше, чем у Gemini 3-го поколения, но все еще суше, чем у Claude Sonnet 4.6 на прозе. Я бы хотел получить большую выборку, чтобы сказать больше, но отмечу его для тех, кто работает с многоязычным контентом.

Скорость, цены и почему это важно для большинства людей

Заявленная Google скорость - это та часть, которая удивила меня больше всего в повседневном использовании. Gemini 3.5 Flash работает примерно в 4 раза быстрее на выходных токенах, чем конкурирующие флагманы. В бенчмарках это число. В реальном использовании это разница между “мгновенным откликом” и “зависанием на мгновение” - и это мгновение увеличивается, когда вы выполняете 20-30 запросов в течение дня.

В Искусственный анализ’ официальный эталон выходной скорости, Gemini 3.5 Flash звания третий, уступая GPT-OSS-120B и GPT-OSS-20B. Это означает, что GPT-OSS быстрее по количеству токенов в секунду, но это не значит, что заявления Gemini о скорости вводят в заблуждение.

“Быстрый” - это не только скорость вывода; он также зависит от общая задержка, мультимодальная обработка, работа с длинными контекстами, качество рассуждений, стабильность и надежность производства.
GPT-OSS отлично подходит для сверхбыстрой и высокопроизводительной генерации текстов, а Gemini 3.5 Flash Баланс между высокой скоростью и более широкими возможностями, такими как мультимодальный ввод, понимание длинного контекста и более продвинутое выполнение задач общего назначения.

В качестве примера можно привести цены на публичный API в сравнении с другими флагманами 2026 года (Google, Anthropic и OpenAI взимают плату напрямую через свои API):

Модель	Вход ($/1M)	Выход ($/1M)	Примечания
Gemini 3.5 Flash	$1.50	$9.00	Тема этой статьи
Клод Опус 4.7	$5.00	$25.00	Антропологический флагман
GPT-5.5	$5.00	$30.00	Флагман OpenAI
Сонет Клода 4.6	~$3	~$15	Антропный средний уровень
DeepSeek V4 Pro	Нижний	Нижний	Самый дешевый вариант с открытым весом

Почему это важно, даже если вы не покупаете API-кредиты напрямую: это базовая экономика, определяющая, к каким моделям вы можете получить доступ и на каком уровне. ChatGPT Plus по цене $20/месяц охватывает семейство GPT. Claude Pro по цене $20/месяц охватывает Claude. Gemini Advanced за $20/месяц охватывает Gemini. Если вам нужны все три плюс Perplexity и хорошая имиджевая модель, вы получаете $80+/месяц за четыре подписки - и вы будете переключаться между четырьмя разными пользовательскими интерфейсами каждый раз, когда захотите сравнить ответы.

Именно эту задачу решает GlobalGPT. Одна подписка, все в одном чате. Вы увидите, почему я постоянно возвращаюсь к этому вопросу, в разделе ниже.

Gemini 3.5 Flash vs GPT-5.5 vs Claude Opus 4.7: когда что использовать

Этот вопрос я получаю чаще всего. Вот шпаргалка, основанная на том, что я увидел за две недели бокового тестирования:

Тип задачи	Используйте	Почему
Многоэтапное исследование	Gemini 3.5 Flash	83.6% MCP Atlas - лучший инструмент для фрезерования на рынке
Диаграммы, рисунки, видео, PDF-файлы	Gemini 3.5 Flash	CharXiv 84.2%, MMMU-Pro 83.6% - мультимодальный является родным и сильным
Написание длинных текстов (эссе, отчеты)	Клод Опус 4.7	Улучшение ритма и структуры прозы
Разработка программного обеспечения на реальных кодовых базах	Клод Опус 4.7	87.6% SWE-bench Verified - по-прежнему стандарт
Быстрые задачи по кодированию, скрипты, CLI	Gemini 3.5 Flash	76.2% Терминал-стенд, и достаточно быстро, чтобы почувствовать интерактивность
Поиск по длинному контексту (>128K)	Gemini 3.1 Pro	3.1 Pro по-прежнему выигрывает на MRCR v2 после 128K
Рассуждения пограничного класса	Подождите 3.5 Pro или используйте 3.1 Pro	Флэш-лоссы на "Последнем экзамене человечества" и ARC-AGI-2
Все, где важна скорость	Gemini 3.5 Flash	Производительность ~4× выше, чем у других флагманов

Вот мое мнение: для большинства реальных рабочих нагрузок по умолчанию следует использовать Gemini 3.5 Flash, а Opus 4.7 или GPT-5.5 - в качестве исключения, когда Flash недостаточно. Шесть месяцев назад я бы перевернул это мнение - Pro-уровни были по умолчанию, Flash - бюджетный вариант. Gemini 3.5 Flash перевернул эти отношения.

Это не значит, что Claude Opus 4.7 мертв. Это по-прежнему модель для разработки программного обеспечения на реальных кодовых базах, и он пишет лучшую прозу. Но если ваша работа в основном связана с поиском, извлечением структурированных данных, сравнением источников и получением готовых к принятию решений результатов - Сейчас Flash - лучший инструмент.

Как на самом деле попробовать Gemini 3.5 Flash

Несколько путей, в зависимости от того, что вы хотите сделать:

Приложение Gemini или режим искусственного интеллекта Search AI Mode. Бесплатно, требует учетной записи Google. Хорошо подходит для случайных подсказок, но нет возможности сравнить с другими моделями
Gemini Advanced ($20/месяц). Потребительская подписка Google. Вы получаете Gemini 3.5 Flash и уровни Pro, но вы заблокированы только на моделях Google.

Однако у этих двух способов использования Gemini 3.5 Flash есть существенные проблемы, поскольку Gemini имеет строгие ограничения по региональному доступу, что затрудняет многим пользователям вход в систему или непосредственное использование сервиса.

Однако при использовании Gemini 3.5 Flash есть существенные проблемы, поскольку Gemini имеет строгие региональные ограничения доступа, из-за чего многие пользователи не могут войти в систему или использовать сервис напрямую.

Поэтому я рекомендую вам третий способ.

GlobalGPT. Все по одной подписке, все в одном окне чата. Новые подписчики получают 3 бесплатных запуска Gemini 3.5 Flash. Для старта не требуется кредитная карта.
- Пользователи могут получить доступ к Gemini без установки VPN, а также изучить широкий спектр передовых моделей искусственного интеллекта на одной платформе.
- Gemini 3.5 Flash стоит в одном ряду с GPT-5.5, Claude Opus 4.7, Claude Sonnet 4.6, GPT Image 2, Seedance 2.0 и ~100 другими моделями.

Именно с помощью этого третьего варианта я и проводил сравнение для этой статьи. Чтобы запустить ту же самую подсказку в Gemini 3.5 Flash, GPT-5.5 и Claude Opus 4.7 любым другим способом, нужно подписаться на Gemini Advanced ($20), ChatGPT Plus ($20) и Claude Pro ($20) отдельно. $60 в месяц, три отдельных аккаунта, три разных интерфейса чата и цикл копирования-вставки каждый раз, когда вы хотите сравнить ответы. В GlobalGPT это выпадающий список.

В этом и заключается ценность платформ "все в одном": они не заменяют базовые модели, а просто избавляют вас от трения, связанного с доступом к ним. Если вы используете только одну модель, вам подойдет подписка на одного поставщика. Если вы сравниваете модели - или хотите получить доступ к лучшей модели для каждой задачи. Агрегатор быстро окупается.

Попробуйте Gemini 3.5 Flash на GlobalGPT - 3 бесплатных генерации при регистрации. Плюс GPT-5.5, Claude Opus 4.7 и еще 100 моделей в одном чате.

Попробуйте Gemini 3.5 Flash Free на GlobalGPT

Заключение:Стоит ли вам переходить?

Если ваша основная работа - многоэтапные исследования, мультимодальный анализ или любые задачи агентского типа с использованием инструментов - да. Он быстрее, это подтверждают бенчмарки, и две недели реального тестирования подтвердили это. Нет никаких причин оставаться на GPT-5.5 или Opus 4.7 для такой работы.
Если ваша основная работа - это написание статей для публикаций или проектирование кодовой базы, остановитесь на Claude Opus 4.7.
Если ваша основная работа - рассуждения исследовательского характера, дождитесь Gemini 3.5 Pro в следующем месяце.

Самый быстрый способ решить эту проблему - взять несколько актуальных заданий за последнюю неделю и прогнать их через все три модели. Контрольные показатели - это совокупность. Ваш рабочий процесс - ваш.

Проще всего провести такое сравнение на GlobalGPT - одна подписка, все три модели в одном чате, плюс 100 других. Новые аккаунты получают 3 бесплатных поколения Gemini 3.5 Flash для начала. Без кредитной карты.

FAQ: Дополнительная информация о Gemini 3.5 Flash

Является ли Gemini 3.5 Flash лучше, чем Gemini 3.1 Pro?

В рабочих процессах агентов, задачах кодирования, мультимодальном анализе и использовании инструментов Gemini 3.5 Flash превосходит Gemini 3.1 Pro в большинстве бенчмарков, рассмотренных выше. Кроме того, она значительно быстрее в повседневном использовании. Однако Gemini 3.1 Pro все еще имеет преимущество в некоторых сложных задачах, связанных с рассуждениями и поиском длинных контекстов.

Когда Gemini 3.5 Pro появится в продаже?

Запуск Gemini 3.5 Pro ожидается в следующем месяце, но Google пока не называет точную дату релиза. Судя по текущему позиционированию, Gemini 3.5 Pro, скорее всего, будет больше ориентирован на пограничные рассуждения, решение абстрактных проблем и самые сложные задачи исследовательского типа, в то время как Gemini 3.5 Flash уже доступен для быстрой работы с агентами и мультимодального использования.

В чем разница между Gemini Flash и Gemini Pro?

Серия Flash создана для скорости, низкой стоимости и больших объемов практической работы. Она лучше всего подходит для исследований, использования инструментов, мультимодального анализа, быстрого кодирования и повседневной работы в агентском стиле. Серия Pro обычно позиционируется как более мощный уровень рассуждений, лучше подходящий для решения сложных абстрактных задач, рассуждений пограничного уровня и более сложных задач, где максимальный интеллект важнее скорости.

Поделиться сообщением:

Gemini 3.5 Flash, две недели спустя: Действительно ли Google только что победила свой собственный профессиональный уровень?

TL;DR