Я не сомкнул глаз во время презентации I/O, и когда Google представила Gemini 3.5 Flash, мне пришлось перемотать запись.
Ярус "Флэш" всегда был “Достаточно хорошо, дешево, быстро” в линейке. На этот раз Google утверждала, что он превосходит предыдущий уровень Pro - не по каким-то отдельным показателям, а по большинству бенчмарков кодирования и агентов.
Подобные объявления обычно проходят по одному из двух путей. Либо поставщик выбирает график, который ему нравится, либо что-то действительно изменилось. Поэтому, как только мы добавили Gemini 3.5 Flash в GlobalGPT, я потратил около двух недель на реальную работу с ним - исследования, слайд-деки, многоступенчатые задания в стиле агента, то есть на то, что я обычно распределяю между тремя разными подписками. Вот что я обнаружил, а также сравнение с GPT-5.5 и Claude Opus 4.7.
TL;DR
Краткая версия, для тех, кто читает:
- Если ваша работа управляемый агентами - многоэтапное исследование, получение информации из нескольких источников, чтение графиков и PDF-файлов - переключитесь на 3.5 Flash. На данный момент это лучшее в своем классе.
- Если вы написание длинных текстов или анализ реальных кодовых баз, придерживаться Клод Опус 4.7.
- Если вам нужно рассуждения пограничного класса (головоломки в стиле ARC-AGI, новые исследовательские проблемы), ждать Gemini 3.5 Pro в следующем месяце.
- Если вам нужно быстрая повседневная модель, выбирать Gemini 3.5 Flash сейчас. Он обеспечивает скорость вывода примерно в 4 раза выше, чем GPT-5.5 и Claude Opus 4.7.
Хотите попробовать? Gemini 3.5 Flash в прямом эфире на GlobalGPT. Новые аккаунты получают 3 бесплатных запуска - кредитная карта не требуется. Платформа удобна для сравнения, поскольку GPT-5.5, Claude Opus 4.7 и ~100 других моделей находятся в одном окне чата. Одна подписка, один интерфейс, никакого жонглирования.

Что такое Gemini 3.5 Flash?
Gemini 3.5 Flash - первая модель нового семейства Gemini 3.5, представленная на Google I/O 19 мая 2026 года.. Gemini 3.5 Pro появится в дорожной карте в следующем месяце, хотя Google не уточнила точную дату.

Исторически “вспышка” в стране Близнецов означала: быстрее, дешевле, менее умные. Этот выпуск ломает эту схему. Google использует следующие принципы “Интеллект профессионального уровня на скорости Flash”.” что является смелым заявлением для любого производителя. Данные в основном подтверждают его.
Представляем семейство Gemini 3.5
Сайт Семейство Gemini 3.5 Представляет собой следующий большой скачок Google в области искусственного интеллекта, создавая модели, сочетающие в себе интеллект передового уровня и молниеносное исполнение. Созданное специально для выполнения сложных многоэтапных агентских рабочих процессов и передовой программной инженерии, семейство Gemini 3.5 предназначено для того, чтобы действовать, а не просто реагировать.

Основные модели и характеристики
- Gemini 3.5 Flash: Флагманская модель по скорости и эффективности. Она обеспечивает современную производительность при генерации кода, рассуждениях и обработке длинных контекстов (поддерживая Контекстное окно на 1 миллион жетонов), при этом работая в 4 раза быстрее, чем аналогичные модели Frontier. Он отлично справляется с тяжелой работой в течение длительного времени, не заставляя пользователей выбирать между качеством и скоростью.
- Gemini 3.5 Pro: Готовящаяся к выпуску сверхмощная модель Google (первоначально развернутая внутри компании и распространяемая повсеместно), предназначенная для максимальной глубины рассуждений, масштабного мультимодального понимания и обработки сложных корпоративных рабочих процессов.
Фокус на “агентном” ИИ: В отличие от старых статических LLM, экосистема Gemini 3.5 изначально оптимизирована для автономных агентов. В ней процветают многоэтапные проекты, виброкодирование, извлечение данных и интеграция инструментов с помощью новейших платформ разработчиков Google.
Спецификация Gemini 3.5 Flash
| Gemini 3.5 Flash Feature | Спецификация |
|---|---|
| Дата выхода | 19 мая 2026 года (Google I/O) |
| Семейство моделей | Gemini 3.5 (уровень Flash) |
| Окно контекста | 1,048,576 токенов (~1M) |
| Максимальная производительность | 65 536 токенов |
| Входные модальности | Текст, изображение, аудио, видео, PDF |
| Отбор знаний | Январь 2026 года |
| Скорость выхода | На ~4× быстрее, чем у конкурирующих флагманов |
| Лучшее в | Агентские рабочие процессы, мультимодальные, кодирование, финансовые рассуждения |
Контекстное окно 1M имеет большее значение, чем можно предположить по заголовку. В большинстве флагманских моделей объем полезного поиска составляет около 128 Кбайт. Flash справляется со значительно большим объемом, что очень важно для любого рабочего процесса, связанного с длинными PDF-файлами или сшитыми исследованиями.
Бенчмарки Gemini 3.5 Flash: где он выигрывает, где нет
Начнем с побед. В опубликованной Google таблице бенчмарков 3.5 Flash выигрывает у Gemini 3.1 Pro, Claude Opus 4.7 и GPT-5.5 в пяти бенчмарках одновременно. Маленькая модель, побеждающая сразу трех флагманских конкурентов, не случалась в последние пару лет.
Куда ведет Gemini 3.5 Flash
| Эталон | Gemini 3.5 Flash | 3.1 Про | Что проверяет |
|---|---|---|---|
| Атлас MCP | 83.6% | 78.2% | Надежный вызов инструмента в масштабе |
| Toolathlon | 56.5% | - | Оркестровка с помощью нескольких инструментов |
| Финансовый агент v2 | 57.9% | 43.0% | Агенты, рассуждающие о финансах |
| CharXiv Reasoning | 84.2% | - | Понимание диаграмм и рисунков |
| MMMU-Pro | 83.6% | - | Мультимодальное понимание |
| ВВПвал-АА (Эло) | 1656 | 1314 | Реальные задачи агентов |
| Terminal-Bench 2.1 | 76.2% | 70.3% | Кодирование с помощью терминала/CLI |
Цифры - это абстракция, так что вот вам кое-что конкретное. На прошлой неделе я дал ему задание: взять последние 10-квартальные отчеты трех публичных SaaS-компаний, извлечь валовую маржу и расходы на садо-мазо, построить сравнительную таблицу, отметить самые большие изменения по сравнению с прошлым годом. 3.5 Flash самостоятельно спланировал все шаги - поиск по записям, разбор чисел, создание таблицы. Одна попытка, около 90 секунд. Я дал тот же запрос Claude Opus 4.7 на следующей вкладке, и он заглох на втором предприятии, мне пришлось подталкивать его лучшими условиями поиска, прежде чем он нашел то, что ему нужно.
Этот разрыв - Flash с 83,6% на MCP Atlas против большинства конкурентов, болтающихся в районе 70-х - так быстро проявляется в реальной работе.
Gemini 3.5 Flash все еще отстает от 3.1 Pro
- Последний экзамен человечества (Пограничные рассуждения)
- ARC-AGI-2 (абстрактное мышление)
- 128K MRCR v2 (очень длинный контекстный поиск)
Это самые сложные бенчмарки для чистого интеллекта, и 3.5 Flash проигрывает во всех трех.
Он отлично справляется с оркестровкой инструментов и объединением информации, но это не модель для новых абстрактных рассуждений. Это также объясняет, почему некоторые разработчики все еще заботятся о Кодирование Gemini 3.1 Pro производительность: 3.1 Pro, возможно, не так быстр и агент-натив, как Flash, но он остается актуальным в задачах, где более глубокие рассуждения и надежность длинного контекста имеют большее значение, чем скорость. Google более или менее признает это - 3.5 Pro выходит в следующем месяце, и, предположительно, именно в нем они ликвидируют пробел в рассуждениях.
Две недели спустя: что не отражают контрольные показатели
Контрольные показатели - это одна история. Повседневное использование рассказывает другую. Вот что выделяется помимо цифр.
Что она делает хорошо
- Вызов инструмента - это заголовок. Я регулярно провожу исследования, в ходе которых модель должна выполнить поиск, получить несколько URL-адресов, разобрать содержимое, выполнить некоторые математические вычисления и вернуть структурированный результат. На GPT-5.5 этот рабочий процесс удавался примерно в 80% случаев - неудачи обычно заключались в том, что модель пропускала шаг или придумывала ответ, когда поиск не давал желаемого результата. На Gemini 3.5 Flash успех с первой попытки приближается к 95%. Я перенес весь рабочий процесс.
- Долго выполняемые задания завершаются. Google описывает это как “долгосрочные агентурные задачи”, что звучит как маркетинговая копия, но это не так. Задача из 6-8 шагов, которую 3.1 Pro иногда бросала на полпути, завершается Gemini 3.5 Flash. Для тех, кто работает с производственными рабочими процессами, это не показатель - это разница между тем, что работает, и тем, что нуждается в постоянном присмотре.
- Скорость - это реальность. При интерактивном использовании разница между Flash и более медленными флагманами очевидна. Для всего, что основано на чате или итерациях - составление проекта, мозговой штурм, сравнение вариантов - это меняет то, насколько удобной кажется модель.
Что у нее не получается
- Длинноформатное письмо заметно слабее, чем у Клода. Я попросил его провести анализ рынка объемом 5 000 слов. Структура была прекрасной, но проза - плоской. Claude Opus 4.7 пишет ритмично - предложения разной длины, естественные разнообразные переходы, такой стиль письма, который не замечаешь. Flash пишет так, будто кто-то попал в критерии задания. Если вы готовите много письменного контента для публикации, Claude все равно будет правильным инструментом.
- Модификация реальных кодовых баз - вот где его недостаток. Я дал ему проект с открытым исходным кодом и попросил закрыть проблему. Он исправлял ошибку, но вносил регрессию в другое место. Opus 4.7 не допускает такой ошибки - об этом говорит разрыв в SWE-bench Verified. Для серьезной инженерной работы пока остановитесь на Claude.
- Неанглийское исполнение: Я тестировал в основном на английском языке. Вывод на китайском значительно лучше, чем у Gemini 3-го поколения, но все еще суше, чем у Claude Sonnet 4.6 на прозе. Я бы хотел получить большую выборку, чтобы сказать больше, но отмечу его для тех, кто работает с многоязычным контентом.
Скорость, цены и почему это важно для большинства людей
Заявленная Google скорость - это та часть, которая удивила меня больше всего в повседневном использовании. Gemini 3.5 Flash работает примерно в 4 раза быстрее на выходных токенах, чем конкурирующие флагманы. В бенчмарках это число. В реальном использовании это разница между “мгновенным откликом” и “зависанием на мгновение” - и это мгновение увеличивается, когда вы выполняете 20-30 запросов в течение дня.

В Искусственный анализ’ официальный эталон выходной скорости, Gemini 3.5 Flash звания третий, уступая GPT-OSS-120B и GPT-OSS-20B. Это означает, что GPT-OSS быстрее по количеству токенов в секунду, но это не значит, что заявления Gemini о скорости вводят в заблуждение.
- “Быстрый” - это не только скорость вывода; он также зависит от общая задержка, мультимодальная обработка, работа с длинными контекстами, качество рассуждений, стабильность и надежность производства.
- GPT-OSS отлично подходит для сверхбыстрой и высокопроизводительной генерации текстов, а Gemini 3.5 Flash Баланс между высокой скоростью и более широкими возможностями, такими как мультимодальный ввод, понимание длинного контекста и более продвинутое выполнение задач общего назначения.

В качестве примера можно привести цены на публичный API в сравнении с другими флагманами 2026 года (Google, Anthropic и OpenAI взимают плату напрямую через свои API):
| Модель | Вход ($/1M) | Выход ($/1M) | Примечания |
|---|---|---|---|
| Gemini 3.5 Flash | $1.50 | $9.00 | Тема этой статьи |
| Клод Опус 4.7 | $5.00 | $25.00 | Антропологический флагман |
| GPT-5.5 | $5.00 | $30.00 | Флагман OpenAI |
| Сонет Клода 4.6 | ~$3 | ~$15 | Антропный средний уровень |
| DeepSeek V4 Pro | Нижний | Нижний | Самый дешевый вариант с открытым весом |
Почему это важно, даже если вы не покупаете API-кредиты напрямую: это базовая экономика, определяющая, к каким моделям вы можете получить доступ и на каком уровне. ChatGPT Plus по цене $20/месяц охватывает семейство GPT. Claude Pro по цене $20/месяц охватывает Claude. Gemini Advanced за $20/месяц охватывает Gemini. Если вам нужны все три плюс Perplexity и хорошая имиджевая модель, вы получаете $80+/месяц за четыре подписки - и вы будете переключаться между четырьмя разными пользовательскими интерфейсами каждый раз, когда захотите сравнить ответы.
Именно эту задачу решает GlobalGPT. Одна подписка, все в одном чате. Вы увидите, почему я постоянно возвращаюсь к этому вопросу, в разделе ниже.
Gemini 3.5 Flash vs GPT-5.5 vs Claude Opus 4.7: когда что использовать
Этот вопрос я получаю чаще всего. Вот шпаргалка, основанная на том, что я увидел за две недели бокового тестирования:
| Тип задачи | Используйте | Почему |
|---|---|---|
| Многоэтапное исследование | Gemini 3.5 Flash | 83.6% MCP Atlas - лучший инструмент для фрезерования на рынке |
| Диаграммы, рисунки, видео, PDF-файлы | Gemini 3.5 Flash | CharXiv 84.2%, MMMU-Pro 83.6% - мультимодальный является родным и сильным |
| Написание длинных текстов (эссе, отчеты) | Клод Опус 4.7 | Улучшение ритма и структуры прозы |
| Разработка программного обеспечения на реальных кодовых базах | Клод Опус 4.7 | 87.6% SWE-bench Verified - по-прежнему стандарт |
| Быстрые задачи по кодированию, скрипты, CLI | Gemini 3.5 Flash | 76.2% Терминал-стенд, и достаточно быстро, чтобы почувствовать интерактивность |
| Поиск по длинному контексту (>128K) | Gemini 3.1 Pro | 3.1 Pro по-прежнему выигрывает на MRCR v2 после 128K |
| Рассуждения пограничного класса | Подождите 3.5 Pro или используйте 3.1 Pro | Флэш-лоссы на "Последнем экзамене человечества" и ARC-AGI-2 |
| Все, где важна скорость | Gemini 3.5 Flash | Производительность ~4× выше, чем у других флагманов |
Вот мое мнение: для большинства реальных рабочих нагрузок по умолчанию следует использовать Gemini 3.5 Flash, а Opus 4.7 или GPT-5.5 - в качестве исключения, когда Flash недостаточно. Шесть месяцев назад я бы перевернул это мнение - Pro-уровни были по умолчанию, Flash - бюджетный вариант. Gemini 3.5 Flash перевернул эти отношения.
Это не значит, что Claude Opus 4.7 мертв. Это по-прежнему модель для разработки программного обеспечения на реальных кодовых базах, и он пишет лучшую прозу. Но если ваша работа в основном связана с поиском, извлечением структурированных данных, сравнением источников и получением готовых к принятию решений результатов - Сейчас Flash - лучший инструмент.
Как на самом деле попробовать Gemini 3.5 Flash
Несколько путей, в зависимости от того, что вы хотите сделать:
- Приложение Gemini или режим искусственного интеллекта Search AI Mode. Бесплатно, требует учетной записи Google. Хорошо подходит для случайных подсказок, но нет возможности сравнить с другими моделями

- Gemini Advanced ($20/месяц). Потребительская подписка Google. Вы получаете Gemini 3.5 Flash и уровни Pro, но вы заблокированы только на моделях Google.
Однако у этих двух способов использования Gemini 3.5 Flash есть существенные проблемы, поскольку Gemini имеет строгие ограничения по региональному доступу, что затрудняет многим пользователям вход в систему или непосредственное использование сервиса.

Поэтому я рекомендую вам третий способ.
- GlobalGPT. Все по одной подписке, все в одном окне чата. Новые подписчики получают 3 бесплатных запуска Gemini 3.5 Flash. Для старта не требуется кредитная карта.
- Пользователи могут получить доступ к Gemini без установки VPN, а также изучить широкий спектр передовых моделей искусственного интеллекта на одной платформе.
- Gemini 3.5 Flash стоит в одном ряду с GPT-5.5, Claude Opus 4.7, Claude Sonnet 4.6, GPT Image 2, Seedance 2.0 и ~100 другими моделями.
Именно с помощью этого третьего варианта я и проводил сравнение для этой статьи. Чтобы запустить ту же самую подсказку в Gemini 3.5 Flash, GPT-5.5 и Claude Opus 4.7 любым другим способом, нужно подписаться на Gemini Advanced ($20), ChatGPT Plus ($20) и Claude Pro ($20) отдельно. $60 в месяц, три отдельных аккаунта, три разных интерфейса чата и цикл копирования-вставки каждый раз, когда вы хотите сравнить ответы. В GlobalGPT это выпадающий список.
В этом и заключается ценность платформ "все в одном": они не заменяют базовые модели, а просто избавляют вас от трения, связанного с доступом к ним. Если вы используете только одну модель, вам подойдет подписка на одного поставщика. Если вы сравниваете модели - или хотите получить доступ к лучшей модели для каждой задачи. Агрегатор быстро окупается.
Попробуйте Gemini 3.5 Flash на GlobalGPT - 3 бесплатных генерации при регистрации. Плюс GPT-5.5, Claude Opus 4.7 и еще 100 моделей в одном чате.

Заключение:Стоит ли вам переходить?
- Если ваша основная работа - многоэтапные исследования, мультимодальный анализ или любые задачи агентского типа с использованием инструментов - да. Он быстрее, это подтверждают бенчмарки, и две недели реального тестирования подтвердили это. Нет никаких причин оставаться на GPT-5.5 или Opus 4.7 для такой работы.
- Если ваша основная работа - это написание статей для публикаций или проектирование кодовой базы, остановитесь на Claude Opus 4.7.
- Если ваша основная работа - рассуждения исследовательского характера, дождитесь Gemini 3.5 Pro в следующем месяце.
Самый быстрый способ решить эту проблему - взять несколько актуальных заданий за последнюю неделю и прогнать их через все три модели. Контрольные показатели - это совокупность. Ваш рабочий процесс - ваш.
Проще всего провести такое сравнение на GlobalGPT - одна подписка, все три модели в одном чате, плюс 100 других. Новые аккаунты получают 3 бесплатных поколения Gemini 3.5 Flash для начала. Без кредитной карты.
FAQ: Дополнительная информация о Gemini 3.5 Flash
Является ли Gemini 3.5 Flash лучше, чем Gemini 3.1 Pro?
В рабочих процессах агентов, задачах кодирования, мультимодальном анализе и использовании инструментов Gemini 3.5 Flash превосходит Gemini 3.1 Pro в большинстве бенчмарков, рассмотренных выше. Кроме того, она значительно быстрее в повседневном использовании. Однако Gemini 3.1 Pro все еще имеет преимущество в некоторых сложных задачах, связанных с рассуждениями и поиском длинных контекстов.
Когда Gemini 3.5 Pro появится в продаже?
Запуск Gemini 3.5 Pro ожидается в следующем месяце, но Google пока не называет точную дату релиза. Судя по текущему позиционированию, Gemini 3.5 Pro, скорее всего, будет больше ориентирован на пограничные рассуждения, решение абстрактных проблем и самые сложные задачи исследовательского типа, в то время как Gemini 3.5 Flash уже доступен для быстрой работы с агентами и мультимодального использования.
В чем разница между Gemini Flash и Gemini Pro?
Серия Flash создана для скорости, низкой стоимости и больших объемов практической работы. Она лучше всего подходит для исследований, использования инструментов, мультимодального анализа, быстрого кодирования и повседневной работы в агентском стиле. Серия Pro обычно позиционируется как более мощный уровень рассуждений, лучше подходящий для решения сложных абстрактных задач, рассуждений пограничного уровня и более сложных задач, где максимальный интеллект важнее скорости.



