Бесплатно, быстро и в Telegram? Почти: Google обновил свои самые лёгкие модели ИИ
Компания Google представила обновлённые версии своих лёгких моделей искусственного интеллекта — Gemini 2.5 Flash и Gemini 2.5 Flash Lite. Эти решения ориентированы на быстрые повседневные задачи, где важна скорость отклика и экономичность.
Разработчики сделали акцент на повышении эффективности: Gemini 2.5 Flash получила улучшения при работе с инструментами в многоэтапных сценариях, а также показала рост в тесте SWE-Bench Verified, который оценивает навыки программирования, — с 48,9% до 54%. Версия Flash Lite научилась лучше следовать инструкциям, точнее распознавать изображения и аудио, а также формировать более короткие и чёткие ответы.
Экономия ресурсов
Обе модели оптимизированы для снижения количества токенов при работе. По заявлению Google, Gemini 2.5 Flash расходует до 24% меньше, а Flash Lite — до 50%. Это делает их особенно удобными для задач с большим количеством коротких запросов, например, при интеграции в сервисы поддержки или мобильные приложения.
Доступность и цены
Новые версии моделей доступны в Google AI Studio и Vertex AI под названиями Gemini Flash Latest и Gemini Flash Lite Latest.
-
Gemini 2.5 Flash: $0,30 за 1 млн входящих токенов и $2,50 за 1 млн исходящих.
-
Gemini 2.5 Flash Lite: $0,10 за 1 млн входящих и $0,40 за 1 млн исходящих.
Через веб-интерфейс обе модели можно использовать бесплатно.
Приложение Google Gemini App
В официальном аккаунте Google Gemini App было объявлено обновление для версии Flash. Теперь модель в мобильном приложении лучше помогает с домашними заданиями, корректнее форматирует ответы и точнее распознаёт изображения.
При этом в бесплатной версии контекстное окно ограничено 32 тысячами токенов, тогда как в подписке Premium доступно до 1 миллиона токенов.
Сравнение: Gemini 2.5 Flash и Flash Lite
|Модель
|Сильные стороны
|Экономия токенов
|Цена (API)
|Контекстное окно
|Gemini 2.5 Flash
|Улучшенные многоэтапные задачи, лучшее программирование
|до 24%
|$0,30 / $2,50
|до 1M (32k в приложении)
|Gemini 2.5 Flash Lite
|Короткие и чёткие ответы, работа с графикой и аудио
|до 50%
|$0,10 / $0,40
|до 1M
Советы шаг за шагом: как выбрать модель
-
Для учебы и домашних заданий - подойдёт Flash в мобильном приложении.
-
Для чатов с быстрой генерацией коротких ответов - лучше выбрать Flash Lite.
-
Для программирования и сложных запросов - рекомендуется Flash, он показывает лучший результат в SWE-Bench.
-
Если важна минимальная стоимость API - Flash Lite в два раза дешевле по токенам.
-
Для больших проектов - используйте версии в Vertex AI, где доступно расширенное контекстное окно.
Ошибка → Последствие → Альтернатива
-
Ошибка: использовать Flash Lite для многошаговых задач.
-
Последствие: потеря качества и логики ответа.
-
Альтернатива: выбирать Flash для длинных сценариев.
-
Ошибка: игнорировать ограничение на контекстное окно в приложении.
-
Последствие: обрезка длинных документов.
-
Альтернатива: работать через подписку или API.
А что если…
А что если Google продолжит развивать Lite-версии, доведя их до уровня Flash? Это может привести к созданию универсальной модели, которая сочетает скорость и экономичность с высокой точностью. Такой шаг позволит встроить ИИ даже в устройства с ограниченными ресурсами — от дешёвых смартфонов до IoT-гаджетов.
Плюсы и минусы Gemini 2.5 Flash и Flash Lite
|Плюсы
|Минусы
|Высокая скорость работы
|Ограничения бесплатной версии
|Экономия токенов до 50%
|Меньшая точность у Lite
|Доступность в Google AI Studio и Vertex AI
|Контекстное окно в приложении всего 32k
|Бесплатное использование в вебе
|Цена исходящих токенов у Flash выше средней
|Расширенная работа с медиа
|Lite не подходит для сложных сценариев
FAQ
Можно ли использовать модели бесплатно?
Да, в веб-интерфейсе доступ бесплатный, но API тарифицируется.
Какая модель лучше для программистов?
Gemini 2.5 Flash, она улучшила результаты в SWE-Bench Verified.
Подходит ли Flash Lite для работы с изображениями?
Да, Lite как раз оптимизирован для мультимедиа и коротких ответов.
Мифы и правда
-
Миф: Flash Lite — урезанная версия без мультимедийных функций.
-
Правда: она умеет работать и с графикой, и с аудио, но выдаёт более короткие ответы.
-
Миф: только платные версии имеют доступ к обновлениям.
-
Правда: обновлённые модели доступны и в бесплатном веб-интерфейсе.
Три интересных факта
-
Flash Lite экономит вдвое больше токенов, чем старшие модели.
-
Gemini 2.5 Flash впервые показал рост выше 50% на SWE-Bench Verified.
-
В приложении Google Gemini контекст ограничен, чтобы снизить нагрузку на серверы.
Исторический контекст
-
2023 год: запуск первых версий Gemini.
-
2024 год: выход Gemini 1.5 Flash и Lite, акцент на скорость.
-
2025 год: релиз Gemini 2.5 Flash и Flash Lite с упором на экономию и мультимедийные возможности.
