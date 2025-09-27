Россия Мир Экономика Происшествия Все рубрики
© commons.wikimedia.org by Steffen Prößdorf is licensed under CC BY-SA 4.0
Главная / Технологии
Олег Белов Опубликована сегодня в 15:39

Бесплатно, быстро и в Telegram? Почти: Google обновил свои самые лёгкие модели ИИ

Google представила Gemini 2.5 Flash и Flash Lite с экономией токенов до 50%

Компания Google представила обновлённые версии своих лёгких моделей искусственного интеллекта — Gemini 2.5 Flash и Gemini 2.5 Flash Lite. Эти решения ориентированы на быстрые повседневные задачи, где важна скорость отклика и экономичность.

Разработчики сделали акцент на повышении эффективности: Gemini 2.5 Flash получила улучшения при работе с инструментами в многоэтапных сценариях, а также показала рост в тесте SWE-Bench Verified, который оценивает навыки программирования, — с 48,9% до 54%. Версия Flash Lite научилась лучше следовать инструкциям, точнее распознавать изображения и аудио, а также формировать более короткие и чёткие ответы.

Экономия ресурсов

Обе модели оптимизированы для снижения количества токенов при работе. По заявлению Google, Gemini 2.5 Flash расходует до 24% меньше, а Flash Lite — до 50%. Это делает их особенно удобными для задач с большим количеством коротких запросов, например, при интеграции в сервисы поддержки или мобильные приложения.

Доступность и цены

Новые версии моделей доступны в Google AI Studio и Vertex AI под названиями Gemini Flash Latest и Gemini Flash Lite Latest.

  • Gemini 2.5 Flash: $0,30 за 1 млн входящих токенов и $2,50 за 1 млн исходящих.

  • Gemini 2.5 Flash Lite: $0,10 за 1 млн входящих и $0,40 за 1 млн исходящих.

Через веб-интерфейс обе модели можно использовать бесплатно.

Приложение Google Gemini App

В официальном аккаунте Google Gemini App было объявлено обновление для версии Flash. Теперь модель в мобильном приложении лучше помогает с домашними заданиями, корректнее форматирует ответы и точнее распознаёт изображения.

При этом в бесплатной версии контекстное окно ограничено 32 тысячами токенов, тогда как в подписке Premium доступно до 1 миллиона токенов.

Сравнение: Gemini 2.5 Flash и Flash Lite

Модель Сильные стороны Экономия токенов Цена (API) Контекстное окно
Gemini 2.5 Flash Улучшенные многоэтапные задачи, лучшее программирование до 24% $0,30 / $2,50 до 1M (32k в приложении)
Gemini 2.5 Flash Lite Короткие и чёткие ответы, работа с графикой и аудио до 50% $0,10 / $0,40 до 1M

Советы шаг за шагом: как выбрать модель

  1. Для учебы и домашних заданий - подойдёт Flash в мобильном приложении.

  2. Для чатов с быстрой генерацией коротких ответов - лучше выбрать Flash Lite.

  3. Для программирования и сложных запросов - рекомендуется Flash, он показывает лучший результат в SWE-Bench.

  4. Если важна минимальная стоимость API - Flash Lite в два раза дешевле по токенам.

  5. Для больших проектов - используйте версии в Vertex AI, где доступно расширенное контекстное окно.

Ошибка → Последствие → Альтернатива

  • Ошибка: использовать Flash Lite для многошаговых задач.

  • Последствие: потеря качества и логики ответа.

  • Альтернатива: выбирать Flash для длинных сценариев.

  • Ошибка: игнорировать ограничение на контекстное окно в приложении.

  • Последствие: обрезка длинных документов.

  • Альтернатива: работать через подписку или API.

А что если…

А что если Google продолжит развивать Lite-версии, доведя их до уровня Flash? Это может привести к созданию универсальной модели, которая сочетает скорость и экономичность с высокой точностью. Такой шаг позволит встроить ИИ даже в устройства с ограниченными ресурсами — от дешёвых смартфонов до IoT-гаджетов.

Плюсы и минусы Gemini 2.5 Flash и Flash Lite

Плюсы Минусы
Высокая скорость работы Ограничения бесплатной версии
Экономия токенов до 50% Меньшая точность у Lite
Доступность в Google AI Studio и Vertex AI Контекстное окно в приложении всего 32k
Бесплатное использование в вебе Цена исходящих токенов у Flash выше средней
Расширенная работа с медиа Lite не подходит для сложных сценариев

FAQ

Можно ли использовать модели бесплатно?
Да, в веб-интерфейсе доступ бесплатный, но API тарифицируется.

Какая модель лучше для программистов?
Gemini 2.5 Flash, она улучшила результаты в SWE-Bench Verified.

Подходит ли Flash Lite для работы с изображениями?
Да, Lite как раз оптимизирован для мультимедиа и коротких ответов.

Мифы и правда

  • Миф: Flash Lite — урезанная версия без мультимедийных функций.

  • Правда: она умеет работать и с графикой, и с аудио, но выдаёт более короткие ответы.

  • Миф: только платные версии имеют доступ к обновлениям.

  • Правда: обновлённые модели доступны и в бесплатном веб-интерфейсе.

Три интересных факта

  1. Flash Lite экономит вдвое больше токенов, чем старшие модели.

  2. Gemini 2.5 Flash впервые показал рост выше 50% на SWE-Bench Verified.

  3. В приложении Google Gemini контекст ограничен, чтобы снизить нагрузку на серверы.

Исторический контекст

  • 2023 год: запуск первых версий Gemini.

  • 2024 год: выход Gemini 1.5 Flash и Lite, акцент на скорость.

  • 2025 год: релиз Gemini 2.5 Flash и Flash Lite с упором на экономию и мультимедийные возможности.

