Google Gemini
Google Gemini
Олег Белов Опубликована сегодня в 15:39

Бесплатно, быстро и в Telegram? Почти: Google обновил свои самые лёгкие модели ИИ

Google представила Gemini 2.5 Flash и Flash Lite с экономией токенов до 50%

Компания Google представила обновлённые версии своих лёгких моделей искусственного интеллекта — Gemini 2.5 Flash и Gemini 2.5 Flash Lite. Эти решения ориентированы на быстрые повседневные задачи, где важна скорость отклика и экономичность.

Разработчики сделали акцент на повышении эффективности: Gemini 2.5 Flash получила улучшения при работе с инструментами в многоэтапных сценариях, а также показала рост в тесте SWE-Bench Verified, который оценивает навыки программирования, — с 48,9% до 54%. Версия Flash Lite научилась лучше следовать инструкциям, точнее распознавать изображения и аудио, а также формировать более короткие и чёткие ответы.

Экономия ресурсов

Обе модели оптимизированы для снижения количества токенов при работе. По заявлению Google, Gemini 2.5 Flash расходует до 24% меньше, а Flash Lite — до 50%. Это делает их особенно удобными для задач с большим количеством коротких запросов, например, при интеграции в сервисы поддержки или мобильные приложения.

Доступность и цены

Новые версии моделей доступны в Google AI Studio и Vertex AI под названиями Gemini Flash Latest и Gemini Flash Lite Latest.

  • Gemini 2.5 Flash: $0,30 за 1 млн входящих токенов и $2,50 за 1 млн исходящих.

  • Gemini 2.5 Flash Lite: $0,10 за 1 млн входящих и $0,40 за 1 млн исходящих.

Через веб-интерфейс обе модели можно использовать бесплатно.

Приложение Google Gemini App

В официальном аккаунте Google Gemini App было объявлено обновление для версии Flash. Теперь модель в мобильном приложении лучше помогает с домашними заданиями, корректнее форматирует ответы и точнее распознаёт изображения.

При этом в бесплатной версии контекстное окно ограничено 32 тысячами токенов, тогда как в подписке Premium доступно до 1 миллиона токенов.

Сравнение: Gemini 2.5 Flash и Flash Lite

Модель Сильные стороны Экономия токенов Цена (API) Контекстное окно
Gemini 2.5 Flash Улучшенные многоэтапные задачи, лучшее программирование до 24% $0,30 / $2,50 до 1M (32k в приложении)
Gemini 2.5 Flash Lite Короткие и чёткие ответы, работа с графикой и аудио до 50% $0,10 / $0,40 до 1M

Советы шаг за шагом: как выбрать модель

  1. Для учебы и домашних заданий - подойдёт Flash в мобильном приложении.

  2. Для чатов с быстрой генерацией коротких ответов - лучше выбрать Flash Lite.

  3. Для программирования и сложных запросов - рекомендуется Flash, он показывает лучший результат в SWE-Bench.

  4. Если важна минимальная стоимость API - Flash Lite в два раза дешевле по токенам.

  5. Для больших проектов - используйте версии в Vertex AI, где доступно расширенное контекстное окно.

Ошибка → Последствие → Альтернатива

  • Ошибка: использовать Flash Lite для многошаговых задач.

  • Последствие: потеря качества и логики ответа.

  • Альтернатива: выбирать Flash для длинных сценариев.

  • Ошибка: игнорировать ограничение на контекстное окно в приложении.

  • Последствие: обрезка длинных документов.

  • Альтернатива: работать через подписку или API.

А что если…

А что если Google продолжит развивать Lite-версии, доведя их до уровня Flash? Это может привести к созданию универсальной модели, которая сочетает скорость и экономичность с высокой точностью. Такой шаг позволит встроить ИИ даже в устройства с ограниченными ресурсами — от дешёвых смартфонов до IoT-гаджетов.

Плюсы и минусы Gemini 2.5 Flash и Flash Lite

Плюсы Минусы
Высокая скорость работы Ограничения бесплатной версии
Экономия токенов до 50% Меньшая точность у Lite
Доступность в Google AI Studio и Vertex AI Контекстное окно в приложении всего 32k
Бесплатное использование в вебе Цена исходящих токенов у Flash выше средней
Расширенная работа с медиа Lite не подходит для сложных сценариев

FAQ

Можно ли использовать модели бесплатно?
Да, в веб-интерфейсе доступ бесплатный, но API тарифицируется.

Какая модель лучше для программистов?
Gemini 2.5 Flash, она улучшила результаты в SWE-Bench Verified.

Подходит ли Flash Lite для работы с изображениями?
Да, Lite как раз оптимизирован для мультимедиа и коротких ответов.

Мифы и правда

  • Миф: Flash Lite — урезанная версия без мультимедийных функций.

  • Правда: она умеет работать и с графикой, и с аудио, но выдаёт более короткие ответы.

  • Миф: только платные версии имеют доступ к обновлениям.

  • Правда: обновлённые модели доступны и в бесплатном веб-интерфейсе.

Три интересных факта

  1. Flash Lite экономит вдвое больше токенов, чем старшие модели.

  2. Gemini 2.5 Flash впервые показал рост выше 50% на SWE-Bench Verified.

  3. В приложении Google Gemini контекст ограничен, чтобы снизить нагрузку на серверы.

Исторический контекст

  • 2023 год: запуск первых версий Gemini.

  • 2024 год: выход Gemini 1.5 Flash и Lite, акцент на скорость.

  • 2025 год: релиз Gemini 2.5 Flash и Flash Lite с упором на экономию и мультимедийные возможности.

Подписывайтесь на NewsInfo.Ru

Читайте также

Energizer представила ноутбуки с рекордной автономностью до 28 часов — The Verge сегодня в 7:19

Энергии — как у электросамоката: представлен ноутбук, который работает неделю без розетки — но с ним не пускают в самолёт

Компания Energizer представила ноутбуки с рекордным временем автономной работы. Но смогут ли они стать удобными для путешественников?

Читать полностью »
В США произошла масштабная кибератака на устройства Cisco — Bloomberg сегодня в 6:19

Сотни устройств под ударом: хакеры взломали железо, которому доверяют даже правительства

Хакеры взломали устройства Cisco, используемые в правительстве США. CISA выпустила экстренную директиву — насколько серьёзна угроза?

Читать полностью »
Британские издатели обвинили Google в потере трафика из-за AI Overviews сегодня в 5:33

"Нас читают, но не заходят": Google под огнём из-за падения трафика на СМИ

Крупнейшие британские медиа пожаловались на Google: из-за AI Overviews их трафик упал почти на 90%. Издатели требуют раскрыть статистику и прекратить давление.

Читать полностью »
Учёные ЮУрГУ создали новый антикоррозионный сплав с легированием бором сегодня в 4:29

Пластичность без потерь: российские учёные сломали хрупкость металлов одним элементом

Учёные ЮУрГУ разработали новый сплав с добавлением бора. Он сочетает прочность и пластичность, защищает от коррозии и подходит для космоса, авто и энергетики.

Читать полностью »
Пользователи Windows снова могут скачать новые версии RPCS3 сегодня в 3:12

Возвращение легенды: RPCS3 снова работает на Windows после саботажа

После трёх месяцев перерыва эмулятор PlayStation 3 RPCS3 снова выпускает сборки для Windows. Ошибка MSVC обошли силами сообщества, и обновления вернулись.

Читать полностью »
Арбитраж Москвы утвердил временного управляющего для сегодня в 2:29

Ctrl+Alt+Delete по-русски: Microsoft запускает финальную процедуру в Москве

Суд ввёл наблюдение в «Майкрософт Рус». После ухода Microsoft из России и потери клиентов компания осталась без доходов и заявила о банкротстве.

Читать полностью »
MIT, OpenAI и Sakana AI представили метод ASAL для поиска цифровой сегодня в 1:19

Когда жизнь находит себя: как ИИ начал охоту на цифровые организмы

Учёные из MIT, OpenAI и Sakana AI создали метод ASAL, позволяющий искать цифровые формы жизни автоматически. Это может изменить науку, технологии и философию.

Читать полностью »
сегодня в 0:19

Чем пахнет дата-центр: "Авито" ищет воду, подрядчиков и 16 млрд на инфраструктуру

«Авито» рассматривает строительство собственного дата-центра мощностью до 20 МВт. Объект нужен для развития ИИ-сервисов, но решение пока окончательно не принято.

Читать полностью »