Искусственный интеллект
Искусственный интеллект
Алексей Ларин Опубликована 21.09.2025 в 14:50

Малыш бьёт великанов: крошечный ИИ из Сингапура обошёл GPT и Claude

Новая компактная модель HRM из Сингапура обошла крупные ИИ-системы

Новая разработка из Сингапура привлекла внимание специалистов по искусственному интеллекту. Стартап Sapient представил архитектуру под названием HRM — "иерархическая модель рассуждений", которая неожиданно обошла признанных лидеров рынка в сложных тестах.

Что показали тесты

HRM справилась с проверкой на корпусе рассуждений ARC-AGI, где требуется не просто знание фактов, а умение делать выводы. Точность модели составила 40,3%. Для сравнения, o3-mini-high от OpenAI продемонстрировала 34,5%, Claude 3.7 — 21,2%, а Deepseek R1 — всего 15,8%.

Главный интерес вызвало не само лидерство, а то, каким образом оно было достигнуто. Новая модель оказалась крайне компактной: всего 27 миллионов параметров против миллиардов у традиционных систем. Это примерно в тысячу раз меньше, чем у классических LLM вроде GPT или Claude.

Минимум ресурсов и нестандартное обучение

Исследователи не использовали привычные методы предварительной подготовки или обучения с подкреплением. Вместо этого модель тренировалась на небольшом наборе в тысячу примеров. Тем не менее результат превзошёл ожидания.

Архитектура включает два уровня:

  1. высокоуровневый контроллер, формирующий стратегию.

  2. низкоуровневый исполнитель, решающий конкретные шаги.

Этот подход напоминает работу человеческого мозга, где абстрактное планирование отделено от мгновенной реакции.

Отличие от популярных методов

Большинство современных языковых моделей применяют цепочку рассуждений (Chain of Thought, CoT), где задача решается поэтапно. HRM действует иначе: весь процесс выполняется в один проход, что экономит ресурсы.

Модель показала уверенность не только в тестах, но и в практических задачах: решала судоку, прокладывала маршруты в лабиринтах, выполняла другие логические задачи.

Сравнение моделей

Модель Точность ARC-AGI Количество параметров
HRM (Sapient) 40,3% 27 млн
o3-mini-high 34,5% миллиарды
Claude 3.7 21,2% миллиарды
Deepseek R1 15,8% миллиарды

Советы шаг за шагом: как оценивать ИИ-модели

  1. Смотрите не только на размер модели, но и на эффективность.

  2. Обращайте внимание на используемые тесты (ARC-AGI, MMLU, BIG-Bench).

  3. Проверяйте прозрачность обучения: доступность данных и методик.

  4. Изучайте практические примеры применения, а не только цифры.

  5. Следите за доступностью открытого кода для независимой проверки.

Ошибка → Последствие → Альтернатива

  • Ошибка: выбирать систему только по числу параметров.

  • Последствие: высокие затраты на вычисления без гарантии результата.

  • Альтернатива: обратить внимание на модели вроде HRM, где эффективность достигается архитектурой.

  • Ошибка: доверять непроверенным результатам препринтов.

  • Последствие: разочарование при реальном использовании.

  • Альтернатива: ждать официального рецензирования и тестов сообщества.

  • Ошибка: применять ИИ без адаптации под задачу.

  • Последствие: снижение точности и рост ошибок.

  • Альтернатива: использовать модели с настройкой под конкретные области — например, медицинские ИИ для диагностики или чат-боты для поддержки клиентов.

А что если…

Если гипотеза авторов подтвердится, то на рынке появится новая волна компактных моделей. Они смогут работать даже на смартфонах или недорогих ноутбуках, не требуя облачных серверов. Это значит, что искусственный интеллект может стать по-настоящему массовым и независимым от крупных корпораций.

Плюсы и минусы HRM

Плюсы Минусы
Низкие требования к ресурсам Отсутствие открытого кода
Высокая точность в тестах Нет подтверждения от независимых групп
Простая архитектура Ранний этап разработки
Успех в логических задачах Риск переоценки метода

FAQ

Как выбрать подходящую ИИ-модель?
Сравнивайте не только результаты тестов, но и практическую применимость в вашей области — от обработки текста до решения задач в науке.

Сколько стоит использование таких систем?
Компактные модели обходятся дешевле: их можно запускать на локальных компьютерах. Крупные LLM требуют облачных сервисов, что увеличивает расходы.

Что лучше: большая или маленькая модель?
Зависит от задачи. Большие хороши для генерации текста и общения, маленькие эффективнее для узких логических задач.

Мифы и правда

  • Миф: чем больше параметров, тем умнее модель.
    Правда: эффективность зависит от архитектуры и метода обучения, как показал HRM.

  • Миф: маленькие модели не могут обойти гигантов.
    Правда: HRM уже показала обратное.

  • Миф: ИИ всегда требует огромных серверов.
    Правда: новые подходы позволяют запускать его даже на слабых устройствах.

3 интересных факта

  • HRM обошла модели с параметрами в сотни миллиардов при размере всего 27 млн.

  • Обучение шло на 1000 примеров без тонкой настройки.

  • Исследователи применили цикл уточнения, который пока остаётся малоизученным.

Автор Алексей Ларин
Алексей Ларин — журналист, корреспондент Ньюсинфо

Подписывайтесь на NewsInfo.Ru

Читайте также

Смартфон погас, но память жива: способ быстро реанимировать гаджет 26.02.2026 в 18:51

Эксперт по кибербезопасности Павел Мясоедов рассказал NewsInfo, как реанимировать внезапно выключившийся смартфон. 

Читать полностью »
Юрист Айвар: россиянам не грозит ответственность за использование Telegram в случае признания его экстремистским 25.02.2026 в 22:26
Мессенджер в тени закона: что грозит россиянам за использование Telegram?

Юрист уверена, что даже статус экстремистского ресурса не приведет к автоматическим запретам для пользователей. Государство откажется, но граждане продолжат безнаказанно.

Читать полностью »
Память телефона забита, а фото удалять жалко: решение проще, чем кажется 02.02.2026 в 12:33

Эксперт по кибербезопасности Алексей Лукацкий рассказал NewsInfo, как освободить память телефона, не удаляя важные фото и видео.

Читать полностью »
Отключение превью возвращает автосохранение скриншотов — Моника Торрес 21.01.2026 в 9:38
Скриншоты в iOS 26 превратились в лишний квест — решение оказалось в одном переключателе

Технологии и мобильные устройства: iOS 26 обновление меняет скриншоты и добавляет настройки превью. Разбираемся, зачем Apple усложнила процесс и как вернуть мгновенное сохранение.

Читать полностью »
Пароли нужно менять каждые три месяца —IT-эксперт Дворянский 16.01.2026 в 13:31
Кажется надежным, но работает против вас: когда пароли нужно срочно менять

Эксперт по IT-безопасности Александр Дворянский рассказал NewsInfo, как часто нужно менять пароли и почему одинаковые комбинации опасны.

Читать полностью »
CES 2026 в Лас-Вегасе собрала более 4100 компаний и стартапов - РБК 12.01.2026 в 18:33
Lenovo растянула ноутбук, Samsung сложила планшет: CES 2026 собрала технологии, которые ломают привычки

На CES 2026 в Лас-Вегасе представлены потрясающие технологии: от трансформируемых экранов до домашних роботов. Убедитесь, что вы знаете все подробности!

Читать полностью »
После износа батареек их можно использовать в пульте для телевизора — эксперт 09.01.2026 в 5:09
Меньше батареек — больше сэкономленных рублей: как правильно использовать их до последней капли

Узнайте, как продлить срок службы батареек и не тратить деньги зря. Маленькая хитрость поможет вам экономить на источниках питания.

Читать полностью »
В 2025 году для России актуальны DDoS-атаки и кибершпионаж — Станислав Кузнецов 03.01.2026 в 5:23
Злоумышленники атакуют по всем фронтам: как выжить в мире киберугроз и не потерять бизнес

В 2025 году киберугрозы для российских организаций остаются актуальными, включая DDoS-атаки и программы-шифровальщики, сумма выкупа за которые может достигать 500 млн рублей.

Читать полностью »

Новости

Приготовление пирога без муки и лишнего хаоса: как мед и мак преображают яблоки в десерт
Каждая деталь имеет значение: весной не упустите шанс вернуть своему авто новую жизнь
Плавание — ваш новый друг: как три месяца в бассейне перевернут ваше тело с ног на голову
Рыжий налёт сдаётся без боя: копеечный дуэт из аптеки и кухни возвращает кранам зеркальный блеск
Собака на поводке — не повод забывать об опасностях дома: вот какие вещи представляют угрозу
Мощные морские течения и тектонические сдвиги: будущее Гибралтара под давлением мантийных сил
Зеркало больше не расстроит: точные движения создают идеальный рельеф ягодиц всего за месяц
Шкаф превращается в капсулу времени: зимние вещи сохраняют новизну годами благодаря хитростям