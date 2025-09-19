Россия Мир Экономика Происшествия Все рубрики
Mobile menu button
DeepSeek
DeepSeek
© commons.wikimedia. org by Famartin is licensed under Creative Commons Attribution 2.0 Generic license
Главная / Технологии
Олег Белов Опубликована сегодня в 1:16

Её никто не учил думать — но она научилась: как китайская модель удивила весь мир

Nature: китайская команда представила модель DeepSeek-R1, способную рассуждать без подсказок

В журнале Nature вышла статья, которая уже вызвала бурные обсуждения в научных кругах. Китайская команда представила DeepSeek-R1 - первую масштабную языковую модель, которая научилась рассуждать без подсказок человека. Это открытие называют одним из самых значимых прорывов в развитии искусственного интеллекта последних лет.

В чём отличие от прежних моделей

До сих пор обучение моделей рассуждения (reasoning models) строилось на основе больших наборов данных. Для каждой задачи исследователи вручную создавали цепочки мыслей: пошаговые объяснения решения. ИИ копировал их и учился "думать", но при этом не вырабатывал собственной стратегии.

DeepSeek-R1 нарушила эту традицию. Модель обучали только по принципу "правильно/неправильно". Она получала награду за итоговый ответ, а вот способ нахождения решения выбирала сама.

Ключевой технологией стал алгоритм Group Relative Policy Optimization (GRPO). Он позволил системе:

  • проверять промежуточные шаги,

  • критиковать собственные ошибки,

  • менять методику, если ответ не сходился,

  • постепенно увеличивать время "обдумывания".

Результаты: от 15% до 87%

Прорывность подхода подтверждают цифры. В математическом бенчмарке AIME точность модели выросла с 15% до 78%. А при включении механизма самопроверки показатели поднялись до 87% — выше среднего уровня участников олимпиады.

Модель также показала сильные результаты в задачах по программированию и естественным наукам, обойдя все системы своего масштаба и приблизившись к куда более крупным конкурентам.

Примечательно, что даже упрощённые версии DeepSeek-R1 сохраняют большую часть новых навыков. Это открывает путь к созданию компактных моделей, пригодных для реального применения.

Сравнение подходов

Подход к обучению Особенности Результаты
Классический (с примерами) Человеческие цепочки рассуждений ограниченная гибкость
DeepSeek-R1 (GRPO) Награда только за конечный ответ самостоятельные стратегии, рост точности
DeepSeek-R1 с самопроверкой Дополнительно анализ промежуточных шагов 87% точности в AIME

Сильные и слабые стороны

Несмотря на успехи, модель пока не идеальна:

  • стиль ответов иногда страдает;

  • встречаются смешения языков;

  • гуманитарные дисциплины даются хуже, чем математика и STEM.

Тем не менее в области естественных наук и инженерных задач потенциал огромный.

Советы шаг за шагом: как использовать новые модели

  1. Для обучения студентов математике и программированию — как генератор задач и решений.

  2. Для исследователей — как инструмент поиска закономерностей в больших данных.

  3. Для инженеров — как помощник при проектировании решений, где важен перебор стратегий.

  4. Для компаний — внедрение упрощённых версий в образовательные и аналитические продукты.

  5. Для пользователей — как интеллектуальный тренажёр, помогающий развивать собственное мышление.

Ошибка → Последствие → Альтернатива

  • Ошибка: полагаться только на старые методы обучения ИИ.
    Последствие: низкая гибкость моделей.
    Альтернатива: внедрение методов типа GRPO.

  • Ошибка: считать, что без человека ИИ "ничего не придумает".
    Последствие: недооценка возможностей новых моделей.
    Альтернатива: учитывать, что самостоятельное рассуждение возможно.

  • Ошибка: игнорировать слабые стороны (например, гуманитарные темы).
    Последствие: искажения в ответах.
    Альтернатива: комбинировать ИИ с экспертными проверками.

А что если…

А что будет, если такие модели начнут работать не только с задачами олимпиадного уровня, но и с фундаментальной наукой? Возможно, ИИ впервые сможет открывать новые законы или строить гипотезы без прямого вмешательства исследователей. Это поставит новые вопросы: станет ли ИИ соавтором научных открытий и как изменится роль человека в науке?

Плюсы и минусы DeepSeek-R1

Плюсы Минусы
Самостоятельное формирование стратегии Ошибки в стиле и языковом оформлении
Высокая точность в математике Слабее в гуманитарных задачах
Компактные версии сохраняют навыки Возможны "шумы" в длинных рассуждениях
Подходит для STEM-дисциплин Требуется дальнейшая доработка

FAQ

Как обучали DeepSeek-R1?
На базе двух миллионов геномов фагов и алгоритма GRPO, без примеров пошаговых рассуждений.

Чем это отличается от ChatGPT?
ChatGPT учился на человеческих цепочках мыслей, а DeepSeek-R1 — на принципе конечной награды.

Где можно применить модель?
В образовании, инженерии, научных исследованиях и аналитике больших данных.

Мифы и правда

  • Миф: модель просто копирует чужие решения.
    Правда: она вырабатывает собственные стратегии и корректирует ошибки.

  • Миф: без человека ИИ не может рассуждать.
    Правда: DeepSeek-R1 доказала обратное.

  • Миф: компактные модели всегда хуже.
    Правда: облегчённые версии сохранили ключевые навыки.

3 интересных факта

• В AIME модель превысила средний результат реальных участников.
• Средняя длина ответов увеличивалась по мере обучения — ИИ "брал больше времени на обдумывание".
• В статье Nature отмечается, что подход GRPO может стать стандартом для будущих reasoning-моделей.

Исторический контекст

  • До 2020-х: языковые модели решают задачи только через текстовую генерацию.

  • 2023 год: появляются первые модели с ручными цепочками рассуждений.

  • 2025 год: DeepSeek-R1 показывает, что можно обучать рассуждению без примеров от человека.

Подписывайтесь на NewsInfo.Ru

Читайте также

Роскомнадзор: в Telegram остаются 155,8 тыс. материалов с незаконным контентом сегодня в 0:01

Удалили 210 тысяч, но забыли про 155 тысяч: как Telegram превратился в цифровую свалку

В России усиливается борьба с опасными публикациями в интернете. Но несмотря на сотни тысяч удалённых материалов, значительная часть до сих пор доступна.

Читать полностью » Poco F7 Pro и Redmi Note 14 стали хитами лета на российском рынке смартфонов вчера в 23:16

AliExpress знает, чего вы хотите: эти модели сметают с полок — и не зря

AliExpress назвал топ-10 смартфонов до 30 тыс. рублей в России. Лидеры лета — модели Xiaomi и Poco, а среди них абсолютным фаворитом стал Redmi Note 14 Pro.

Читать полностью » AliExpress СНГ назвал десять смартфонов с лучшей производительностью, камерой и батареей до 30 000 рублей вчера в 22:18

Экран светит ярче солнца: ТОП смартфонов до 30 000 рублей с батареей на весь день

Летний рейтинг AliExpress СНГ показал, какие смартфоны до 30 000 рублей пользуются наибольшей популярностью у россиян, сочетая производительность, дизайн и автономность.

Читать полностью » Минцифры: Госуслуги, банки и соцсети сохранят доступ при перебоях интернета вчера в 21:16

Интернет может исчезнуть, но эти сайты выживут: Минцифра создаёт цифровой ковчег

Минцифры будет еженедельно обновлять список сайтов, доступных даже при отключении интернета. В него входят госуслуги, банки, соцсети и торговые площадки.

Читать полностью » Dying Light: The Beast получил оценки 78/100 на Metacritic и 83/100 на OpenCritic вчера в 19:16

Игроки не выдерживают ночи в The Beast: почему даже опытные фанаты кричат от страха

Techland выпустила Dying Light: The Beast — отдельный проект, превзошедший оценки прошлых частей. Игра делает упор на хоррор и ближние бои.

Читать полностью » Google встроила искусственный интеллект Gemini в браузер Chrome вчера в 16:47

Браузер стал волшебной палочкой: как обновлённый Chrome исполняет желания быстрее поиска

Google встроила ИИ прямо в браузер Chrome. Теперь он не только ищет и объясняет, но и помогает в покупках, бронированиях и защите.

Читать полностью » Разбор iFixit показал: MagSafe Battery заряжает iPhone Air только на 65% вчера в 17:16

iPhone Air заряжается, но не до конца: Apple объяснила, куда исчезает треть батареи

iFixit разобрали новый MagSafe Battery для iPhone Air. Разбор показал простую конструкцию и объяснил, почему он восполняет лишь 65% заряда.

Читать полностью » Что изменится после окончания поддержки Windows 10 — разъяснение эксперта вчера в 16:52

Последний звонок для "десятки": что потеряют пользователи, отказавшись переходить на Windows 11

Microsoft готовится завершить поддержку Windows 10, и миллионы пользователей окажутся перед выбором: обновляться, менять систему или рисковать безопасностью.

Читать полностью »

Новости
Наука

Университет Западной Вирджинии предложил новую версию первого закона термодинамики для неравновесных процессов
Садоводство

Обрезка цветоноса и правильный уход помогают орхидее вновь зацвести в домашних условиях
Туризм

РЖД: проект ВСМ-4 "Союз" Москва–Минск может сократить путь до трёх часов
Спорт и фитнес

Спортивные медики: хроническая усталость и гормональные сбои указывают на перетрен
Питомцы

Очки для собак: ветеринары объяснили, когда нужны корректирующие модели
Спорт и фитнес

Врачи: упражнения в висе и боковые планки задействуют пресс лучше скручиваний
Садоводство

Озимая рожь помогает защитить почву от размыва в Ханты-Мансийском округе
Авто и мото

Ford отзывает 102 тысячи седанов Taurus 2016–2019 годов из-за дефекта дверных накладок
Все рубрики О проекте Архив Авторы

Сетевое издание NewsInfo зарегистрировано Роскомнадзором 10 июня 2022 года (Эл № ФС77-83422).
Материалы сайта предназначены для лиц старше 18 лет (18+).
Учредитель - Новикова Инна Семеновна.
Главный редактор — Шестернёв Владислав Игоревич.
Контакты: +7 (499) 641-41-69, 105066, Москва, ул. Александра Лукьянова, д. 3, ООО "РИЦ Правда", info@newsinfo.ru

Counter LiveInternet