Илон Маск
Илон Маск
Дарья Казаку Опубликована 10.01.2025 в 18:35

Илон Маск: ИИ больше не может обучаться на данных человечества и сам будет создавать информацию

Илон Маск: ИИ исчерпал все данные человечества для своего обучения

Компании, работающие в сфере искусственного интеллекта (ИИ), столкнулись с нехваткой данных для обучения своих моделей и уже "исчерпали" совокупные знания человечества, заявил Илон Маск в интервью для The Guardian.

По словам предпринимателя, разработчики технологий вынуждены обращаться к "синтетическим" данным — материалам, созданным самими ИИ-моделями, — чтобы совершенствовать свои системы. Этот процесс уже активно применяется в стремительно развивающейся индустрии.

"Совокупные знания человечества были исчерпаны для обучения ИИ. Это произошло, по сути, в прошлом году", — сказал Маск, основавший собственную компанию xAI в 2023 году.

Модели ИИ, такие как GPT-4, лежащая в основе ChatGPT, обучаются на огромных массивах данных из интернета. Они анализируют паттерны в информации, что позволяет им, например, предсказывать следующее слово в предложении.

Однако, как отметил Маск в интервью, транслируемом на его платформе X, единственным выходом из ситуации становится использование синтетических данных, созданных самими ИИ.

"Единственный способ дополнить недостаток данных — это синтетические материалы, где ИИ пишет эссе, формулирует тезисы, оценивает их и проходит процесс самообучения", — пояснил он.

Компании, такие как Microsoft, Google и OpenAI, уже применяют синтетические данные для улучшения своих моделей. Однако Маск предупредил, что "галлюцинации" — термин, обозначающий ошибки или бессмысленный вывод ИИ — представляют серьезную угрозу для процесса создания синтетических данных.

"Галлюцинации делают процесс работы с искусственными материалами сложным, потому что сложно определить, является ли результат вымыслом или реальным ответом", — отметил он.

Андрю Дункан, директор по фундаментальному ИИ в Институте Алана Тьюринга (Великобритания), отметил, что заявление Маска согласуется с недавним исследованием, согласно которому доступные публичные данные для обучения ИИ могут закончиться уже к 2026 году.

Дункан также подчеркнул, что чрезмерная зависимость от синтетических данных может привести к "коллапсу моделей" — снижению качества их работы.

"Когда вы начинаете кормить модель синтетическим материалом, вы сталкиваетесь с эффектом убывающей отдачи. Результаты становятся менее качественными, с предвзятостями и потерей креативности", — объяснил он.

Еще одна проблема — распространение контента, созданного ИИ, в интернете. Такой материал может быть случайно включен в новые тренировочные наборы данных, что только усугубляет проблему.

Контроль над качественными данными стал одной из ключевых юридических проблем в эпоху бума ИИ. В 2022 году OpenAI признала, что создание инструментов вроде ChatGPT невозможно без использования материалов, защищенных авторским правом. В то же время представители креативных индустрий требуют компенсации за использование их контента в процессе обучения моделей.

Таким образом, использование синтетических данных становится неизбежным, но сопряжено с рисками, которые требуют разработки новых подходов к обучению и регулированию ИИ.

Подписывайтесь на NewsInfo.Ru

Читайте также

Южный океан может высвободить накопленное тепло спустя века — AGU Advances вчера в 23:09
Океан удерживал пламя веками, но теперь отпускает: скрытое тепло запускает новый виток потепления

Южный океан может внезапно выбросить накопленное тепло и запустить новый виток потепления даже после снижения выбросов, изменив прогнозы климата.

Читать полностью »
Бактерии, вызывающие запах, активируются при повышенной влажности и потоотделении — Sciences вчера в 21:29
Гармония микробов или их хаос: почему время суток решает, какие бактерии победят на вашей коже

Выбор времени душа влияет на активность бактерий, состояние кожи и ощущение свежести. Разбираемся, когда лучше принимать душ и какие привычки действительно помогают сохранить здоровый кожный барьер.

Читать полностью »
Amazon и Google инвестировали сотни миллионов в атомную энергетику — Seznam Zpravy вчера в 19:25
Малые реакторы против гигантов: кто спасёт планету от энергетического коллапса

Малые модульные реакторы обещают стать «iPhone энергии», но смогут ли они оправдать амбиции Amazon, Google и правительств, решивших сделать ставку на "новый атом"?

Читать полностью »
Пещеры между Катаром и Кувейтом хранили следы людей 100 тыс лет — PLOS One вчера в 17:46
Дверь в прошлое открылась: как зелёные окна Аравии меняли мир и позволяли людям выживать в аду

В зоне между Катаром и Кувейтом нашли "мозаику” из 400+ каменных орудий и следы жизни 10-100 тыс. лет назад, раскрывая "зелёные окна" Аравии.

Читать полностью »
Марсианские часы идут быстрее земных на 477 мкс — The Astronomical Journal вчера в 15:19
Солнечная система открыла новый парадокс: Марс заставляет время бежать иначе, чем на Земле

Учёные рассчитали, как течёт время на Марсе и почему секунды на Красной планете идут быстрее, чем на Земле. Эти данные важны для будущей навигации и связи.

Читать полностью »
Корни риса замедляют вертикальный рост и расширяются в ответ на механический стресс — Sciences вчера в 13:28
Невидимые войны в почве: как рис скрывает секреты молекулярных атак, способных преодолеть самые твёрдые барьеры

Новые данные о том, как корни риса пробиваются через плотную почву, раскрывают механизмы адаптации растений и дают перспективы для создания более устойчивых сельскохозяйственных культур.

Читать полностью »
Arrow 3 начала работу на военной базе Шёневальде под Берлином — Independent вчера в 11:26
Германия поднимает щит над Европой: Arrow 3 превращает небо в броню

Германия представила первую часть системы противоракетной обороны Arrow 3, которая укрепит европейскую безопасность и станет основой новой сети защиты неба.

Читать полностью »
В Беренике обнаружили захоронения индийских макак I века — JRA вчера в 9:29
Это вам не собачка: археологи откопали зверинец римских офицеров с обезьянами из самой Индии

В порту Береника нашли десятки захоронений индийских макак с инвентарём: открытие раскрывает статус питомцев и торговлю живыми животными в Риме.

Читать полностью »