Илон Маск
Илон Маск
Дарья Казаку Опубликована 10.01.2025 в 18:35

Илон Маск: ИИ больше не может обучаться на данных человечества и сам будет создавать информацию

Илон Маск: ИИ исчерпал все данные человечества для своего обучения

Компании, работающие в сфере искусственного интеллекта (ИИ), столкнулись с нехваткой данных для обучения своих моделей и уже "исчерпали" совокупные знания человечества, заявил Илон Маск в интервью для The Guardian.

По словам предпринимателя, разработчики технологий вынуждены обращаться к "синтетическим" данным — материалам, созданным самими ИИ-моделями, — чтобы совершенствовать свои системы. Этот процесс уже активно применяется в стремительно развивающейся индустрии.

"Совокупные знания человечества были исчерпаны для обучения ИИ. Это произошло, по сути, в прошлом году", — сказал Маск, основавший собственную компанию xAI в 2023 году.

Модели ИИ, такие как GPT-4, лежащая в основе ChatGPT, обучаются на огромных массивах данных из интернета. Они анализируют паттерны в информации, что позволяет им, например, предсказывать следующее слово в предложении.

Однако, как отметил Маск в интервью, транслируемом на его платформе X, единственным выходом из ситуации становится использование синтетических данных, созданных самими ИИ.

"Единственный способ дополнить недостаток данных — это синтетические материалы, где ИИ пишет эссе, формулирует тезисы, оценивает их и проходит процесс самообучения", — пояснил он.

Компании, такие как Microsoft, Google и OpenAI, уже применяют синтетические данные для улучшения своих моделей. Однако Маск предупредил, что "галлюцинации" — термин, обозначающий ошибки или бессмысленный вывод ИИ — представляют серьезную угрозу для процесса создания синтетических данных.

"Галлюцинации делают процесс работы с искусственными материалами сложным, потому что сложно определить, является ли результат вымыслом или реальным ответом", — отметил он.

Андрю Дункан, директор по фундаментальному ИИ в Институте Алана Тьюринга (Великобритания), отметил, что заявление Маска согласуется с недавним исследованием, согласно которому доступные публичные данные для обучения ИИ могут закончиться уже к 2026 году.

Дункан также подчеркнул, что чрезмерная зависимость от синтетических данных может привести к "коллапсу моделей" — снижению качества их работы.

"Когда вы начинаете кормить модель синтетическим материалом, вы сталкиваетесь с эффектом убывающей отдачи. Результаты становятся менее качественными, с предвзятостями и потерей креативности", — объяснил он.

Еще одна проблема — распространение контента, созданного ИИ, в интернете. Такой материал может быть случайно включен в новые тренировочные наборы данных, что только усугубляет проблему.

Контроль над качественными данными стал одной из ключевых юридических проблем в эпоху бума ИИ. В 2022 году OpenAI признала, что создание инструментов вроде ChatGPT невозможно без использования материалов, защищенных авторским правом. В то же время представители креативных индустрий требуют компенсации за использование их контента в процессе обучения моделей.

Таким образом, использование синтетических данных становится неизбежным, но сопряжено с рисками, которые требуют разработки новых подходов к обучению и регулированию ИИ.

Подписывайтесь на NewsInfo.Ru

Читайте также

В поясе Койпера обнаружено отклонение орбит, указывающее на существование Планеты Y сегодня в 20:23
За Плутоном скрывается нечто грандиозное: учёные нашли первые доказательства

Учёные обнаружили намёк на таинственную Планету Y за орбитой Плутона. Может ли она изменить представления о строении Солнечной системы и стать новым соседом Земли?

Читать полностью »
В кургане Туннуг-1 найдены бронзовые фигурки животных IX века до н.э. сегодня в 19:39
Пантеры и змеи из бронзы: как зародилась великая скифская традиция

В тувинской "Долине царей" нашли древнейшие артефакты звериного стиля — фигурки баранов, пантер и птиц, созданные мастерами начала скифской эпохи.

Читать полностью »
ДНК человека из пещеры Истуриц показала его происхождение с территории современной России сегодня в 19:22
От Москвы до Парижа 30 тысяч лет назад: учёные нашли доказательства древней миграции

Генетики нашли в Западной Европе древнего человека, чьи предки, вероятно, пришли с востока — из регионов, где жили люди с Сунгиря и Костёнок.

Читать полностью »
Телескоп Джеймс Уэбб обнаружил более 100 колец Эйнштейна в космосе сегодня в 18:35
Учёные не могут поверить своим глазам: космос оказался полон гигантских линз Эйнштейна

Телескоп "Джеймс Уэбб" нашёл более сотни колец Эйнштейна — редких эффектов гравитационного линзирования, которые помогают рассматривать галактики первых эпох существования Вселенной.

Читать полностью »
На спутнике Юпитера Европа обнаружены следы аммиака в подледном океане сегодня в 18:13
Аммиак на Европе: это открытие может стать ключом к разгадке внеземной жизни

Учёные нашли на Европе следы аммиака — "природного антифриза", который делает подлёдный океан спутника Юпитера более устойчивым к замерзанию и повышает шансы на жизнь.

Читать полностью »
Теория стареющей Вселенной отменяет необходимость тёмной энергии и материи сегодня в 17:34
Силы природы слабеют: как стареющая Вселенная меняет наши представления

Физик Раджендра Гупта предложил теорию, способную отменить тёмную материю и энергию. Он считает, что Вселенная стареет, а её силы постепенно слабеют — создавая иллюзию невидимого вещества.

Читать полностью »
В древнем Китае кости умерших стали материалом сегодня в 17:11
Прощание с предками: как развитие городов изменило отношение древних китайцев к мёртвым

Учёные нашли 52 обработанные человеческие кости культуры Лянчжу. Оказалось, древние горожане изменили само отношение к смерти — тело стало материалом, а память — роскошью.

Читать полностью »
Поджелудочная железа меняет функции клеток из-за активности гена SMOC1 сегодня в 16:53
Поджелудочная железа восстала против нас: этот предательский ген, который вызывает диабет

Учёные из City of Hope нашли ген, заставляющий клетки поджелудочной железы менять свою роль — вместо инсулина они начинают повышать уровень сахара. Это открывает путь к новым видам терапии диабета.

Читать полностью »