Айк Григорян, студент-компьютерщик из Пенсильвании, нашел свой способ путешествовать во времени — через искусственный интеллект. Его необычное хобби, связанное с обучением чат-бота на текстах викторианского Лондона, может звучать как странный факт для Tinder, но теперь эта модель привлекла внимание технических журналов. Проект, получивший название TimeCapsuleLLM, уже стал важным достижением в мире искусственного интеллекта.

Уникальный подход и историческое путешествие

Григорян обучил свою модель на семи тысячах книг, газетных публикаций и юридических документов, изданных в Лондоне в период с 1800 по 1875 год. Общий объём данных составил 6,25 гигабайта, и целью было не только воссоздание языка той эпохи, но и создание настоящего "цифрового путешествия во времени".

Когда Айк проверил, насколько хорошо его модель понимает события прошлого, он попросил чат-бота продолжить предложение.

"Это был год от Рождества Христова 1834". И вот что произошло: модель не просто завершила фразу, а рассказала о протестах против поправки к Закону о бедных, в которых фигурировал лорд Палмерстон — министр иностранных дел того времени и будущий премьер-министр Великобритании", — заявил Григорян.

По его словам, это событие действительно имело место, и хотя модель не была специально обучена на этих данных, она смогла собрать информацию из разных источников и составить связанный рассказ.

От старого чата до нового инструмента для историков

Григорян использует уникальный подход, который он называет "избирательным темпоральным обучением". Модель обучается только на исторических источниках, без вмешательства современных текстов, что помогает избежать современных языковых и стилистических влияний.

"Если я буду обучать с нуля, языковая модель не будет притворяться старой, она просто будет такой", — объяснил Айк в интервью ArsTechnica.

Этот подход может стать полезным инструментом для историков и исследователей цифровых гуманитарных наук. Несмотря на то что модель еще не идеальна и порой "галлюцинирует", она открывает новые возможности для изучения лексики и стиля прошлого.

Будущее проекта: глобальные амбиции

Айк Григорян не планирует останавливаться на достигнутом. Он уже разрабатывает идеи для создания аналогичных исторических моделей для других городов и стран, таких как Китай, Россия или Индия. Он также поделился кодом модели и документацией на GitHub, приглашая других энтузиастов к сотрудничеству.