Connect with us

Hi, what are you looking for?

Наука и технологии

Языковые модели применяются в области термоядерной энергетики

Языковые модели применяются в области термоядерной энергетики
Языковые модели применяются в области термоядерной энергетики

С момента появления термоядерных исследований ученые опубликовали тысячи документов по этой теме — статьи, материалы конференций и даже письменные протоколы предыдущих экспериментов на термоядерных реакторах по всему миру. На прочтение такого источника информации уйдет целая жизнь, а на его понимание — еще больше.

Однако во время реального эксперимента по термоядерному синтезу в Национальном термоядерном центре DIII-D в Сан-Диего у исследователей есть всего около 10 минут между испытаниями, чтобы найти эту информацию и использовать ее для внесения корректировок для следующего запуска.

«Каждый сеанс термоядерного синтеза завершается за считанные секунды, а затем у вас есть небольшой промежуток времени до следующего, чтобы устранить любые проблемы и внести необходимые изменения», — сказал Джозеф Аббате, доктор философии, шестой курс. кандидат Принстонской программы по физике плазмы. «Вам придется принять множество решений за очень короткий промежуток времени».

Аббате сказал, что исследователи, проводящие эксперименты, регулярно работают над точной настройкой следующего эксперимента, и что изменения часто вносятся путем опроса аудитории для получения ответов — метод, основанный на общем опыте операторов, работающих в тот день.

Теперь учёные из Принстонского университета, Университета Карнеги-Меллона и Массачусетского технологического института (MIT) применили большие языковые модели — движущие силы таких инструментов, как ChatGPT, Bard и LLaMA — чтобы помочь исследователям термоядерного синтеза быстро разобраться в ошеломляющем объёме информации. данные для принятия более обоснованных решений на лету. Модель позволяет пользователям идентифицировать предыдущие эксперименты с похожими характеристиками, предоставлять информацию о системах управления устройством и быстро отвечать на вопросы о термоядерных реакторах и физике плазмы.

«Исследования термоядерного синтеза, как ни удивительно, являются идеальным сценарием для применения больших языковых моделей в помощь людям», — сказал Вирадж Мехта, доктор философии. кандидат Университета Карнеги-Меллон и первый автор семинара, подробно описывающего работу исследователей. «С одной стороны, существует множество доступных материалов о термоядерном синтезе в статьях, рефератах и ​​плакатах, а также в заметках, которые исследователи и операторы пишут после каждого испытания термоядерного синтеза. А с другой стороны, вам нужно иметь быстрый доступ к этой информации. Это область, в которой эти модели проявляют себя с лучшей стороны».

Исследователи заложили основу для своего проекта на хакатоне под руководством аспирантов, проходившем в кампусе Принстона, в ходе которого команда определила изменения, которые они могли бы внести в существующие языковые модели, чтобы использовать их возможности для исследований в области синтеза. Такие модели быстро приобрели известность благодаря своей способности генерировать текст, похожий на человеческий, после обучения триллионам слов в Интернете.

Всего за несколько вечеров совместного кодирования команда заложила основу для своей работы, улучшив необработанную модель большого языка с помощью процесса, известного как генерация с расширенным поиском. Генерация с расширенным поиском позволяет дополнить общий набор данных модели (который часто основан на тексте из Интернета, опубликованном до определенной конечной даты) дополнительными источниками данных для повышения точности и качества ответов модели. В этом случае исследователи добавили базу данных с информацией, которая включает журналы выстрелов и записи предыдущих экспериментов на DIII-D, которых нет в открытом доступе в Интернете.

«На хакатоне мы смогли получить мгновенную обратную связь и вдохновение от целой группы людей, чтобы продолжить проект, что позволило нам преодолеть любые препятствия и в конечном итоге получить прочную основу для нашей модели», — сказал Аббате.

Благодаря дополненной модели исследователи получили полезные ответы на различные подсказки: от информации о том, как управлять конкретными частями оборудования, до рекомендуемых изменений параметров устройства. Более того, они могли бы структурировать свой вопрос так, чтобы модель ссылалась на точные эксперименты или статьи, на основе которых она получила ответы, что повысило бы доверие к модели.

«Это похоже на то, что с вами всегда в комнате находится еще один помощник, который знает обо всех испытаниях термоядерного синтеза, которые проводились на реакторе, и может дать рекомендации, основанные на том, что произошло в прошлом», — сказал Эббейт.

На хакатоне исследователи заложили основу для своей модели, но с тех пор они усовершенствовали свою работу, чтобы ее можно было воспроизвести на реальных термоядерных установках. Например, Аббате работает с операторами DIII-D над изучением способов внедрения системы на объекте, чтобы каждая исследовательская группа, проводящая там эксперименты, могла получить к ней доступ.

Команда также отметила, что эта концепция может быть применена к термоядерным реакторам , которые больше не работают, что позволит ученым получить доступ к источнику информации, которая в противном случае могла бы быть забыта, когда операторы реакторов либо уйдут на пенсию, либо перейдут на другие объекты. Соавтор Аллен Ванг, аспирант Массачусетского технологического института, продемонстрировал, что ту же структуру, разработанную для DIII-D, можно адаптировать для Alcator C-Mod, термоядерного реактора Массачусетского технологического института, который прекратил работу в 2016 году.

«Есть машины, которые были остановлены на пару десятилетий, и никто не помнит, что произошло во время этих экспериментов», — сказал старший автор Эгемен Колемен, доцент кафедры машиностроения и аэрокосмической техники и Центра энергетики и окружающей среды Андлингера. , а также штатный физик-исследователь Принстонской лаборатории физики плазмы (PPPL). «Но, собрав все текстовые данные и подключив их к языковой модели, мы могли бы заново изучить некоторую ключевую информацию, которая поможет нам решить проблему, с которой мы столкнемся в будущих реакторах».

Мехта добавил, что модель также может стать ценным инструментом для молодых исследователей термоядерного синтеза, которые руководят сессиями на реакторах — роль, которую он и Аббате выполняли несколько раз за свою аспирантуру.

«Имея эту модель , которая может ссылаться на каждую существующую статью о термоядерном синтезе, мы создали инструмент, который позволяет следующему поколению исследователей получать доступ к информации гораздо проще, чем раньше», — сказал он.

Теги: ИИ, радиация, энергия

В тренде