Когда Тони Старку нужно отправиться в космос в оригинальном фильме «Железный человек», он просит своего помощника с искусственным интеллектом (ИИ) ДЖАРВИСА сделать костюм, способный выдержать суровые условия.
Как объясняет специалист по искусственному интеллекту Камаль Чоудхари: «Я вижу это так: JARVIS создал базу данных материалов, просканировал базу данных, нашел подходящий материал, протестировал его, а затем синтезировал сплав, способный выжить в космических условиях.
«Это то, что мы хотим, чтобы наша система делала, и поэтому мы назвали ее JARVIS».
Чоудхари, исследователь из Национального института стандартов и технологий (NIST), является основателем и разработчиком JARVIS (Совместного автоматизированного репозитория для различных интегрированных симуляций) — открытого набора данных, предназначенного для автоматизации обнаружения и оптимизации материалов.
В статье для npj Computational Materials в декабре 2021 года Чоудхари и Брайан ДеКост (NIST) описали последние усовершенствования JARVIS, которые применяют ИИ для ускорения обнаружения. Сочетая графовые нейронные сети с химическими и структурными знаниями о материалах, их атомистическая линейная графическая нейронная сеть (ALIGNN) превосходит ранее опубликованные модели в задачах атомистического прогнозирования с очень высокой точностью и лучшей или сопоставимой скоростью обучения модели.
«ALIGNN может предсказывать характеристики за секунды, а не за месяцы, — сказал Чоудхари.
Помимо вдохновения от Iron Man, была инициатива Materials Genome. Инициатива, зародившаяся в 2011 году при президенте Обаме, представляет собой усилия нескольких федеральных агентств по обнаружению, производству и внедрению передовых материалов в два раза быстрее и с меньшими затратами по сравнению с традиционными методами.
Первоначальным вкладом NIST в инициативу было создание базы данных материалов и их характеристик, полученных строго с использованием стандартизированных передовых вычислительных методов.
Было создано несколько таких баз данных, но «особенность базы данных JARVIS заключается в том, что она содержит модули для различных видов вычислительных подходов», по словам Дэвида Вандербильта, профессора физики Университета Рутгерса, члена Национальной академии наук и соавтор проекта. «Есть много разных теоретических уровней, на которых вы можете подойти к этой области. JARVIS необычен тем, что охватывает больше уровней, чем другие базы данных».
Исходные данные для JARVIS были взяты из расчетов теории функции плотности (или DFT). «ТПФ — это стандартный способ, с помощью которого большинство людей вычисляют свойства материала на атомарном уровне», — объяснил Вандербильт. «Это первоначальные расчеты, в которых нет экспериментального ввода, а результаты выводятся из теории с нуля в соответствии с законами квантовой механики».
Эта парадигма оказалась невероятно эффективной, «однако если вы посмотрите на периодическую таблицу, то увидите, что существуют миллиарды возможных комбинаций элементов — больше, чем мы можем когда-либо сгенерировать данные», — сказал Чоудхари. «Здесь на помощь приходит машинное обучение».
Если квантово-механические расчеты могут выступать в качестве инструмента проверки физических экспериментов, рассуждал Чоудхари, то машинное обучение может выступать в качестве инструмента проверки дорогостоящих вычислений.
Но сначала такую систему нужно обучить. Нейронные сети, такие как ALIGNN, требуют огромных объемов данных для обучения, чтобы быть эффективными. За передовой моделью искусственного интеллекта Чоудхари стоят симуляции DFT для 70 000 материалов и подсчета. Эта растущая база данных использовалась для обучения нейронной сети, которая, в свою очередь, может быстро характеризовать новые материалы или отбирать материалы с определенными свойствами.
«Это воплощение мечты об инициативе Materials Genome», — сказал Чоудхари.
Написав в arXiv, Чоудхари и его сотрудники представили пример того, как система может ускорить обнаружение. Они использовали ALIGNN для прогнозирования адсорбционных свойств CO₂ металлоорганических каркасов, класса пористых материалов, которые могут удалять CO₂ из атмосферы, и для компьютерного ранжирования лучших кандидатов для экспериментального синтеза.
Набор данных JARVIS был сгенерирован главным образом на суперкомпьютерах NIST, которые работали над этой задачей почти пять лет. Совсем недавно Чоудхари получил доступ к суперкомпьютерам Frontera и Stampede2 в Техасском передовом вычислительном центре (TACC), которые также внесли свой вклад в набор данных.
«Область машинного обучения существует с 1980-х годов, но главная проблема заключалась в тщательно отобранных наборах данных», — сказал Чоудхари. «Сейчас наша база данных приближается к 100 000 материалов, и это стало возможным только благодаря Frontera и NIST. Именно это помогло нам сократить этот разрыв».
Благодаря большому количеству доступных обучающих образцов и знаниям по химии и физике, жестко запрограммированным в нейронной сети, Чоудхари смог значительно повысить точность своей модели машинного обучения. «Чем больше знаний в предметной области вы можете использовать, тем лучше. Я думаю, что физика и ИИ не должны быть конкурентами друг другу, они должны быть друзьями и сотрудниками».
Инструмент ALIGNN, как и инструменты для расчетов DFT и других методов машинного обучения , встроен в JARVIS и доступен исследователям по всему миру. По оценкам Чоудхари, хранилищем ежегодно пользуются 8000 химиков и биологов. Недавно это позволило ученым из Аргоннской национальной лаборатории изучить топологические магнитные материалы и помогло исследователям Северо-Западного университета изучить перенос обучения для материалов.
Чоудхари также сотрудничает с Дэвидом Вандербильтом в разработке методов «вне DFT», применении их к квантовым материалам и интеграции этих методов и наборов данных в JARVIS.
«В DFT есть несколько важных приближений, — сказал Вандербильт. «Поскольку электроны рассматриваются как независимые, вы упускаете из виду некоторые особенности поведения квантовых материалов, которые приводят к эффектам, выходящим за рамки обычных ожиданий обычной теории».
К ним относятся, помимо прочего, нетрадиционная сверхпроводимость, квантовый эффект Холла и топологическая магнитная структура. «Для этих классов материалов обычная ТПФ не работает достаточно хорошо», — продолжил он. «Наша база данных использует три или четыре подхода более высокого уровня за пределами DFT, чтобы дать сообществу представление о том, как ответы могут отличаться в зависимости от лежащего в основе подхода».
Создав базу данных возможных материалов и разработав инструменты для автоматизации скрининга, Чоудхари надеется ускорить процесс открытия, приблизив возможности Железного человека к реальности.
«Представьте день, когда появится модель, которая сможет предсказать новый материал, новое лекарство и скажет: «Из миллиона молекул сначала попробуйте эту», — сказал Чоудхари. «Это золотой век материаловедения».
Теги: графен, ИИ, квант