Исследователи из Университета Дьюка продемонстрировали, что включение известных физических явлений в алгоритмы машинного обучения может помочь непостижимым черным ящикам достичь новых уровней прозрачности и понимания свойств материалов.
В одном из первых проектов такого рода исследователи создали современный алгоритм машинного обучения для определения свойств класса инженерных материалов, известных как метаматериалы, и для прогнозирования их взаимодействия с электромагнитными полями .
Поскольку сначала нужно было учесть известные физические ограничения метаматериала, программа по существу была вынуждена продемонстрировать свою работу. Этот подход не только позволил алгоритму точно предсказать свойства метаматериала, но и сделал это более эффективно, чем предыдущие методы, при этом предоставляя новые идеи.
Результаты опубликованы в Интернете 9 мая в журнале Advanced Optical Materials.
«Благодаря включению известной физики непосредственно в машинное обучение алгоритм может находить решения с меньшим количеством обучающих данных и за меньшее время», — сказал Вилли Падилла, профессор электротехники и вычислительной техники в Университете Дьюка. «Хотя это исследование было в основном демонстрацией, показывающей, что подход может воссоздать известные решения, оно также выявило некоторые сведения о внутренней работе неметаллических метаматериалов, о которых раньше никто не знал».
Метаматериалы представляют собой синтетические материалы, состоящие из множества отдельных инженерных элементов, которые вместе создают свойства, не встречающиеся в природе, благодаря своей структуре, а не химическому составу. В этом случае метаматериал состоит из большой сетки кремниевых цилиндров, напоминающих базовую пластину Lego.
В зависимости от размера и расстояния между цилиндрами метаматериал взаимодействует с электромагнитными волнами по-разному, например, поглощая, излучая или отклоняя волны определенной длины. В новой статье исследователи попытались построить модель машинного обучения, называемую нейронной сетью, чтобы выяснить, как диапазон высоты и ширины одного цилиндра влияет на эти взаимодействия. Но они также хотели, чтобы его ответы имели смысл.
«Нейронные сети пытаются найти закономерности в данных, но иногда найденные ими закономерности не подчиняются законам физики, что делает создаваемую ими модель ненадежной», — сказал Джордан Малоф, доцент кафедры электротехники и вычислительной техники Университета Дьюка. «Заставив нейронную сеть подчиняться законам физики , мы помешали ей найти отношения, которые могут соответствовать данным, но на самом деле не соответствуют действительности».
Физика, которую исследовательская группа наложила на нейронную сеть, называется моделью Лоренца — набор уравнений, описывающих, как внутренние свойства материала резонируют с электромагнитным полем. Вместо того, чтобы сразу переходить к прогнозированию отклика цилиндра, модель должна была научиться предсказывать параметры Лоренца, которые она затем использовала для расчета отклика цилиндра.
Однако о включении этого дополнительного шага гораздо легче сказать, чем сделать.
«Когда вы делаете нейронную сеть более интерпретируемой, что в некотором смысле то, что мы сделали здесь, может быть сложнее настроить ее», — сказал Омар Хатиб, исследователь с докторской степенью, работающий в лаборатории Падиллы. «Нам определенно было трудно оптимизировать обучение, чтобы изучить шаблоны».
Однако когда модель заработала, она оказалась более эффективной, чем предыдущие нейронные сети, созданные группой для тех же задач. В частности, группа обнаружила, что этот подход может значительно сократить количество параметров, необходимых модели для определения свойств метаматериала.
Они также обнаружили, что этот подход, основанный на физике, способен делать открытия сам по себе.
Когда электромагнитная волна проходит через объект, она не обязательно взаимодействует с ним точно так же, как в начале своего пути, как и в конце. Это явление известно как пространственная дисперсия. Поскольку исследователям пришлось настраивать параметры пространственной дисперсии, чтобы модель работала точно, они обнаружили новые сведения о физике процесса, о которых раньше не знали.
«Теперь, когда мы продемонстрировали, что это можно сделать, мы хотим применить этот подход к системам, физика которых неизвестна», — сказал Падилья.
«Многие люди используют нейронные сети для прогнозирования свойств материалов , но получение достаточного количества обучающих данных с помощью моделирования — это огромная проблема», — добавил Малоф. «Эта работа также показывает путь к созданию моделей, которым не требуется столько данных, что полезно во всех отношениях».
Теги: ИИ
