Исследование показывает, как машинное обучение может предсказывать редкие катастрофические события, такие как землетрясения или пандемии.
Когда дело доходит до прогнозирования бедствий, вызванных экстремальными явлениями (например, землетрясениями, пандемиями или «волнами-убийцами», которые могут разрушить прибрежные сооружения), численное моделирование сталкивается с почти непреодолимой проблемой: статистически говоря, эти события настолько редки, что просто недостаточно данных. на них, чтобы использовать прогностические модели, чтобы точно предсказать, когда они произойдут в следующий раз.
Но группа исследователей из Университета Брауна и Массачусетского технологического института утверждает, что так быть не должно.
В новом исследовании , опубликованном в журнале Nature Computational Science , ученые описывают, как они объединили статистические алгоритмы, которым требуется меньше данных для создания точных и эффективных прогнозов, с мощной техникой машинного обучения, разработанной в Брауне и натренированной для прогнозирования сценариев, вероятностей, а иногда даже Хронология редких событий, несмотря на отсутствие исторических записей о них.
При этом исследовательская группа обнаружила, что эта новая структура может предоставить способ обойти необходимость в огромных объемах данных, которые традиционно необходимы для таких вычислений, вместо этого, по сути, сводя сложную задачу прогнозирования редких событий к вопросу качества. над количеством.
«Вы должны понимать, что это случайные события», — сказал Джордж Карниадакис, профессор прикладной математики и инженерии в Брауне и автор исследования. «Вспышка пандемии, такой как COVID-19, экологическая катастрофа в Мексиканском заливе, землетрясение, огромные лесные пожары в Калифорнии, 30-метровая волна, которая опрокидывает корабль — это редкие события, и поскольку они редки, мы не у нас есть много исторических данных. У нас недостаточно выборок из прошлого, чтобы предсказать их дальнейшее будущее. Вопрос, который мы решаем в статье: точки данных, которые нам нужны?»
Исследователи нашли ответ в методе последовательной выборки, называемом активным обучением. Эти типы статистических алгоритмов способны не только анализировать вводимые в них данные, но, что более важно, они могут извлекать уроки из информации, чтобы помечать новые релевантные точки данных, которые в равной или даже большей степени важны для вычисляемого результата. На самом базовом уровне они позволяют делать больше с меньшими затратами.
Это очень важно для модели машинного обучения , которую исследователи использовали в исследовании. Эта модель, получившая название DeepOnet, представляет собой тип искусственной нейронной сети, в которой используются взаимосвязанные узлы в последовательных слоях, которые примерно имитируют связи, создаваемые нейронами в человеческом мозгу. DeepOnet известен как оператор глубокой нейронной сети. Он более совершенен и мощен, чем типичные искусственные нейронные сети, потому что фактически представляет собой две нейронные сети в одной, обрабатывающие данные в двух параллельных сетях. Это позволяет ему анализировать гигантские наборы данных и сценариев с головокружительной скоростью, чтобы выдавать такие же массивные наборы вероятностей, как только он узнает, что ищет.
Узким местом этого мощного инструмента, особенно в том, что касается редких событий, является то, что операторам глубоких нейронных сетей нужны тонны данных для обучения, чтобы производить эффективные и точные расчеты.
В документе исследовательская группа показывает, что в сочетании с методами активного обучения модель DeepOnet может быть обучена тому, какие параметры или предвестники искать, что приводит к катастрофическому событию, которое кто-то анализирует, даже когда точек данных не так много.
«Цель состоит не в том, чтобы взять все возможные данные и поместить их в систему, а в том, чтобы активно искать события, которые будут обозначать редкие события», — сказал Карниадакис. «У нас может быть не так много примеров реального события, но у нас могут быть эти предшественники. С помощью математики мы идентифицируем их, что вместе с реальными событиями поможет нам обучить этого жадного до данных оператора».
В статье исследователи применяют подход к точному определению параметров и различных диапазонов вероятностей опасных всплесков во время пандемии, поиску и прогнозированию волн -убийц и оценке того, когда корабль треснет пополам из-за стресса. Например, с волнами-убийцами, которые более чем в два раза превышают размеры окружающих волн, исследователи обнаружили, что они могут обнаруживать и количественно определять, когда будут формироваться волны-убийцы, изучая вероятные волновые условия, которые нелинейно взаимодействуют во времени, что приводит к возникновению волн иногда в три раза больше. их первоначальный размер.
Исследователи обнаружили, что их новый метод превзошел более традиционные усилия по моделированию, и они считают, что он представляет собой основу, которая может эффективно обнаруживать и прогнозировать все виды редких событий .
В документе исследовательская группа описывает, как ученые должны планировать будущие эксперименты, чтобы минимизировать затраты и повысить точность прогнозов. Карниадакис, например, уже работает с учеными-экологами, чтобы использовать новый метод для прогнозирования климатических явлений, таких как ураганы.
Исследование возглавили Итан Пикеринг и Фемистоклис Сапсис из Массачусетского технологического института. DeepOnet был представлен в 2019 году Карниадакисом и другими исследователями Брауна. В настоящее время они ищут патент на технологию.
Теги: землетрясение, ИИ