Группа ученых из EPFL построила новую систему нейронных сетей, которая может помочь понять, как животные адаптируют свои движения к изменениям в собственном теле, и создать более мощные системы искусственного интеллекта.
Глубокое обучение подпитывается искусственными нейронными сетями , которые накладывают друг на друга простые вычислительные элементы для создания мощных обучающих систем. Имея достаточно данных, эти системы могут решать сложные задачи, такие как распознавание объектов, победа над людьми в го, а также управление роботами.
«Как вы можете себе представить, архитектура того, как вы накладываете эти элементы друг на друга, может влиять на то, сколько данных вам нужно изучить, и какова максимальная производительность», — говорит профессор Александр Матис из Школы наук о жизни EPFL.
Работая с докторантами Альберто Чиаппа и Алессандро Марин Варгас, трое ученых разработали новую сетевую архитектуру под названием DMAP для «политики распределенного морфологического внимания». Эта сетевая архитектура включает в себя фундаментальные принципы биологического сенсомоторного контроля, что делает ее интересным инструментом для изучения сенсомоторной функции.
Проблема, которую пытается решить DMAP, заключается в том, что животные, включая людей, эволюционировали, чтобы адаптироваться к изменениям как в окружающей среде, так и в собственном теле. Например, ребенок может адаптировать свою способность эффективно ходить ко всем изменениям формы и веса тела от малыша до взрослого возраста — и делать это на разных типах поверхностей и т. д. При разработке DMAP команда сосредоточилась на том, как животное может научиться ходить, когда его тело подвергается этим «морфологическим возмущениям» — изменениям длины и толщины частей тела.
«Обычно в обучении с подкреплением для изучения двигательных навыков используются так называемые полносвязные нейронные сети », — говорит Матис. Обучение с подкреплением — это метод обучения на основе машинного обучения, который «вознаграждает» за желаемое поведение и/или «наказывает» за нежелательное.
Он продолжает: «Представьте, что у вас есть датчики, которые оценивают состояние вашего тела, например, угол наклона запястья, локтя, плеча и т. д. Сигналы этих датчиков являются входными данными для двигательной системы, а выходные — сигналами. активация мышц, которые генерируют крутящие моменты. Если использовать полностью связанные сети, то, например, в первом слое интегрированы все датчики со всего тела». Напротив, в биологии сенсорная информация комбинируется иерархически».
«Мы взяли принципы нейронауки и преобразовали их в нейронную сеть , чтобы разработать лучшую сенсомоторную систему», — говорит Альберто Чиаппа. В своей статье, опубликованной на 36-й ежегодной конференции по системам обработки нейронной информации (NeurIPS), исследователи представляют DMAP, который «сочетает в себе независимую проприоцептивную обработку, распределенную политику с отдельными контроллерами для каждого сустава и механизм внимания для динамического захвата сенсорной информации». с разных частей тела на разные контроллеры».
DMAP смог научиться «ходить» с телом, подверженным морфологическим возмущениям, без получения какой-либо информации о морфологических параметрах, таких как конкретная длина и ширина конечностей. Примечательно, что DMAP могла «ходить» так же хорошо, как и система, имевшая доступ к этим параметрам тела.
«Поэтому мы создали систему обучения с подкреплением благодаря тому, что мы знаем из анатомии», — говорит Альберто Чиаппа. «После того, как мы обучили эту модель, мы заметили, что она демонстрировала динамическое стробирование, напоминающее то, что происходит в спинном мозге, но, что интересно, такое поведение возникло спонтанно».
В целом, такие модели, как DMAP, выполняют две функции: создание более совершенных систем искусственного интеллекта на основе биологических данных и, наоборот, создание более совершенных моделей для понимания мозга.
Теги: IT