Исследователи из Калифорнийского университета в Лос-Анджелесе и Исследовательской лаборатории армии США изложили новый подход к совершенствованию технологий компьютерного зрения на базе искусственного интеллекта путем добавления знаний, основанных на физике, к методам, основанным на данных.
Исследование, опубликованное в журнале Nature Machine Intelligence, предлагает обзор гибридной методологии, разработанной для улучшения того, как машины на основе ИИ воспринимают, взаимодействуют и реагируют на окружающую среду в режиме реального времени — например, как автономные транспортные средства движутся и маневрируют, или как роботы используют улучшенные технологии. технология выполнения высокоточных действий.
Компьютерное зрение позволяет ИИ видеть и понимать свое окружение, расшифровывая данные и делая выводы о свойствах физического мира из изображений. В то время как такие изображения формируются с помощью физики света и механики, традиционные методы компьютерного зрения в основном сосредоточены на машинном обучении на основе данных для повышения производительности. Исследования, основанные на физике, были разработаны отдельным направлением для изучения различных физических принципов, лежащих в основе многих задач компьютерного зрения.
Было непросто внедрить понимание физики — законов, управляющих массой, движением и т. д. — в разработку нейронных сетей, где ИИ моделируются по образцу человеческого мозга с миллиардами узлов для обработки массивных наборов данных изображений, пока они не получат понимание того, что они «видят». Но сейчас есть несколько многообещающих направлений исследований, которые стремятся добавить элементы понимания физики в уже надежные сети, управляемые данными.
Исследование Калифорнийского университета в Лос-Анджелесе направлено на использование силы как глубоких знаний , полученных из данных, так и реальных физических знаний для создания гибридного ИИ с расширенными возможностями.
«Визуальные машины — автомобили, роботы или медицинские инструменты, которые используют изображения для восприятия мира — в конечном итоге выполняют задачи в нашем физическом мире», — сказал корреспондент исследования Ачута Кадамби, доцент кафедры электротехники и вычислительной техники в школе Самуэли Калифорнийского университета в Лос-Анджелесе. инженерии. «Формы умозаключений с учетом физики могут позволить автомобилям управлять более безопасно, а хирургическим роботам, если быть более точным».
Исследовательская группа наметила три способа, с помощью которых физика и данные начинают объединяться в искусственный интеллект компьютерного зрения:
- Включение физики в наборы данных ИИ: пометьте объекты дополнительной информацией, например, как быстро они могут двигаться или сколько они весят, подобно персонажам в видеоиграх.
- Включение физики в сетевые архитектуры: пропустите данные через сетевой фильтр, который кодирует физические свойства в то, что снимают камеры.
- Включение физики в функцию сетевых потерь: используйте знания, основанные на физике, чтобы помочь ИИ интерпретировать обучающие данные о том, что он наблюдает.
Эти три направления исследований уже дали обнадеживающие результаты в улучшении компьютерного зрения. Например, гибридный подход позволяет ИИ более точно отслеживать и прогнозировать движение объекта и может создавать точные изображения с высоким разрешением из сцен, закрытых ненастной погодой.
По словам исследователей, с дальнейшим прогрессом в этом двухмодальном подходе ИИ, основанный на глубоком обучении, может даже начать самостоятельно изучать законы физики.
Другими авторами статьи являются ученый-компьютерщик Армейской исследовательской лаборатории Селсо де Мело и преподаватель Калифорнийского университета в Лос-Анджелесе Стефано Соатто, профессор компьютерных наук; Чо-Джуй Сие, адъюнкт-профессор компьютерных наук, и Мани Шривастава, профессор электротехники, вычислительной техники и компьютерных наук.
Теги: ИИ, распознавание