За последние несколько лет «ИИ» стал одним из модных словечек в области технологий. Перспектива компьютера, способного выполнять задачи, которые может выполнить только человек, является захватывающей мыслью.
ИИ можно создавать с помощью нескольких различных методов, но один из самых популярных в настоящее время связан с использованием глубоких нейронных сетей (ГНС). Эти структуры пытаются имитировать нейронные связи и функции мозга и обычно обучаются на наборе данных , прежде чем они будут развернуты в реальном мире. Предварительно обучая их на наборе данных, DNN можно «научить» идентифицировать функции на изображении. Таким образом, DNN можно научить идентифицировать изображение, например, с лодкой, путем обучения на наборе данных изображений с лодками.
Однако набор обучающих данных может вызвать проблемы, если он не спроектирован должным образом. Например, в отношении предыдущего примера, поскольку изображения лодок обычно делаются, когда лодка находится в воде, DNN может распознавать только воду, а не лодку, и все равно говорить, что на изображении есть лодка. Это называется предвзятостью одновременности, и это очень распространенная проблема, с которой сталкиваются при обучении DNN.
Для решения этой проблемы команда исследователей, включающая Йи Хэ, исследователя из Японского передового института науки и технологий (JAIST), старшего преподавателя Хаорана Се из JAIST, доцента Си Ян из Цзилиньского университета, лектора проекта Чиа-Мин Чан из Токийский университет и профессор Такео Игараси сообщили о новой системе «человек в контуре». Документ с подробным описанием этой системы был опубликован в Трудах 28-й Международной конференции по интеллектуальным пользовательским интерфейсам (ACM IUI 2023).
Профессор Се говорит: «Существует несколько существующих методов устранения предвзятости одновременности путем реорганизации набора данных или указания системе сфокусироваться на определенных областях изображения. Но реорганизация набора данных может быть очень сложной, в то время как существующие методы маркировки Области интереса (ROI) требуют обширных, попиксельных аннотаций от людей, нанятых для этого, что требует больших затрат. Таким образом, мы создали гораздо более простой метод внимания, который помогает людям указывать ROI на изображении с помощью простого метода. -click. Это резко сокращает время и затраты на обучение DNN и, следовательно, на развертывание».
Команда поняла, что предыдущие подходы к управлению вниманием были неэффективны, потому что они не были интерактивными. Таким образом, они предложили новый интерактивный метод аннотирования изображений одним щелчком мыши. Пользователи просто щелкают левой кнопкой мыши по частям изображения, которые необходимо идентифицировать, и, при необходимости, щелкают правой кнопкой мыши по частям изображения, которые следует игнорировать.
Таким образом, в случае изображений с лодками пользователи будут щелкать левой кнопкой мыши по лодке и правой кнопкой мыши по воде вокруг нее. Это помогает DNN лучше идентифицировать лодку и уменьшает влияние систематической ошибки совпадения, присущей обучающим наборам данных. Чтобы уменьшить количество изображений, которые необходимо аннотировать, была разработана новая стратегия активного обучения с использованием смешанной модели Гаусса (GMM).
Эта новая система была протестирована в сравнении с существующими как численно, так и с помощью опросов пользователей. Численный анализ показал, что новый метод активного обучения был более точным, чем любой из существующих, а опросы пользователей показали, что система на основе кликов сократила время, необходимое для аннотирования ROI, на 27%, и 81% участников предпочли ее. другие системы.
Се говорит: «Наша работа может значительно улучшить переносимость и интерпретируемость нейронных сетей за счет повышения их точности для реальных приложений. Когда системы принимают правильные и четкие решения, это повышает доверие пользователей к ИИ и упрощает развертывание этих систем. в реальном мире. Таким образом, наша работа направлена на повышение надежности развертывания DNN, что может оказать большое влияние на применение и развитие технологий искусственного интеллекта в обществе».
Команда считает, что их работа может оказать сильное влияние на технологическую отрасль и позволить в ближайшем будущем расширить применение технологий искусственного интеллекта.
Теги: ИИ