Новый метод улучшения способности роботов к обучению, выполняющих повторяющиеся задачи.
Учиться на своих прошлых ошибках могут не только люди. Компьютеры тоже это делают. В промышленности это делается с помощью компьютерных систем управления, которые помогают управлять производственными системами. Для промышленных роботов, которые выполняют определенные задачи в пакетном режиме, например производят одежду, компьютерные чипы или выпечку, наиболее часто используемым методом управления является итеративное обучение (ILC). Большинство отраслей по-прежнему полагаются на системы ILC, которые используют стратегию обучения, называемую правилом обновления пропорционального типа (PTUR). Этот метод повышает производительность систем ILC за счет повторения одной и той же задачи снова и снова и обновления входных данных управления на основе ошибок, обнаруженных в предыдущих итерациях.
Однако эта методология контроля была предложена несколько десятилетий назад. А поскольку системы ILC все чаще используются для выполнения более сложных задач , существует потребность в методах, которые могут обучаться быстрее и с большей точностью.
В ходе недавнего прорыва группа ученых предложила новую методику, использующую правило обновления дробной мощности (FPUR) для повышения потенциала производительности линейных систем ILC с одним входом и одним выходом. Исследование было опубликовано в журнале IEEE/CAA журнала Automatica Sinica.
Скорость конвергенции — скорость, с которой разница между желаемым и фактическим результатом уменьшается с течением времени — играет решающую роль в определении эффективности системы ILC. Существующие методы улучшения скорости сходимости часто оказываются неудовлетворительными в ситуациях, требующих высокой точности. Даже в случае постоянных или выбранных вручную результатов обучения современные системы ILC, использующие метод линейного обновления, не могут использовать доступную информацию в полной мере. Поэтому ученые исследовали подходы, выходящие за рамки PTUR, в которых использовались нелинейные методы обновления для обучения и достижения желаемого результата.
«Традиционный PTUR использует линейный член для ошибки отслеживания для обновления управляющего входа. С другой стороны, FPUR использует дробный член для обновления. Поскольку любое положительное число, меньшее единицы, имеет большую дробную мощность, чем оно само, интенсивность обновления FPUR больше, чем у PTUR для небольших ошибок отслеживания, что приводит к более высокой скорости сходимости», — объясняет Зихан Ли, ведущий автор исследования и студент магистратуры Школы математики Китайского университета Жэньминь.
Команда разработала новый метод FPUR, вдохновленный более новыми стратегиями управления за конечное время (FTC) и терминального скользящего режима (TSMC), которые являются потенциальными методами для преодоления ранее упомянутых проблем и повышения скорости сходимости. Ученые также использовали нелинейный картографический подход для изучения динамики ошибок с течением времени. Этот подход позволил им сообщить о быстрой сходимости и охарактеризовать возможные предельные циклы ошибок отслеживания в системах ILC. Кроме того, было проведено численное моделирование для проверки эффективности нового метода.
Отвечая на вопрос о том, как предлагаемая система изменит область применения систем ILC, Ли отвечает: «Это исследование служит трем основным целям. Во-первых, оно предоставляет алгоритм, использующий нелинейный метод обновления для улучшения способности к обучению. Во-вторых, оно показывает, что адаптация Условия дробной мощности позволяют регулировать скорость сходимости на основе фактической производительности. И, наконец, он демонстрирует высокую скорость сходимости наравне с FTC и TMSC».
Это исследование впервые продемонстрировало использование FPUR для ILC в линейных системах с одним входом и одним выходом. Предлагаемый метод потенциально может быть использован в других повторяющихся системах, таких как автономные транспортные средства, беспилотные летательные аппараты и реабилитационные роботы.
Теги: ИИ, обучение, робот