Команда ученых-компьютерщиков из проекта Google DeepMind в Великобритании, работающая с коллегой из Университета Висконсин-Мэдисон и еще одним из Лионского университета, разработала компьютерную программу, которая сочетает в себе предварительно обученную модель большого языка (LLM) с автоматизированным «оценщиком»; создавать решения проблем в виде компьютерного кода.
В своей статье опубликованной в журнале Nature, группа описывает свои идеи, способы их реализации и типы результатов, получаемых с помощью новой системы.
Исследователи из научного сообщества обратили внимание на то, что люди делают с LLM, такими как ChatGPT, и многим из них пришло в голову, что LLM можно использовать для ускорения процесса научных открытий. Но они также отметили, что для того, чтобы это произошло, необходим метод, предотвращающий путаницу и ответы, которые кажутся разумными, но неправильными — им нужны результаты, которые можно проверить. Чтобы решить эту проблему, команда, работающая в Великобритании, использовала так называемый автоматизированный оценщик для оценки ответов, данных LLM.
После того как LLM сгенерирует ответ, он отправляется оценщику. Затем эксперт анализирует ответ и отправляет его обратно в LLM с предложениями по улучшению результатов. Этот процесс повторяется несколько раз, и ответ становится все более точным. Исследовательская группа называет свою систему FunSearch (сокращение от функционального поиска в пространстве). Тестируя систему, исследователи обнаружили, что она способна давать проверяемые результаты.
Для дальнейшего тестирования FunSearch исследовательские группы использовали его, чтобы найти новые открытия для так называемой проблемы максимального набора — математической задачи, которая включает в себя обнаружение наибольшего набора точек в многомерной сетке, где никакие три точки не находятся на одной линии. . FunSearch смогла генерировать решения, которые раньше не были найдены — и все это в форме компьютерных программ из-за характера LLM, который они использовали.
Исследовательская группа признает, что FunSearch не подходит для оказания помощи во всех типах исследовательских усилий, но предполагает, что это представляет собой шаг к использованию LLM для поиска решений проблем или для стимулирования исследователей, ищущих новые способы решения старых проблем.
Теги: IT, ИИ, приложение
