Учебный лагерь по биоинформатике для старшеклассников Сколтеха превратился в площадку для новой главы в продолжающемся соревновании между людьми и искусственным интеллектом в науке. Решив ранее ключевую 50-летнюю проблему структурной биоинформатики, революционная программа искусственного интеллекта AlphaFold оказалась непригодной для решения другой задачи, с которой сталкиваются исследователи в этой области.
Об этом сообщается в исследовании PLOS ONE, авторы которого опровергают утверждения некоторых энтузиастов AlphaFold о том, что ИИ DeepMind овладел конечной физикой белков и является краеугольным камнем структурной биоинформатики.
Структурная биоинформатика — это отрасль науки, изучающая структуры белков, РНК, ДНК и их взаимодействия с другими молекулами. Полученные данные служат основой для открытия лекарств и создания белков с захватывающими свойствами, таких как катализаторы реакций, не встречающихся в мире природы.
Исторически центральной проблемой структурной биоинформатики было предсказание белковых структур. То есть, учитывая произвольную последовательность аминокислот, составляющих белок, как можно надежно рассчитать, какую трехмерную форму примет этот белок в организме и, следовательно, как он будет функционировать.
Спустя 50 лет проблема была решена с помощью AlphaFold, программы искусственного интеллекта , созданной Google DeepMind, чьи предшественники ранее попали в заголовки, достигнув сверхчеловеческих результатов в шахматах, игре Го и видеоигре StarCraft II.
Это знаковое достижение привело к предположению, что нейронная сеть каким-то образом усвоила лежащую в основе физику белков и должна работать не только по той задаче, для которой она была разработана. Некоторые люди, даже в сообществе структурной биоинформатики, ожидали, что ИИ вскоре даст окончательные ответы на оставшиеся вопросы этой дисциплины и отправит их в историю науки.
«Мы решили урегулировать этот вопрос и поручили AlphaFold выполнить еще одну центральную задачу структурной биоинформатики: предсказать влияние одиночных мутаций на стабильность белка. Это означает, что вы выбираете определенный известный белок и вносите ровно одну мутацию, наименьшее возможное изменение. хотят знать, является ли получившийся мутант более стабильным или менее стабильным и в какой степени. AlphaFold был явно не в состоянии это сделать, о чем свидетельствуют его предсказания, противоречащие известным экспериментальным данным», — главный исследователь исследования, доцент Сколтех Био , сказал.
На вопрос о роли старшеклассников, принимавших участие в проекте, исследователь сказал, что они были вовлечены в обработку данных о мутациях, писали сценарии для обработки результатов прогнозирования, визуализировали структуры, заданные AlphaFold, и в основном возились с онлайн-версией программы. ИИ.
Иванков подчеркнул, что создатели AlphaFold никогда не заявляли, что ИИ применим к другим задачам, кроме предсказания структуры белков на основе их аминокислотных последовательностей. «Но некоторые энтузиасты машинного обучения поспешили предсказать конец структурной биоинформатики. Поэтому мы подумали, что было бы неплохо пойти дальше и проверить, и теперь мы знаем, что она не может предсказать эффект одиночных мутаций», — добавил Иванков.
На практическом уровне предсказание того, как отдельные мутации влияют на стабильность белка, полезно для просеивания множества возможных мутаций, чтобы определить, какие из них могут быть полезны. Это удобно, например, если вы хотите сделать белковую добавку для моющих средств для стирки , устойчивую к более высоким температурам, чтобы она могла расщеплять жиры, крахмал, волокна или другие белки в более горячей воде. Кроме того, известны сладкие белки, которые когда-нибудь можно будет использовать вместо сахара, при условии, что они выдержат жар чашки кофе или чая.
На более фундаментальном уровне результаты исследования показывают, что искусственный интеллект сегодня не панацея, и хотя он может быть чрезвычайно успешным в решении одной проблемы, остаются другие, включая около дюжины серьезных проблем в структурной биоинформатике. Среди них предсказание структуры комплексов, состоящих из белков и либо малых молекул, либо ДНК, либо РНК, определение того, как мутации влияют на энергию связывания белков с другими молекулами, и проектирование белков с последовательностями аминокислот, которые наделяют их желаемыми свойствами, такими как способность катализировать невозможные в противном случае реакции, выступая в качестве элемента крошечной «молекулярной фабрики».
Помимо напоминания о том, что даже после AlphaFold ученые в своей области должны сделать одну или две вещи, авторы исследования в PLOS ONE исследуют утверждение о том, что успех программы ИИ проистекает из ее «знания физики». в отличие от того, чтобы просто усвоить всю совокупность белковых структур, известных человечеству, и умело манипулировать ими. По-видимому, это не так, потому что, зная физику, должно быть относительно легко сравнить две очень похожие, но не идентичные структуры с точки зрения их стабильности, но это именно та задача, которую AlphaFold не выполнил.
Этот пункт подкрепляется двумя ранее высказанными оговорками относительно «знания» ИИ физики. Во-первых, AlphaFold предсказывает некоторые структуры со свисающими боковыми группами таким образом, что предполагает, что ион цинка связан с ними. Однако ввод программы ограничен аминокислотной последовательностью белка, поэтому единственная причина присутствия «невидимого цинка» заключается в том, что ИИ был обучен на аналогичных белковых структурах, связанных с этим ионом. Без цинка предсказанная ориентация боковой группы противоречит физике.
Во-вторых, AlphaFold может предсказать одиночную структуру белка, которая выглядит как спираль и действительно точна — при условии, что она переплетена с двумя другими такими же цепями. Без них предсказание физически несостоятельно. Таким образом, вместо того, чтобы полагаться на физику, программа должна просто воспроизводить форму, которую она выделила из составной структуры.
«Интересно, что это исследование выросло из «игрового» проекта с участием участников Школы молекулярной и теоретической биологии. Мы назвали его «Игры с AlphaFold». В тот момент, когда AlphaFold стал общедоступным, наша лаборатория установила его на суперкомпьютер Жорес.Одна из игр заключалась в сравнении известных эффектов мутации с тем, что предсказывает AlphaFold для исходного и мутантного белков.Это привело к исследованию, в котором старшеклассники получили шанс одновременно испытать суперкомпьютер и продвинутый искусственный интеллект », — ведущий автор исследования, кандидат технических наук Сколтеха. – сказала студентка Марина Пак.
Теги: биотехнологии, ИИ