Connect with us

Hi, what are you looking for?

Наука и технологии

Искусственный интеллект для открытия лекарств дает неожиданные результаты

Искусственный интеллект для открытия лекарств дает неожиданные результаты
Искусственный интеллект для открытия лекарств дает неожиданные результаты

Какая молекула лекарства наиболее эффективна? Исследователи лихорадочно ищут эффективные активные вещества для борьбы с болезнями. Эти соединения часто прикрепляются к белкам, которые обычно представляют собой ферменты или рецепторы, запускающие определенную цепочку физиологических действий.

В некоторых случаях определенные молекулы также предназначены для блокирования нежелательных реакций в организме, таких как чрезмерная воспалительная реакция. Учитывая обилие доступных химических соединений , это исследование на первый взгляд похоже на поиск иголки в стоге сена. Таким образом, при открытии лекарств делается попытка использовать научные модели, чтобы предсказать, какие молекулы лучше всего пристыкуются к соответствующему целевому белку и прочно свяжутся. Эти потенциальные кандидаты на лекарства затем более подробно изучаются в экспериментальных исследованиях.

С появлением искусственного интеллекта в исследованиях по поиску лекарств все чаще используются приложения машинного обучения. В качестве одной из «Графовых нейронных сетей» (GNN) предоставляется одна из нескольких возможностей для таких приложений. Они приспособлены, например, для прогнозирования того, насколько сильно определенная молекула связывается с целевым белком.

Для этого модели GNN обучаются с помощью графов, которые представляют собой комплексы, образующиеся между белками и химическими соединениями (лигандами). Графы обычно состоят из узлов, представляющих объекты, и ребер, представляющих отношения между узлами. В графических представлениях комплексов белок-лиганд ребра соединяют только узлы белка или лиганда, представляющие их структуры соответственно, или узлы белка и лиганда, представляющие конкретные взаимодействия белок-лиганд.

«То, как GNN приходят к своим предсказаниям, похоже на черный ящик, в который мы не можем заглянуть», — говорит профессор, доктор Юрген Байорат. Исследователь хемоинформатики из Института LIMES Боннского университета, Международного центра информационных технологий Бонн-Аахен (B-IT) и Института машинного обучения и искусственного интеллекта Ламарра в Бонне вместе с коллегами из Университета Сапиенца в Риме, подробно проанализировал, действительно ли графовые нейронные сети изучают взаимодействия белок-лиганд, чтобы предсказать, насколько сильно активное вещество связывается с целевым белком.

Исследование опубликовано в журнале Nature Machine Intelligence.

Как работают приложения искусственного интеллекта?

Исследователи проанализировали в общей сложности шесть различных архитектур GNN, используя специально разработанный метод «EdgeSHAPer» и концептуально другую методологию сравнения. Эти компьютерные программы «проверяют», изучают ли GNN наиболее важные взаимодействия между соединением и белком и тем самым прогнозируют эффективность лиганда, как предполагалось и ожидают исследователи, или ИИ приходит к предсказаниям другими способами.

«GNN очень зависят от данных, на которых они обучаются», — говорит первый автор исследования, доктор философии. кандидат Андреа Мастропьетро из Университета Сапиенца в Риме, который проводил часть своих докторских исследований в группе профессора Баджората в Бонне.

Ученые обучили шесть GNN с помощью графиков, извлеченных из структур белково-лигандных комплексов, для которых механизм действия и сила связывания соединений с целевыми белками уже были известны из экспериментов. Обученные GNN затем были протестированы на других комплексах. Последующий анализ EdgeSHAPer позволил понять, как GNN генерировали многообещающие прогнозы.

«Если GNN делают то, что от них ожидают, им необходимо изучить взаимодействие между соединением и целевым белком, и прогнозы должны определяться путем определения приоритетности конкретных взаимодействий», — объясняет профессор Баджорат. Однако, согласно анализу исследовательской группы, шесть GNN по существу не смогли этого сделать.

Большинство GNN изучили лишь несколько взаимодействий белок-лекарство и в основном сосредоточились на лигандах. Баджорат говорит: «Чтобы предсказать силу связывания молекулы с целевым белком, модели в основном «запоминали» химически схожие молекулы, с которыми они столкнулись во время обучения, и данные их связывания, независимо от целевого белка. Эти изученные химические сходства затем по существу определяли предсказания».

По мнению ученых, во многом это напоминает «эффект Умного Ганса». Этот эффект относится к лошади, которая, очевидно, умеет считать. То, как часто Ганс постукивал копытом, должно было указывать на результат вычислений. Однако, как выяснилось позже, лошадь вообще не умела считать, а выводила ожидаемые результаты по нюансам мимики и жестов своего спутника.

Что эти результаты означают для исследований по открытию лекарств? «Как правило, неправдоподобно, что GNN изучают химические взаимодействия между активными веществами и белками», — говорит ученый-хемиинформатик.

Их прогнозы во многом переоценены, поскольку прогнозы эквивалентного качества можно сделать, используя химические знания и более простые методы. Однако исследование также открывает возможности ИИ.

Две модели, исследованные GNN, продемонстрировали явную тенденцию к изучению большего количества взаимодействий при увеличении эффективности тестируемых соединений. «Здесь стоит присмотреться», — говорит Баджорат. Возможно, эти GNN можно было бы улучшить в желаемом направлении за счет модифицированных представлений и методов обучения.

Однако к предположению о том, что физические величины можно изучить на основе молекулярных графов, вообще следует относиться с осторожностью. «ИИ — это не черная магия», — говорит Баджорат.

Фактически, он рассматривает предыдущую публикацию EdgeSHAPer и других специально разработанных инструментов анализа в открытом доступе как многообещающие подходы, позволяющие пролить свет на черный ящик моделей ИИ. Подход его команды в настоящее время сосредоточен на GNN и новых «моделях химического языка».

«Разработка методов объяснения предсказаний сложных моделей является важной областью исследований ИИ. Существуют также подходы к другим сетевым архитектурам, таким как языковые модели, которые помогают лучше понять, как машинное обучение достигает своих результатов», — говорит Баджорат.

Он ожидает, что вскоре интересные события произойдут и в области «Объяснимого ИИ» в Институте Ламарра, где он является научным сотрудником и заведующим кафедрой ИИ в науках о жизни.

Теги: биотехнологии, ИИ

В тренде