Вся известная Вселенная кишит бесконечным числом молекул. Но какая часть этих молекул обладает потенциальными лекарственными свойствами, которые можно использовать для разработки лекарств, спасающих жизнь? Миллионы? Миллиарды? Триллионы? Ответ: novemdecillion, или 10 60 . Это гигантское число продлевает процесс разработки лекарств от быстро распространяющихся болезней, таких как COVID-19, потому что оно выходит далеко за рамки того, что могут вычислить существующие модели разработки лекарств. Для сравнения: в Млечном Пути около 100 000 000 000, или 10 8 , звезд.
В документе, который будет представлен на Международной конференции по машинному обучению (ICML), исследователи Массачусетского технологического института разработали геометрическую модель глубокого обучения под названием EquiBind, которая в 1200 раз быстрее, чем одна из самых быстрых существующих вычислительных моделей молекулярной стыковки, QuickVina2-W, в успешно связывает молекулы, подобные лекарствам, с белками. EquiBind основан на своем предшественнике, EquiDock, который специализируется на связывании двух белков с использованием метода, разработанного покойным Октавианом-Югеном Ганеа, недавней Лабораторией компьютерных наук и искусственного интеллекта Массачусетского технологического института и Клиникой машинного обучения Абдула Латифа Джамиля в области здравоохранения (клиника Джамиля). postdoc, который также является соавтором статьи EquiBind.
Прежде чем разработка лекарства может начаться, исследователи лекарств должны найти многообещающие лекарственные молекулы, которые могут правильно связываться или «стыковаться» с определенными белковыми мишенями в процессе, известном как открытие лекарств . После успешной стыковки с белком связывающее лекарство, также известное как лиганд, может остановить функционирование белка. Если это происходит с незаменимым белком бактерии, он может убить бактерию, обеспечив защиту человеческому организму.
Тем не менее, процесс открытия лекарств может быть дорогостоящим как в финансовом, так и в вычислительном отношении, поскольку в этот процесс вливаются миллиарды долларов, а на разработку и тестирование уходит более десяти лет до окончательного утверждения Управлением по санитарному надзору за качеством пищевых продуктов и медикаментов. Более того, 90 % всех лекарств терпят неудачу после испытания на людях из-за отсутствия эффекта или слишком большого количества побочных эффектов. Один из способов, которым фармацевтические компании возмещают затраты на эти неудачи, — это повышение цен на лекарства, которые пользуются успехом.
Текущий вычислительный процесс для поиска перспективных молекул-кандидатов выглядит следующим образом: большинство современных вычислительных моделей основаны на большой выборке кандидатов в сочетании с такими методами, как оценка, ранжирование и точная настройка, чтобы получить наилучшее «соответствие» между молекулами. лиганд и белок.
Ханнес Штарк, первокурсник факультета электротехники и компьютерных наук Массачусетского технологического института и ведущий автор статьи, сравнивает типичные методологии связывания лиганда с белком с «попыткой вставить ключ в замок с большим количеством замочных скважин». .» Типичные модели отнимают много времени и оценивают каждое «соответствие», прежде чем выбрать лучшее. Напротив, EquiBind напрямую предсказывает точное расположение ключа за один шаг без предварительного знания целевого кармана белка, что известно как «слепая стыковка».
В отличие от большинства моделей, которые требуют нескольких попыток найти благоприятное положение для лиганда в белке, EquiBind уже имеет встроенные геометрические рассуждения, которые помогают модели изучать основную физику молекул и успешно обобщать, чтобы делать более точные прогнозы при столкновении с новыми, невидимыми данными.
Публикация этих результатов быстро привлекла внимание профессионалов отрасли, в том числе Пэта Уолтерса, директора по данным Relay Therapeutics. Уолтерс предложил команде испытать свою модель на уже существующем лекарстве и белке, используемых при раке легких, лейкемии и опухолях желудочно-кишечного тракта. В то время как большинство традиционных методов стыковки не смогли успешно связать лиганды, которые работали с этими белками, EquiBind удалось.
«EquiBind предлагает уникальное решение проблемы стыковки, которое включает в себя как предсказание позы, так и идентификацию места привязки», — говорит Уолтерс. «Этот подход, который использует информацию из тысяч общедоступных кристаллических структур, может по-новому повлиять на эту область».
«Мы были поражены тем, что в то время как все другие методы давали совершенно неверные результаты или давали только один правильный результат, EquiBind смог поместить его в правильный карман, поэтому мы были очень рады увидеть результаты для этого», — говорит Старк.
Несмотря на то, что EquiBind получил множество отзывов от профессионалов отрасли, которые помогли команде рассмотреть практическое применение вычислительной модели, Штерк надеется найти различные точки зрения на предстоящем ICML в июле.
«Больше всего я жду отзывов о том, как еще улучшить модель», — говорит он. «Я хочу обсудить с этими исследователями… рассказать им, какие, по моему мнению, могут быть следующие шаги, и побудить их двигаться вперед и использовать модель для своих собственных статей и для своих собственных методов… у нас уже есть много исследователей, которые связались и спрашивая, думаем ли мы, что модель может быть полезна для решения их проблемы».
Эта работа посвящена памяти Октавиана-Евгения Ганеи, который внес решающий вклад в исследования в области геометрического машинного обучения и щедро наставлял многих студентов — блестящего ученого со скромной душой.
Теги: ИИ