Наука и технологии

Самую большую в мире базу данных для квантовой химии выложили Российские ученые

Published

13.02.2025

Самую большую в мире базу данных для квантовой химии выложили Российские ученые

Разработка новых лекарственных препаратов и материалов зависит от качества предсказания физических и химических свойств будущего продукта. Один из новых и популярных подходов к решению подобных задач – применение методов на стыке квантовой химии и искусственного интеллекта. Однако для обучения моделей ИИ предсказанию свойств молекул необходим доступ к соответствующей информации о каждой из их многочисленных характеристик, а качество предсказания будет зависеть от количества и разнообразия данных. Ученые из Института искусственного интеллекта AIRI создали и выложили в открытый доступ крупнейший в мире набор данных по квантовой химии, чтобы расширить возможности исследований в области поиска новых материалов и разработки лекарств. Исследование опубликовано в журнале Physical Chemistry Chemical Physics.

Прогнозирование свойств молекулы — важный этап создания нового препарата, и машинное обучение способно ускорить и упростить этот процесс. Проверка работы моделей ИИ для химии, в отличие от популярных моделей для генерации изображений или текстов, очень трудозатратна: нужно пойти в «мокрую» лабораторию, провести эксперименты в реальном мире, синтезировать структуру и затем оценить каждое её свойство. Вместо дорогостоящих экспериментов некоторые свойства можно оценить с помощью методов квантовой химии. Например, решение уравнения Шредингера помогает понять, что происходит между атомами и электронами, смоделировать поведение молекулы или материала и вычислить их теоретические свойства. Объем вычислений, необходимых для точного решения уравнения Шредингера, экспоненциально растет с увеличением числа электронов, и здесь на помощь ученым приходят нейронные сети. Именно они позволяют эффективно «перенести» дорогие эксперименты в цифровую плоскость. Вместо того, чтобы предсказывать конкретное свойство молекулярной структуры, эти методы направлены на оценку молекулярной конформации — то есть трехмерного расположения атомов в молекуле путем предсказания ее квантовых свойств.

Чтобы сделать применение методов ИИ в квантовой химии повсеместным, научному сообществу необходимо большее количество специализированных данных. По словам Артура Кадурина, руководителя научной группы «Глубокое обучение в науках о жизни» AIRI, подавляющее большинство исследований, недавно проведенных в этой области, ограничивается экспериментами на небольшом количестве структур разных веществ, что ставит под сомнение применимость моделей ИИ в реальных задачах индустрий.

С целью решения этой проблемы ученые Института AIRI при поддержке коллег из Сколтеха и ПОМИ РАН собрали 5 340 152 конформаций для 1 004 918 подобных лекарствам молекул, а также их квантовые свойства, и выложили базу данных в открытый доступ на маркетплейс артефактов машинного обучения DataHub. Доступ к датасету возможен через платформу ML Space. В дополнение к данным в набор включили 4 модели для предсказания энергии молекулярной конформации и 2 модели для работы с теорией функционала плотности.

Хотя получить модели, близкие к химической точности, по-прежнему сложно, экспериментальные данные показывают, что большие наборы данных приводят к повышению качества моделей ИИ. Научная группа планирует дальше пополнять уже собранную базу и надеется, что эта работа сделает in silico эксперименты более доступными, а точность предоставляемых результатов приблизится к качеству лабораторных исследований.

Самую большую в мире базу данных для квантовой химии выложили Российские ученые

Теги: биотехнологии, ИИ, квант

In this article:

Наука и технологии

COVID может повысить вероятность развития иммунных заболеваний, таких как болезнь Крона и алопеция

Корейские исследователи сообщают, что в редких случаях у некоторых пациентов после приступа COVID может развиться аутоиммунное заболевание. Такие состояния, как алопеция ( выпадение волос...

digiversion24.08.2024

Больший порог лимфатических узлов оптимизирует исходы рака носоглотки

Наука и технологии

Больший порог лимфатических узлов оптимизирует исходы рака носоглотки

По данным Американского журнала рентгенологии ( AJR ) , использование порога 6 мм вместо порога 5 мм помогает облегчить стратификацию риска и принятие решений...

digiversion13.10.2024

Представлен робот, который может двигаться за счет отражения водных волн

Наука и технологии

Представлен робот, который может двигаться за счет отражения водных волн

Странные вещи могут произойти, когда волна достигает границы. В океане волны цунами, едва заметные на глубокой воде, могут стать довольно большими на континентальном шельфе и...

digiversion24.09.2025

Разработана модель для определения полярности настроений слов втекстах

Наука и технологии

Разработана модель для определения полярности настроений слов втекстах

Модель для автоматического определения полярности настроений определенных слов в письменных текстах. В последние годы ученые-компьютерщики пытались разработать эффективные модели для анализа настроений. Эти модели...

digiversion06.11.2024

digiversion.ru

digiversion.ru

Наука и технологии

Самую большую в мире базу данных для квантовой химии выложили Российские ученые

В тренде

Наука и технологии

COVID может повысить вероятность развития иммунных заболеваний, таких как болезнь Крона и алопеция

Наука и технологии

Больший порог лимфатических узлов оптимизирует исходы рака носоглотки

Наука и технологии

Представлен робот, который может двигаться за счет отражения водных волн

Наука и технологии

Разработана модель для определения полярности настроений слов втекстах

Наука и технологии

Комбинированная терапия превосходит химиотерапию в клинических испытаниях

Наука и технологии

Нейронная активность формирует развитие астроцитов

Наука и технологии

Уязвимость к различным мутациям COVID-19 зависит от предыдущих инфекций и вакцинации

Наука и технологии

Уникальный патогенетический механизм омикронного варианта SARS-CoV-2

Наука и технологии

Перитонит связан со смертностью от сердечно-сосудистых заболеваний

Наука и технологии

3D-печать чернилами, насыщенными бактериями, позволяет получать композиты, похожие на кости

You May Also Like

Наука и технологии

COVID может повысить вероятность развития иммунных заболеваний, таких как болезнь Крона и алопеция

Наука и технологии

Больший порог лимфатических узлов оптимизирует исходы рака носоглотки

Наука и технологии

Представлен робот, который может двигаться за счет отражения водных волн

Наука и технологии

Разработана модель для определения полярности настроений слов втекстах