Компания Evogene Ltd. представила первую в своём классе базовую модель генеративного искусственного интеллекта для проектирования малых молекул, что стало прорывом в области поиска новых соединений. Об этом было объявлено 10 июня 2025 года в сотрудничестве с Google Cloud. Модель расширяет платформу ChemPass AI от Evogene и решает давнюю проблему фармацевтики и сельского хозяйства: поиск новых молекул, соответствующих множеству сложных критериев одновременно.
От последовательного скрининга к одновременному проектированию
В традиционных исследованиях в области фармацевтики и сельского хозяйства учёные обычно тестируют один фактор за раз — сначала проверяют, работает ли соединение, затем позже тестируют на безопасность и стабильность. Этот пошаговый метод медленный, дорогой и часто заканчивается неудачей: многие перспективные соединения не выдерживают более поздних этапов.
Генеративный искусственный интеллект меняет эту парадигму. Вместо последовательной фильтрации модели искусственного интеллекта могут одновременно учитывать множество требований, проектируя молекулы, которые с самого начала являются мощными, безопасными и стабильными.
Как работают генеративные модели в ChemPass AI
В основе платформы ChemPass AI от Evogene лежит мощная новая базовая модель, обученная на огромном массиве химических данных. Компания собрала базу данных примерно из 40 миллиардов молекулярных структур — известных лекарственно-подобных соединений и разнообразных химических каркасов — чтобы научить искусственный интеллект «языку» молекул.
Используя инфраструктуру Vertex AI от Google Cloud с суперкомпьютингом на базе GPU, модель изучила закономерности из этой обширной химической библиотеки, получив беспрецедентный объём знаний о том, как выглядят лекарственно-подобные молекулы. Этот массивный режим обучения сродни обучению большой языковой модели, но вместо человеческого языка ИИ изучил химические представления.
Генеративная модель Evogene построена на архитектуре нейронной сети-трансформера, аналогичной моделям GPT, которые произвели революцию в обработке естественного языка. На самом деле система называется ChemPass-GPT, это проприетарная модель искусственного интеллекта, обученная на строках SMILES (текстовая кодировка молекулярных структур).
Оптимизация по нескольким параметрам: эффективность, токсичность, стабильность одновременно
Отличительной чертой ChemPass AI является встроенная возможность многоцелевой оптимизации. Классическая разработка лекарств часто оптимизирует одно свойство за раз, но ChemPass был разработан для одновременной работы со многими целями. Это достигается с помощью передовых методов машинного обучения, которые направляют генеративную модель к удовлетворению множества ограничений.
Вывод
Внедрение базовой модели генеративного проектирования молекул от Evogene и Google Cloud знаменует собой новую эру в науках о жизни, основанную на искусственном интеллекте. Этот инновационный подход обещает ускорить и усовершенствовать процесс открытия новых соединений, одновременно снижая затраты и повышая шансы на успех.