Отраслевой информационный портал

В университете ИТМО разработали мультиагентную ИИ-систему для поиска лекарств с точностью до 80%

Сотрудники Университета ИТМО при поддержке учёных Центра практического искусственного интеллекта Сбера разработали мультиагентную ИИ-систему MADD (Multi-Agent Drug Discovery), предназначенную для ускоренной идентификации хитов (hit identification) в раннем процессе открытия лекарств.

Система MADD не только генерирует новые молекулы в виртуальном пространстве, но и полностью автоматизирует процесс их поиска и отбора. По результатам тестирования, программа работает с высокой точностью — почти 80% (79,8%) предложенных ею вариантов соответствуют заданным критериям.

Превосходство над аналогами

Высокая точность MADD значительно превосходит показатели существующих LLM-решений. Например, зарубежный аналог ChemAgent выдает корректные результаты лишь в 16,4% случаев на самых сложных задачах (Dataset L), тогда как MADD достигает 79,8% финальной точности (FA).

Как отметила старший научный сотрудник исследовательского центра «Сильный искусственный интеллект в промышленности» ИТМО Анна Калюжная, модель не просто генерирует новые молекулы, но и полностью автоматизирует весь цикл поиска — от анализа текстового запроса пользователя до выдачи готового списка перспективных кандидатов с рассчитанными свойствами. Исследовательский центр «Сильный ИИ в промышленности», центр ИИ в химии и научно-образовательный центр инфохимии ИТМО работали над созданием системы при индустриальной поддержке Сбера.

Архитектура «оркестра» MADD

MADD представляет собой комплексное сквозное (end-to-end) решение, которое использует мультиагентную архитектуру для управления сложностью автоматизации рабочих процессов. Система состоит из четырех специализированных ИИ-агентов, которые координируют выполнение подзадач:

  1. Decomposer (Декомпозитор): Получает текстовый запрос от пользователя и, в случае сложных задач, разбивает его на более простые подзадачи.
  2. Orchestrator (Оркестратор): Получает задачи от Декомпозитора, составляет план действий и вызывает необходимые инструменты (генеративные или прогностические модели).
  3. Summarizer (Резюматор): Собирает результаты в связный ответ, представляя сгенерированные молекулы и их рассчитанные свойства в структурированном формате.
  4. Chat Agent (Чат-агент): Помогает пользователю сформулировать запрос и запрашивает недостающие данные.

Специализация агентов помогает смягчить накопление ошибок в сложных цепочках и обеспечить гибкость при построении многошаговых процессов.

Комплексная проверка молекул

MADD использует набор интегрированных инструментов, включая модели глубокой генерации молекул и ML-модели для прогнозирования свойств. Каждую сгенерированную молекулу система проверяет по нескольким критическим критериям:

  • Биологическая активность (измеряется, например, по значению IC50 — концентрации, необходимой для ингибирования биологического процесса на 50%).
  • Сродство связывания.
  • Синтетическая доступность (SA Score — оценка сложности лабораторного синтеза).
  • Лекарственное подобие (Drug-likeness, QED).
  • Отсутствие токсичности (проверка с помощью фильтров, таких как Brenk, PAINS, Glaxo и SureChEMBL).

Новые кандидаты для семи заболеваний

Ученые ИТМО использовали MADD для поиска перспективных молекул, нацеленных на разработку препаратов против семи серьезных заболеваний, болезнь Альцгеймера, болезнь Паркинсона, рассеянный склероз, рак легких, дислипидемия, устойчивость к препаратам против рака (множественная лекарственная устойчивость), тромбоцитопения.

Исследования MADD также впервые применили ИИ-дизайн лекарств к пяти конкретным биологическим мишеням: STAT3, ABL, COMT, ACL и PCSK9. В ходе работы были сгенерированы сразу пять перспективных молекул, борющихся с белками, связанными с развитием упомянутых заболеваний.

Эффективность MADD была подтверждена на «невиданном» ранее случае тромбоцитопении. MADD сгенерировала 10 тысяч молекул, 132 из которых соответствовали всем пяти фильтрам свойств. Это показывает превосходную эффективность системы по сравнению с методом SYK-FBRL, который для получения 139 хитов сгенерировал 76 тысяч молекул.

spot_img

Экспертные материалы