Дефицит данных и создание MetalCytoToxDB
Некоторые металлы в составе химических комплексов обладают способностью проникать внутрь раковых клеток и разрушать их: блокировать деление, повреждать ДНК или запускать механизм клеточной гибели. Классическим примером такого действия является препарат цисплатин.
Поиск новых металлсодержащих лекарств длительное время был затруднен из-за отсутствия систематизированных массивов информации. Существующие международные базы данных не содержали достаточных сведений о действии подобных комплексов на опухолевые клетки, что делало невозможным применение технологий искусственного интеллекта. Для решения задачи российские химики структурировали данные из более чем 1900 рецензируемых научных публикаций.
Масштаб исследования и практическое применение
Результатом работы стала платформа MetalCytoToxDB. На сегодняшний день она содержит результаты испытаний на 754 различных типах опухолевых клеток. В новую базу включено более 26 500 значений показателя IC50 (концентрация вещества, необходимая для подавления активности клеток на 50%) для 7050 комплексов пяти переходных металлов:
- рутения;
- иридия;
- родия;
- рения;
- осмия.
Собранный массив данных позволил обучить нейросети. Созданные модели машинного обучения способны прогнозировать, будет ли новое соединение подавлять рост раковых клеток. Технология успешно прошла проверку: алгоритм, обученный на научных статьях до 2024 года, протестировали на работах 2025 года. В 9 из 10 случаев модель верно определяла перспективные соединения. По оценкам исследователей, такая точность в два раза превышает результаты случайного отбора.
Внедрение предиктивной модели в научную практику позволит сузить круг веществ-кандидатов, снизив потребность фармацевтической отрасли в проведении длительных лабораторных испытаний неэффективных молекул.

