Большие языковые модели, обученные на основе обширных наборов данных, могут ускорить геномные исследования, упростить клиническую документацию, улучшить диагностику в режиме реального времени, поддержать принятие клинических решений, ускорить разработку лекарств и даже генерировать синтетические данные для продвижения экспериментов.
Но их обещание преобразовать биомедицинские исследования часто наталкивается на препятствие: помимо структурированных данных, на которые опирается здравоохранение, эти модели сталкиваются с трудностями в таких крайних случаях, как редкие заболевания и необычные состояния, когда надежных и репрезентативных данных недостаточно.
Базирующаяся в Нью-Йорке компания Mantis Biotech утверждает, что разрабатывает решение, позволяющее восполнить этот пробел в доступности данных. Платформа компании объединяет разрозненные источники данных для создания синтетических наборов данных, которые могут быть использованы для создания так называемых “цифровых двойников” человеческого тела: основанных на физике прогностических моделей анатомии, физиологии и поведения.
Компания предлагает использовать этих цифровых двойников для сбора и анализа данных. Эти цифровые двойники могут быть использованы для изучения и тестирования новых медицинских процедур, обучения роботов-хирургов, а также для моделирования и прогнозирования медицинских проблем или даже моделей поведения. Например, спортивная команда может предсказать вероятность того, что у конкретного игрока НФЛ может развиться травма ахиллесовой пяты, основываясь на его недавней игре, тренировочной нагрузке, диете и том, как долго он занимается спортом, - объяснила AGI_LOG в недавнем интервью основатель и генеральный директор Mantis Джорджия Уитчел.
Для создания этих двойников платформа Mantis сначала использует данные из различных источников, таких как учебники, камеры захвата движения, биометрические датчики, журналы тренировок и медицинские изображения. Затем он использует систему на базе LLM для маршрутизации, проверки и синтеза различных потоков данных и прогоняет всю эту информацию через физический движок для создания высокоточных изображений этого набора данных, которые затем могут быть использованы для обучения прогнозных моделей.
“Мы можем взять все эти разрозненные источники данных и затем превратить их в прогнозирующие модели того, как люди будут работать. Поэтому в любое время, когда вы захотите предсказать, как будет работать человек, это действительно хороший вариант использования нашей технологии”, - сказал Уитчел.
Уровень физического движка здесь является ключевым, сказал Уитчел AGI_LOG, потому что он помогает платформе расширять доступную информацию, основывая сгенерированные синтетические данные и реалистично моделируя физику анатомии.
“Если бы я попросил вас оценить положение рук человека, у которого отсутствует палец, это было бы очень, очень сложно, потому что нет общедоступных наборов данных о положении рук человека, у которого отсутствует палец. Мы могли бы сгенерировать этот набор данных очень-очень просто, потому что мы просто берем нашу физическую модель и говорим: ”удалите палец X, восстановите модель", - сказала она.
Поскольку платформа Mantis заполняет пробелы в источниках данных, Уитчел считает, что у нее есть потенциал для широкого использования в биомедицинской отрасли, где информация о процедурах или пациентах может быть труднодоступной, неструктурированной или разрозненной по различным источникам. Она обратила особое внимание на крайние случаи или редкие заболевания, когда трудно получить данные, поскольку часто существуют этические и нормативные ограничения, связанные с включением данных пациентов в общедоступные наборы данных или их использованием для обучения моделей искусственного интеллекта.
“Вы знаете, как это бывает, когда вы видите трехлетнего ребенка, бегающего вокруг, и у него есть Барби, и он держит ее за одну ногу и бьет ею о стол? Я хочу, чтобы у людей было такое же отношение к нашим цифровым близнецам”, - сказала она. “Я думаю, это откроет людям глаза на то, что людей можно тестировать, когда вы используете виртуальных людей. Я чувствую, что в настоящее время люди придерживаются прямо противоположного мышления, что вполне логично, потому что следует уважать частную жизнь людей. На самом деле, я не думаю, что данные людей вообще следует использовать, особенно когда у вас есть эти цифровые двойники”.
На данный момент Mantis добилась успеха в профессиональном спорте, вероятно, потому, что существует потребность в моделировании спортсменов с высокими показателями. Уитчел сказал, что одним из основных клиентов стартапа является команда НБА.
“Мы создаем эти цифровые изображения спортсменов, где в основном показано, как прыгал этот спортсмен, не только сегодня, но и за каждый день за прошедший год, и как менялись их прыжки с течением времени по сравнению с тем, сколько они спали, или по сравнению с тем, сколько раз они прыгали. иногда они поднимают руки над головой”, - объяснила она.
Недавно стартап привлек $7,4 млн начального финансирования под руководством Decibel VC при участии Y Combinator, нескольких бизнес-ангелов и Liquid 2. Средства будут использованы для найма персонала, рекламы, маркетинга и вывода на рынок.
Следующим шагом для Mantis, по словам Уитчела, является продолжение разработки технологии и, в конечном счете, предоставление платформы широкой публике, ориентированной на профилактическое здравоохранение. Компания также работает с фармацевтическими лабораториями и исследователями, участвующими в испытаниях FDA, стремясь получить представление о том, как пациенты реагируют на лечение.