Большинство корпоративных проектов в области искусственного интеллекта терпят неудачу не потому, что компаниям не хватает технологий, а потому, что модели, которые они используют, не понимают их бизнес. Модели часто разрабатываются в Интернете, а не на основе многолетних внутренних документов, рабочих процессов и институциональных знаний.
Именно в этом разрыве Mistral , французский стартап в области искусственного интеллекта, видит новые возможности. Во вторник компания анонсировала Mistral Forge - платформу, которая позволяет предприятиям создавать пользовательские модели, обученные на основе их собственных данных. Компания Mistral анонсировала платформу на Nvidia GTC, ежегодной технологической конференции Nvidia, которая в этом году в основном посвящена моделям искусственного интеллекта и агентов для предприятий.
Это целенаправленный шаг для Mistral, компании, которая построила свой бизнес на корпоративных клиентах, в то время как конкуренты OpenAI и Anthropic вырвались вперед в плане внедрения среди потребителей. Генеральный директор Артур Менш (Arthur Mensch) говорит, что ориентация Mistral на развитие предприятия оправдывает себя: компания находится на пути к тому, чтобы превысить годовой доход в 1 миллиард долларов в этом году.
По словам Мистраля, существенная роль в удвоении корпоративного потенциала заключается в предоставлении компаниям большего контроля над своими данными и системами искусственного интеллекта.
“Forge позволяет предприятиям и правительствам настраивать модели искусственного интеллекта под свои конкретные нужды”, - рассказала AGI_LOG Элиза Саламанка, руководитель отдела продуктов Mistral.
Несколько компаний, работающих в сфере корпоративного ИИ, уже заявляют, что предлагают аналогичные возможности, но большинство из них сосредоточены на тонкой настройке существующих моделей или распределении запатентованных данных по уровням с помощью таких методов, как поиск и генерация дополненной информации ( RAG ). Эти подходы не требуют фундаментальной переобучения моделей; вместо этого они адаптируют их или запрашивают во время выполнения, используя данные компании.
Мистраль, напротив, говорит, что это позволяет компаниям обучать модели с нуля. Теоретически это могло бы устранить некоторые ограничения более распространенных подходов — например, улучшить обработку данных, не относящихся к английскому языку или сильно зависящих от предметной области, и усилить контроль над поведением модели. Это также могло бы позволить компаниям обучать агентурные системы с использованием обучения с подкреплением и снизить зависимость от сторонних поставщиков моделей, избегая таких рисков, как изменение модели или ее устаревание.
Клиенты Forge могут создавать свои собственные модели, используя обширную библиотеку моделей искусственного интеллекта открытого типа от Mistral, которая включает в себя небольшие модели, такие как недавно представленный Mistral Small 4 . По словам соучредителя и главного технолога Mistral Тимоти Лакруа, Forge может помочь извлечь больше пользы из существующих моделей.
“При создании небольших моделей мы идем на компромисс, поскольку они просто не могут быть столь же хороши по всем параметрам, как их более крупные аналоги, и поэтому возможность их настройки позволяет нам выбирать, на чем мы делаем акцент, а от чего отказываемся”, - сказал Лакруа.
По словам Лакруа, Mistral консультирует по поводу того, какие модели и инфраструктуру использовать, но оба решения остаются за заказчиком. А для команд, которым требуется нечто большее, чем руководство, Forge предлагает команду передовых инженеров Mistral, которые напрямую взаимодействуют с заказчиками для получения нужных данных и адаптации к их потребностям - модель, заимствованная у таких компаний, как IBM и Palantir..
“Как продукт, Forge уже поставляется со всеми инструментами и инфраструктурой, позволяющими создавать синтетические конвейеры данных”, - сказал Саламанка. “Но понимание того, как создавать правильные оценки и обеспечение того, чтобы у вас был нужный объем данных, - это то, для чего у предприятий обычно нет необходимого опыта, и именно это предлагают FDE”.
Mistral уже предоставил Forge своим партнерам, включая Ericsson, Европейское космическое агентство, итальянскую консалтинговую компанию Reply и сингапурские DSO и HTX. В число первых пользователей также входит ASML, голландский производитель микросхем, который в сентябре прошлого года возглавил серию Mistral C, стоимость которой составила 11,7 млрд евро (примерно 13,8 млрд долларов на тот момент).
Эти партнерские отношения являются символом того, какими, по ожиданиям Mistral, должны быть основные варианты использования Forge. По словам Марджори Яневич (Marjorie Janiewicz), директора по доходам Mistral, к ним относятся правительства, которым необходимо адаптировать модели к своему языку и культуре; финансовые игроки с высокими требованиями к соответствию требованиям; производители, которым требуется индивидуализация; и технологические компании, которым необходимо адаптировать модели к своей кодовой базе.