Поделиться
VK Telegram OK

Мультивселенские вычисления продвигают свои сжатые модели искусственного интеллекта в мейнстрим

Искусственный интеллект
AGILog · 2026-03-19 08:00

С учетом того, что дефолты частных компаний составляют более 9,2% — самый высокий показатель за последние годы — венчурная компания Lux Capital недавно посоветовала компаниям, использующим искусственный интеллект, письменно подтвердить свои обязательства по вычислительной мощности . Лакс предупредил, что в условиях финансовой нестабильности, распространяющейся по цепочке поставок ИИ, простого соглашения недостаточно.

Но есть и другой вариант - полностью отказаться от использования внешней вычислительной инфраструктуры. Модели искусственного интеллекта меньшего размера, которые запускаются непосредственно на устройстве пользователя — без центра обработки данных, облачного провайдера и рисков для контрагентов, — становятся достаточно хорошими, чтобы их стоило рассмотреть. И Мультивселенские вычисления поднимают свою руку.

Испанский стартап до сих пор держался в тени некоторых своих коллег, но по мере роста спроса на эффективность искусственного интеллекта ситуация меняется. После сжатия моделей из крупнейших лабораторий искусственного интеллекта, включая OpenAI, Meta, DeepSeek и Mistral AI, компания запустила приложение, демонстрирующее возможности своих сжатых моделей, и портал API — шлюз, который позволяет разработчикам получать доступ к этим моделям и создавать с их помощью, что делает их более доступными.

Приложение CompactifAI, название которого совпадает с технологией сжатия данных, основанной на квантовой технологии Multiverse, представляет собой инструмент для общения с искусственным интеллектом в духе ChatGPT или Le Chat от Mistral. Задайте вопрос, и модель ответит. Разница в том, что в Multiverse встроена модель Gilda, которая, по словам компании, настолько мала, что может работать как локально, так и в автономном режиме.

Для конечных пользователей это новый опыт работы с искусственным интеллектом, когда данные не покидают их устройства и не требуют подключения. Но есть одно предостережение: на их мобильных устройствах должно быть достаточно оперативной памяти и места для хранения. Если они этого не сделают — а многие старые iPhone этого не сделают, — приложение снова переключится на облачные модели через API. Маршрутизация между локальной и облачной обработкой данных осуществляется автоматически с помощью системы, которую Мультивселенная назвала Ash Nazg, чье название будет на слуху у поклонников Толкиена, поскольку оно отсылает к надписи One Ring из “Властелина колец”. Но когда приложение переходит в облако, оно теряет свои основные преимущества в плане конфиденциальности.

Эти ограничения означают, что CompactifAI еще не совсем готова к массовому внедрению пользователями, хотя, возможно, это никогда и не было целью. Согласно данным Sensor Tower, за последний месяц приложение загрузили менее 5000 человек.

Реальная цель - бизнес. Сегодня Multiverse запускает портал API с самообслуживанием, который предоставляет разработчикам и предприятиям прямой доступ к сжатым моделям - AWS Marketplace не требуется.

“Портал CompactifAI API [теперь] предоставляет разработчикам прямой доступ к сжатым моделям с прозрачностью и контролем, необходимыми для их запуска в производство”, - говорится в заявлении генерального директора Энрике Лизасо.

Мониторинг использования в режиме реального времени - одна из ключевых функций API, и это не случайно. Наряду с потенциальными преимуществами развертывания на периферии, более низкие вычислительные затраты являются одной из основных причин, по которой предприятия рассматривают модели меньшего размера в качестве альтернативы большим языковым моделям (LLM).

Также помогает то, что небольшие модели менее ограничены, чем раньше. Ранее на этой неделе компания Mistral обновила семейство моделей small, выпустив версию Mistral Small 4, которая, по ее словам, одновременно оптимизирована для общего общения, программирования, агентурных задач и рассуждения. Французская компания также выпустила систему Forge, которая позволяет предприятиям создавать пользовательские модели, в том числе небольшие модели, для которых они могут выбирать компромиссы, наиболее приемлемые для их вариантов использования.

Недавние результаты Multiverse также свидетельствуют о том, что разрыв с LLM сокращается. Его последняя сжатая модель, HyperNova 60B 2602 , построена на gpt-oss-120b — модели OpenAI, базовый код которой находится в открытом доступе. Компания утверждает, что теперь она обеспечивает более быстрые ответы при меньших затратах, чем исходная версия, на основе которой она была создана, - преимущество, которое особенно важно для рабочих процессов агентного кодирования, когда ИИ автономно выполняет сложные, многоступенчатые задачи программирования.

Создание моделей, достаточно компактных для работы на мобильных устройствах и при этом сохраняющих свою полезность, является сложной задачей. Apple Intelligence решила эту проблему, объединив модель на устройстве и облачную модель. Приложение CompactifAI от Multiverse также может направлять запросы на gpt-oss-120b через API, но его главная цель - продемонстрировать, что местные модели, такие как Gilda и ее будущие замены, имеют преимущества, выходящие за рамки экономии средств.

Для работников в критически важных областях модель, которая может работать локально и без подключения к облаку, обеспечивает большую конфиденциальность и устойчивость. Но еще большую ценность она может принести в бизнес–приложениях - например, при внедрении искусственного интеллекта в дроны, спутники и другие устройства, где подключение не может быть само собой разумеющимся.

Компания уже обслуживает более 100 клиентов по всему миру, включая Bank of Canada, Bosch и Iberdrola, но расширение клиентской базы может помочь ей привлечь больше финансирования. После привлечения 215 миллионов долларов в серии B в прошлом году, сейчас ходят слухи о новом раунде финансирования в размере 500 миллионов евро на сумму более €1,5 миллиарда.