Поделиться
VK Telegram OK

Cohere запускает семейство открытых многоязычных моделей

Искусственный интеллект
AGILog · 2026-02-17 09:00

Корпоративная ИИ-компания Cohere представила новое семейство многоязычных моделей в рамках проходящего в Индии саммита по ИИ. Модели, получившие название Tiny Aya, являются общедоступными - это означает, что их базовый код доступен для использования и модификации любым желающим, — поддерживают более 70 языков и могут работать на обычных устройствах, таких как ноутбуки, без подключения к Интернету.

Модель, запущенная исследовательским подразделением компании Cohere Labs, поддерживает языки Южной Азии, такие как бенгальский, хинди, панджаби, урду, гуджарати, тамильский, телугу и маратхи.

Базовая модель содержит 3,35 миллиарда параметров — показатель ее размера и сложности. Компания Cohere также выпустила версию TinyAya-Global, доработанную для лучшего выполнения команд пользователя, для приложений, требующих широкой языковой поддержки. Региональные варианты дополняют семейство: TinyAya - Земля для африканских языков; TinyAya - Огонь для языков Южной Азии; и TinyAya - Вода для Азиатско-Тихоокеанского региона, Западной Азии и Европы.

“Такой подход позволяет каждой модели развить более сильную лингвистическую основу и культурные нюансы, создавая системы, которые кажутся более естественными и надежными для сообществ, которым они призваны служить. В то же время все модели Tiny Aya сохраняют широкий многоязычный охват, что делает их гибкими отправными точками для дальнейшей адаптации и исследований”, - говорится в заявлении компании.

Коэр отметил, что эти модели, которые были разработаны на одном кластере из 64 графических процессоров H100 (тип мощного чипа от Nvidia) с использованием относительно скромных вычислительных ресурсов, идеально подходят для исследователей и разработчиков, создающих приложения для аудитории, говорящей на родных языках. Модели могут запускаться непосредственно на устройствах, поэтому разработчики могут использовать их для автономного перевода. Компания отметила, что разработала базовое программное обеспечение для работы на устройствах, требующее меньше вычислительной мощности, чем большинство аналогичных моделей.

В странах с разным языковым составом населения, таких как Индия, такая возможность работы в автономном режиме может открыть широкий набор приложений и вариантов использования без необходимости постоянного доступа к Интернету.

Модели доступны на HuggingFace, популярной платформе для обмена и тестирования моделей искусственного интеллекта, и на платформе Cohere. Разработчики могут загрузить их на HuggingFace, Kaggle и Ollama для локального развертывания. Компания также выпускает наборы данных для обучения и оценки на HuggingFace и планирует выпустить технический отчет с подробным описанием своей методики обучения.

Генеральный директор стартапа Эйдан Гомес заявил в прошлом году, что компания планирует стать публичной “в ближайшее время”. По данным CNBC , компания завершила 2025 год на высокой ноте, продемонстрировав годовой доход в размере 240 миллионов долларов, при этом рост по сравнению с предыдущим кварталом составил 50%. этот год.