Поделиться
VK Telegram OK

Отличная новость для Ксая: Грок теперь довольно хорошо отвечает на вопросы о Вратах Балдура

Искусственный интеллект
AGILog · 2026-02-20 18:26

У разных лабораторий искусственного интеллекта разные приоритеты. Например, OpenAI традиционно ориентирована на обычных пользователей, в то время как ее конкурент Anthropic ориентирован на предприятия. Недавно мы обнаружили, что xAI Илона Маска уделяет особое внимание пошаговым инструкциям к видеоиграм.

В пятницу Грейс Кей из Business Insider опубликовала подробный и далеко идущий отчет о xAI , стартапе в области искусственного интеллекта , недавно приобретенном SpaceX , с особым акцентом на то, как Маск усложняет жизнь своим сотрудникам. Но этот конкретный случай выделялся на общем фоне.:

В прошлом году, по словам людей, знакомых с ситуацией, выпуск модели был отложен на несколько дней из-за того, что Маск был недоволен тем, как чат-бот отвечал на подробные вопросы о видеоигре “Baldur's Gate”. По их словам, инженеры высокого уровня были привлечены из других проектов, чтобы улучшить качество реагирования перед запуском.

Конечно, вы можете себе представить разочарование любого уважаемого и опытного инженера, который приходит на работу, думая, что будет решать фундаментальные проблемы знаний и машинного интеллекта, а оказывается втянутым в помощь 54-летнему мужчине в его видеоигре. Но этот анекдот поднимает еще более насущный вопрос: получил ли Маск в конечном итоге те игровые навыки, о которых мечтал?

Чтобы ответить на этот вопрос, наш постоянный поклонник RPG Рам Айер составил набор из пяти общих вопросов о Baldur's Gate, которые мы сравнили с xAI и тремя основными моделями в своего рода квази-тесте, который я решил провести. позвонить Бальдурбенчу .

В интересах журналистской прозрачности я опубликовал все записи чата, чтобы вы могли ознакомиться с ними здесь: Grok , ChatGPT , Клод и Близнецы .

Во-первых, хорошая новость: Grok на самом деле дает довольно хорошую информацию. Его ответы были немного перегружены геймерским жаргоном — “экономия” вместо “спасение” и "DPS" вместо "урон", - но ответы были полезными и содержательными, при условии, что вы знали, о чем идет речь. Гроку также очень нравятся таблицы и theorycraft, что примерно соответствует ожиданиям.

Существует множество руководств по Baldur's Gate, и модели, как правило, были взяты из одних и тех же, так что самые большие различия были стилистическими. ChatGPT предпочитает маркированные списки и фрагменты предложений, в то время как Gemini любит выделять важные слова жирным шрифтом.

Самым большим сюрпризом стал Claude, который был особенно обеспокоен тем, что дал мне информацию, которая испортила бы мое впечатление от игры. Когда я спросил о хороших композициях для вечеринок, он завершил руководство словами “не напрягайтесь слишком сильно и просто играйте то, что вам нравится”. Спасибо, Клод!

Важно иметь в виду, что это предметная область, о которой мы знаем (благодаря сообщению Business Insider), что xAI уделяет особое внимание достижению паритета. Так что не стоит придавать особого значения тому факту, что после отчетного спринта рекомендации Grok оказались примерно такими же, как и у других моделей. Тем не менее, приятно осознавать, что xAI может воплотить их в жизнь, если постарается.