Компания Anthropic выпустила новую версию своей модели Sonnet среднего размера в соответствии с четырехмесячным циклом обновления. В анонсе новой модели компания Anthropic подчеркнула улучшения в программировании, выполнении инструкций и использовании компьютера.
Sonnet 4.6 будет использоваться по умолчанию для пользователей тарифных планов Free и Pro.
Бета-версия Sonnet 4.6 будет включать контекстное окно с 1 миллионом токенов, что в два раза больше самого большого окна, доступного ранее для Sonnet. Компания Anthropic описала новое контекстное окно как “достаточное для хранения целых кодовых баз, длительных контрактов или десятков исследовательских работ в одном запросе”.
Релиз состоялся всего через две недели после выхода Opus 4.6 , и обновленная модель хайку, вероятно, появится в ближайшие недели.
Компания представила новый набор рекордных тестов, в том числе OS World для использования на компьютере и SWE-Bench для разработки программного обеспечения. Но, пожалуй, самым впечатляющим является результат в 60,4% по ARC-AGI-2, который предназначен для измерения навыков, характерных для человеческого интеллекта. Оценка ставит Sonnet 4.6 выше большинства сопоставимых моделей, хотя он по-прежнему уступает таким моделям, как Opus 4.6, Gemini 3 Deep Think и одной усовершенствованной версии GPT 5.2.