Поделиться
VK Telegram OK

Anthropic запускает инструмент проверки кода для проверки потока кода, сгенерированного искусственным интеллектом

Искусственный интеллект
AGILog · 2026-03-09 19:41

Когда дело доходит до программирования, обратная связь с коллегами имеет решающее значение для раннего выявления ошибок, поддержания согласованности во всей кодовой базе и улучшения общего качества программного обеспечения.

Развитие “виртуального кодирования” — использования инструментов искусственного интеллекта, которые выполняют инструкции простым языком и быстро генерируют большие объемы кода, — изменило методы работы разработчиков. Хотя эти инструменты ускорили разработку, они также привели к появлению новых ошибок, угроз безопасности и малопонятности кода.

Решение Anthropic - это система проверки ИИ, предназначенная для выявления ошибок до того, как они попадут в кодовую базу программного обеспечения. Новый продукт под названием Code Review был запущен в понедельник в Claude Code .

“Мы наблюдаем значительный рост популярности Claude Code, особенно на предприятии, и один из вопросов, который мы постоянно получаем от руководителей предприятий, заключается в следующем: теперь, когда Claude Code отправляет множество запросов на извлечение, как мне убедиться, что они будут рассмотрены эффективным образом?” Кэт Ву, руководитель отдела продуктов Anthropic, рассказала AGI_LOG.

Запросы на обновление - это механизм, который разработчики используют для отправки изменений в код на проверку, прежде чем эти изменения попадут в программное обеспечение. Ву сказал, что Claude Code значительно увеличил вывод кода, что привело к увеличению количества проверок запросов на извлечение, что стало узким местом при отправке кода.

“Обзор кода - это наш ответ на этот вопрос”, - сказал Ву.

Запуск компанией Anthropic программы Code Review, которая в предварительном просмотре была представлена Claude для команд и Claude для корпоративных клиентов, приходится на поворотный момент для компании.

В понедельник компания Anthropic подала два судебных иска против Министерства обороны в ответ на то, что агентство назвало компанию Anthropic источником риска для цепочки поставок. В результате спора Anthropic, скорее всего, будет больше полагаться на свой быстро развивающийся корпоративный бизнес, количество подписок на который с начала года выросло в четыре раза. По данным компании, с момента запуска Выручка Claude Code превысила 2,5 миллиарда долларов.

“Этот продукт в значительной степени ориентирован на наших крупных корпоративных пользователей, поэтому такие компании, как Uber, Salesforce, Accenture, которые уже используют Claude Code, теперь нуждаются в помощи с огромным количеством [запросов на извлечение], которые он помогает создавать”, - сказал Ву.

Она добавила, что руководители разработчиков могут включить функцию проверки кода, которая будет запускаться по умолчанию для каждого инженера в команде. После включения она интегрируется с GitHub и автоматически анализирует запросы на обновление, оставляя комментарии непосредственно к коду с объяснением потенциальных проблем и предлагаемыми исправлениями.

По словам Ву, основное внимание уделяется исправлению логических ошибок, а не стилистических.

“Это действительно важно, потому что многие разработчики уже сталкивались с автоматической обратной связью с ИИ и раздражались, когда она не приводила к немедленным действиям”. “Мы решили сосредоточиться исключительно на логических ошибках. Таким образом, мы выявляем наиболее приоритетные проблемы для исправления”.

ИИ шаг за шагом объясняет свои рассуждения, в чем, по его мнению, заключается проблема, почему она может быть проблематичной и как ее потенциально можно устранить. Система обозначит серьезность проблем, используя цвета: красный - наивысшую степень серьезности, желтый - потенциальные проблемы, заслуживающие рассмотрения, и фиолетовый - проблемы, связанные с ранее существовавшим кодом или историческими ошибками.

Ву сказал, что он делает это быстро и эффективно, полагаясь на параллельную работу нескольких агентов, каждый из которых изучает кодовую базу с разных точек зрения или измерений. Конечный агент обобщает и ранжирует результаты, удаляя дубликаты и определяя приоритетность того, что наиболее важно.

Инструмент предоставляет простой анализ безопасности, а руководители инженерных служб могут настроить дополнительные проверки на основе внутренних рекомендаций. Ву сказал, что недавно выпущенный Anthropic Claude Code Security обеспечивает более глубокий анализ безопасности.

По словам Ву, мультиагентная архитектура означает, что это может быть ресурсоемкий продукт. Как и в случае с другими сервисами искусственного интеллекта, ценообразование основано на токенах, а стоимость варьируется в зависимости от сложности кода, хотя, по оценкам Ву, каждая проверка будет стоить в среднем от 15 до 25 долларов. Она добавила, что это первоклассный опыт, который необходим, поскольку инструменты искусственного интеллекта генерируют все больше и больше кода.

“[Обзор кода] - это то, что происходит из-за безумного роста рынка”, - сказал Ву. “По мере того как инженеры разрабатывают Claude Code, они видят, что трудности с созданием новой функции [уменьшаются], и они видят гораздо более высокий спрос на проверку кода. Поэтому мы надеемся, что благодаря этому мы позволим предприятиям создавать решения быстрее, чем они когда-либо могли раньше, и с гораздо меньшим количеством ошибок, чем когда-либо прежде”.