Может быть, агенты с искусственным интеллектом все-таки могут быть юристами

В прошлом месяце я писал о новом тесте Mercor, который оценивает возможности агентов ИИ в решении профессиональных задач, таких как юриспруденция и корпоративный анализ. В то время результаты были довольно плачевными: каждая крупная лаборатория набрала менее 25% баллов, поэтому мы пришли к выводу, что юристам не грозит вытеснение ИИ, по крайней мере, на данный момент.

Но возможности ИИ могут сильно измениться за пару недель.

Выход на этой неделе Opus 4.6 от Anthropic всколыхнул рейтинги лидеров: новая модель Anthropic набрала всего 30% очков в одиночных испытаниях, а в среднем это составляет 45%, если дать еще несколько советов по решению проблемы. Примечательно, что релиз включал в себя множество новых функций агента, включая “рои агентов”, которые, возможно, помогли в такого рода многоступенчатом решении проблем.

Как бы то ни было, результат - это огромный скачок по сравнению с предыдущим уровнем техники и признак того, что прогресс в разработке базовых моделей не замедляется. Генеральный директор Mercor Брендан Фуди, на которого это произвело особое впечатление, сказал: “Скачок с 18,4% до 29,8% за несколько месяцев - это безумие”.

Тридцать процентов - это все еще далеко от 100%, так что юристам не стоит беспокоиться о том, что на следующей неделе их заменят машинами. Но они должны быть гораздо менее уверены в себе, чем в прошлом месяце!

Категории

Искусственный интеллект (558) Приложения (199) Железо (180) Гаджеты (59)

Самое популярное

Apple приостанавливает изменения в App Store в Техасе после решения суда

2025-12-24

Plaud запускает новый PIN-код с ИИ и настольную записную книжку для совещаний

2026-01-04

Помощник Amazon по искусственному интеллекту выходит в Интернет с Alexa.com

2026-01-05

Сэм Альтман из OpenAI объявил о сделке Пентагона с ‘техническими гарантиями’

2026-02-28

Теги

ИИ (588) Приложения (315) Стартапы (191) Оборудование (148) вкратце (143) Средства массовой информации и развлечения (105) Общественный (104) Exclusive (98) Открытый мир (86) тс (84)