Поделиться
VK Telegram OK

Облачный искусственный интеллект Google лидирует в трех областях моделирования

Искусственный интеллект
AGILog · 2026-02-23 19:18

Майкл Герстенхабер, вице-президент по продуктам в Google Cloud, в основном работает над Vertex, унифицированной платформой компании для развертывания корпоративного искусственного интеллекта. Это дает ему представление о том, как компании на самом деле используют модели искусственного интеллекта, и что еще нужно сделать, чтобы раскрыть потенциал искусственного интеллекта.

Когда я разговаривал с Майклом, меня особенно поразила одна идея, о которой я раньше не слышал. По его словам, модели искусственного интеллекта преодолевают сразу три рубежа: первичный интеллект, время отклика и третье качество, которое связано не столько с первичными возможностями, сколько со стоимостью — можно ли внедрить модель достаточно дешево для работы в огромных, непредсказуемых масштабах. Это новый взгляд на возможности моделей, и он особенно ценен для тех, кто пытается продвигать передовые модели в новом направлении.

Это интервью было отредактировано для большей длины и наглядности.

Почему бы вам для начала не рассказать нам о своем опыте в области искусственного интеллекта и о том, чем вы занимаетесь в Google?

Я работаю в сфере искусственного интеллекта уже около двух лет. Я проработал в Anthropic полтора года, в Google я работаю уже почти полгода. Я управляю платформой для разработчиков Google Vertex. Большинство наших клиентов - инженеры, создающие свои собственные приложения. Им нужен доступ к шаблонам агентов. Им нужен доступ к платформе агентов. Им нужен доступ к выводам самых интеллектуальных моделей в мире. Я предоставляю им это, но не сами приложения. Shopify, Thomson Reuters и другие наши клиенты могут предоставлять это в своих собственных доменах.

Что привлекло вас в Google?

Я думаю, Google уникальна в мире тем, что у нас есть все, от интерфейса до уровня инфраструктуры. Мы можем создавать центры обработки данных. Мы можем покупать электроэнергию и строить электростанции. У нас есть собственные чипы. У нас есть собственная модель. У нас есть уровень логического вывода, который мы контролируем. У нас есть агентный уровень, который мы контролируем. У нас есть API для работы с памятью, для написания кода с чередованием. Кроме того, у нас есть механизм агентов, который обеспечивает соответствие требованиям и управление. Кроме того, у нас даже есть интерфейс чата в Gemini enterprise и Gemini chat для потребителей, верно? Итак, я пришел сюда отчасти потому, что увидел в Google уникальную вертикально интегрированную компанию, и это является нашей сильной стороной.

Это странно, потому что, несмотря на все различия между компаниями, кажется, что все три крупные лаборатории действительно близки по возможностям. Это просто гонка за большим количеством информации или все гораздо сложнее?

Я вижу три границы. Такие модели, как Gemini Pro, рассчитаны на интеллектуальную обработку. Подумайте о написании кода. Вам просто нужен лучший код, который вы можете получить, и не имеет значения, займет ли это 45 минут, потому что я должен его поддерживать, я должен запустить в производство. Я просто хочу самого лучшего.

Кроме того, существует еще одна граница, связанная с задержкой. Если я занимаюсь поддержкой клиентов и мне нужно знать, как применять политику, вам нужна информация, чтобы применить эту политику. Разрешено ли вам осуществлять возврат? Могу ли я повысить класс своего места в самолете? Но не имеет значения, насколько вы правы, если на получение ответа ушло 45 минут. В таких случаях вам нужен самый интеллектуальный продукт в рамках бюджета на время ожидания, потому что, когда человеку становится скучно и он вешает трубку, дополнительная интеллектуальность уже не имеет значения.

И, наконец, есть последний этап, когда кто-то вроде Reddit или Meta хочет модерировать весь Интернет. У них большие бюджеты, но они не могут рисковать чем-то корпоративным, если не знают, как это масштабируется. Они не знают, сколько ядовитых постов появится сегодня или завтра. Поэтому им приходится ограничивать свой бюджет моделью с самым высоким уровнем интеллекта, который они могут себе позволить, но с возможностью масштабирования на бесконечное количество тем. И для этого стоимость становится очень, очень важной.

Одна из вещей, над которой я ломал голову, - это почему агентные системы так долго не осваиваются. Кажется, что модели уже есть, и я видел потрясающие демонстрации, но мы не видим таких серьезных изменений, каких я ожидал год назад. Как вы думаете, что сдерживает это развитие?

Этой технологии всего два года, а инфраструктуры по-прежнему не хватает. У нас нет шаблонов для аудита того, что делают агенты. У нас нет шаблонов для авторизации данных для агента. Есть такие модели, над внедрением которых в производство придется поработать. А производство всегда является косвенным показателем того, на что способна технология. Поэтому двух лет недостаточно, чтобы увидеть, какие интеллектуальные возможности используются в производстве, и именно здесь люди испытывают трудности.

Я думаю, что в разработке программного обеспечения это произошло необычайно быстро, потому что это хорошо вписывается в жизненный цикл разработки программного обеспечения. У нас есть среда разработки, в которой безопасно что-то ломать, а затем мы продвигаем это из среды разработки в среду тестирования. Процесс написания кода в Google требует, чтобы два человека провели аудит этого кода, и оба подтвердили, что он достаточно хорош для того, чтобы продвигать бренд Google и предоставлять его нашим клиентам. Таким образом, у нас есть множество процессов, в которых задействован человек, что делает внедрение исключительно рискованным. Но нам нужно создавать эти образцы в других местах и для других профессий.