Индустрия технологий видеонаблюдения сегодня находится в центре внимания, но не по самым лучшим причинам. Из-за разногласий вокруг иммиграционной и таможенной службы США , подключившейся к сети камер Flock для наблюдения за людьми, и производителя домашних камер Ring , подвергшегося критике за создание новых функций, которые позволили бы благодаря тому, что правоохранительные органы могут запрашивать у домовладельцев видеозаписи с их окрестностей, в настоящее время ведутся широкие дебаты о безопасности, неприкосновенности частной жизни и о том, кто за кем может наблюдать.
Но противоречия не стирают с лица земли рынки, и постоянное совершенствование моделей, основанных на визуальном подходе, только добавляет сил компаниям, создающим новые способы мониторинга того, что происходит в их помещениях.
По словам Матана Голднера, соучредителя и генерального директора стартапа по видеонаблюдению Conntour , этика, связанная с этой темой, достаточно важна, и он говорит, что его компания довольно разборчива в выборе клиентов для продажи. Возможно, это не совсем разумно для стартапа, которому всего два года, но Голднер говорит, что он может себе это позволить, потому что у Conntour уже есть несколько крупных государственных и публичных клиентов, одним из которых является Центральное бюро по борьбе с наркотиками Сингапура.
“Тот факт, что у нас такие крупные клиенты, позволяет нам выбирать их и сохранять контроль [...] Мы действительно контролируем, кто ими пользуется, каков вариант использования, и мы можем выбирать то, что считаем моральным и, конечно же, законным. Мы используем все наши суждения и принимаем решения, основываясь на конкретных клиентах, с которыми мы согласны [работать], потому что мы знаем, как они будут это использовать”, - сказал Голднер AGI_LOG в эксклюзивном интервью.
Это помогло Conntour не только быть избирательным. Инвесторы обратили внимание на то, что недавно стартап привлек $7 млн на начальном этапе от General Catalyst, Y Combinator, SV Angel и Liquid 2 Ventures.
Голднер сказал, что раунд завершился в течение 72 часов. “Я думаю, что я запланировал около 90 встреч примерно за восемь дней, и всего через три дня — мы начали в понедельник и к полудню среды закончили”, - сказал он.
Как бы то ни было, Коннтур, возможно, прав в своей придирчивости, особенно учитывая, насколько мощными стали инструменты искусственного интеллекта в этой области. Собственная видеоплатформа компании использует модели искусственного интеллекта, позволяющие сотрудникам службы безопасности запрашивать видеозаписи с камер, используя естественный язык, чтобы найти любой объект, человека или ситуацию на кадрах в режиме реального времени - поисковая система, подобная Google, создана специально для видеопотоков служб безопасности. Он также может самостоятельно отслеживать и обнаруживать угрозы на основе заданных правил и автоматически получать оповещения surface.
В отличие от устаревших систем, которые зависят от предустановленных определений или параметров для обнаружения конкретных объектов, моделей движения или поведения, Conntour утверждает, что ее система использует естественные модели и модели визуального языка, что обеспечивает ей высокую степень гибкости и удобства использования. Пользователь может попросить: “Найдите случаи, когда кто-то в кроссовках передавал сумку в вестибюле”, и система Conntour быстро выполнит поиск по всем записям или видеотрансляциям в реальном времени, чтобы выдать соответствующие результаты.
А поскольку платформа основана на моделях искусственного интеллекта, пользователи могут просто задавать вопросы о видеоматериале и получать текстовые ответы, сопровождаемые соответствующими видеопотоками, а также создавать отчеты об инцидентах.
Однако преимуществом компании является ее масштабируемость. Голднер объяснил, что платформа в основном отличается от других сервисов поиска видео с использованием искусственного интеллекта тем, что она предназначена для эффективного масштабирования до систем, содержащих тысячи каналов с камер. На самом деле, по его словам, система Conntour может отслеживать до 50 сигналов с камер с помощью одного потребительского графического процессора, такого как Nvidia RTX 4090.
Компания делает это, используя несколько моделей и логических систем, а затем определяет, какие модели и системы следует использовать алгоритму для каждого запроса, чтобы он требовал наименьших вычислительных мощностей и предоставлял пользователям наилучшие результаты.
Компания Conntour утверждает, что ее система может быть развернута полностью локально, полностью в облаке или в сочетании того и другого. Она может подключаться к большинству уже используемых систем безопасности или сама по себе может служить полноценной платформой для наблюдения.
Но в индустрии видеонаблюдения давно существует проблема: качество видеонаблюдения зависит только от качества отснятого материала. Например, на кадрах плохо освещенной парковки, снятых камерой с низким разрешением и грязным объективом, трудно различить детали.
Голднер говорит, что Conntour подстраховывается от этой неизбежности, предоставляя оценку достоверности результатов поиска. Если качество изображения, получаемого с камеры, недостаточно высокое, система выдаст результаты с низким уровнем достоверности.
В дальнейшем, по словам Голднера, самой большой технической проблемой, которую необходимо решить, является обеспечение полного уровня возможностей LLM для своей системы при сохранении ее эффективности.
“У нас есть две вещи, которые мы хотим сделать одновременно, и они противоречат друг другу. С одной стороны, мы хотим обеспечить полную гибкость естественного языка, в стиле LLM, чтобы вы могли задавать любые вопросы. И, с другой стороны, это эффективность, поэтому мы хотим, чтобы при этом использовалось как можно меньше ресурсов, потому что, опять же, обработка [тысяч] каналов - это просто безумие. Это противоречие - самый большой технический барьер и техническая проблема в нашей сфере, и мы прилагаем все усилия, чтобы ее решить”.