
Агенты ИИ должны стать следующим большим шагом в области ИИ, но точного определения того, что они собой представляют, не существует. На данный момент люди не могут прийти к единому мнению о том, что именно представляет собой агент ИИ.
В простейшем случае агент ИИ лучше всего описывается как программное обеспечение на базе ИИ, которое выполняет ряд задач для вас, которые в прошлом мог бы выполнять человек-агент службы поддержки клиентов, HR-менеджер или сотрудник службы ИТ-поддержки, хотя в конечном итоге это может включать любую задачу. Вы просите его сделать что-то, и он делает это для вас, иногда пересекая несколько систем и выходя далеко за рамки простых ответов на вопросы. Например, в прошлом месяце Perplexity выпустила агента ИИ, который помогает людям совершать праздничные покупки (и это не единственный ). А Google на прошлой неделе анонсировала своего первого агента ИИ под названием Project Mariner , которого можно использовать для поиска рейсов и отелей, покупок предметов домашнего обихода, поиска рецептов и выполнения других задач.
Кажется достаточно просто, не так ли? Но все осложняется отсутствием ясности. Даже среди технологических гигантов нет единого мнения. Google рассматривает их как помощников, работающих по определенным задачам, в зависимости от работы: помощь в написании кода для разработчиков; помощь маркетологам в создании цветовой схемы; помощь ИТ-специалисту в отслеживании проблемы путем запроса данных журнала.
Для Asana агент может выступать в качестве дополнительного сотрудника , выполняющего порученные задачи как любой хороший коллега. Sierra, стартап, основанный бывшим содиректором Salesforce Бретом Тейлором и ветераном Google Клэем Бэйвором, рассматривает агентов как инструменты взаимодействия с клиентами, помогающие людям выполнять действия, которые выходят далеко за рамки чат-ботов прошлых лет, помогая решать более сложные наборы проблем.
Отсутствие целостного определения оставляет место для путаницы относительно того, что именно будут делать эти вещи, но независимо от того, как они определены, агенты предназначены для помощи в выполнении задач автоматизированным способом с минимальным участием человека.
Рудина Сесери, основатель и управляющий партнер Glasswing Ventures, говорит, что пока рано говорить об этом, и это может объяснить отсутствие согласия. «Единого определения того, что такое «агент ИИ», не существует. Однако наиболее распространенной точкой зрения является то, что агент — это интеллектуальная программная система, предназначенная для восприятия своей среды, ее анализа, принятия решений и выполнения действий для автономного достижения определенных целей», — сказала Сесери TechCrunch.
Она говорит, что они используют ряд технологий ИИ, чтобы это осуществить. «Эти системы включают различные методы ИИ/МО, такие как обработка естественного языка, машинное обучение и компьютерное зрение, чтобы работать в динамических доменах, автономно или вместе с другими агентами и пользователями-людьми».
Аарон Леви, соучредитель и генеральный директор Box, говорит, что со временем, по мере того как возможности ИИ будут расширяться, агенты ИИ смогут делать гораздо больше от имени людей, и уже сейчас существуют движущие силы, которые будут способствовать этой эволюции.
«Искусственный интеллект — это самоусиливающийся маховик, который позволит существенно улучшить возможности агентов искусственного интеллекта в краткосрочной и долгосрочной перспективе: соотношение цены и производительности графического процессора, эффективность модели, качество и интеллект модели, усовершенствования фреймворков и инфраструктуры искусственного интеллекта», — недавно написал Леви в LinkedIn .
Это оптимистичный взгляд на технологию, который предполагает, что рост будет происходить во всех этих областях, хотя это не обязательно данность. Пионер робототехники Массачусетского технологического института Родни Брукс указал в недавнем интервью TechCrunch, что ИИ приходится иметь дело с гораздо более сложными проблемами, чем большинство технологий, и он не обязательно будет расти так же быстро, как, скажем, чипы по закону Мура.
«Когда человек видит, как система ИИ выполняет задачу, он немедленно обобщает ее на похожие вещи и оценивает компетентность системы ИИ; не только производительность в этом, но и компетентность вокруг этого», — сказал Брукс во время интервью. «И они обычно очень излишне оптимистичны, и это потому, что они используют модель производительности человека в задаче».
Проблема в том, что пересечение систем — сложная задача, и это осложняется тем, что некоторые устаревшие системы не имеют базового доступа к API. Хотя мы видим устойчивые улучшения, на которые намекал Леви, заставить программное обеспечение получать доступ к нескольким системам, решая при этом проблемы, с которыми оно может столкнуться, может оказаться сложнее, чем многие думают.
Если это так, то все могут переоценивать то, что должны уметь делать агенты ИИ. Дэвид Кушман, руководитель исследований в HFS Research, видит нынешнее поколение ботов больше похожим на Asana: помощников, которые помогают людям выполнять определенные задачи в интересах достижения какой-то определенной пользователем стратегической цели. Задача состоит в том, чтобы помочь машине справляться с непредвиденными обстоятельствами по-настоящему автоматизированным способом, и мы явно еще далеки от этого.
«Я думаю, это следующий шаг», — сказал он. «Это то, где ИИ работает независимо и эффективно в масштабе. Так что именно здесь люди устанавливают правила, ограничения и применяют множество технологий, чтобы вывести человека из цикла — тогда как с GenAI все было направлено на то, чтобы держать человека в курсе», — сказал он. Поэтому ключ здесь, по его словам, заключается в том, чтобы позволить агенту ИИ взять на себя управление и применить настоящую автоматизацию.
Джон Туроу, партнер Madrona Ventures, говорит, что это потребует создания инфраструктуры агентов ИИ, технологического стека, разработанного специально для создания агентов (как бы вы их ни определяли). В недавнем сообщении в блоге Туроу привел примеры агентов ИИ, которые в настоящее время работают в дикой природе, и то, как они создаются сегодня.
По мнению Турова, растущее распространение агентов ИИ — и он также признает, что определение все еще немного неопределенно — требует технологического стека, как и любая другая технология. «Все это означает, что нашей отрасли предстоит работа по созданию инфраструктуры, которая поддерживает агентов ИИ и приложения, которые на них полагаются», — написал он в статье.
«Со временем рассуждения постепенно улучшатся, модели frontier станут управлять большей частью рабочих процессов, и разработчики захотят сосредоточиться на продукте и данных — вещах, которые их отличают. Они хотят, чтобы базовая платформа «просто работала» с масштабом, производительностью и надежностью».
Еще одна вещь, которую следует иметь в виду, заключается в том, что, вероятно, для работы агентов потребуется несколько моделей, а не одна степень магистра права, и это имеет смысл, если вы думаете об этих агентах как о наборе различных задач. «Я не думаю, что сейчас какая-либо одна большая языковая модель, по крайней мере общедоступная, монолитная большая языковая модель, способна справиться с задачами агентов. Я не думаю, что они уже могут выполнять многошаговые рассуждения, которые действительно заставили бы меня воодушевиться будущим агентов. Я думаю, что мы приближаемся, но пока это просто не так», — сказал Фред Хавемейер, руководитель исследований в области искусственного интеллекта и программного обеспечения в США в Macquarie US Equity Research.
«Я действительно думаю, что наиболее эффективными агентами, скорее всего, будут множественные коллекции из множественных различных моделей с уровнем маршрутизации, который отправляет запросы или подсказки наиболее эффективному агенту и модели. И я думаю, что это было бы что-то вроде интересного [автоматизированного] супервизора, делегирующего своего рода роль».
В конечном итоге для Хавемейера отрасль работает над достижением этой цели — независимой работы агентов. «Когда я думаю о будущем агентов, я хочу видеть и надеюсь увидеть агентов, которые действительно автономны и способны ставить абстрактные цели, а затем совершенно независимо продумывать все отдельные шаги между ними», — сказал он TechCrunch.
Но дело в том, что мы все еще находимся в переходном периоде, когда речь идет об этих агентах, и мы не знаем, когда мы достигнем этого конечного состояния, которое описал Хавемейер. Хотя то, что мы видели до сих пор, несомненно, является многообещающим шагом в правильном направлении, нам все еще нужны некоторые достижения и прорывы для того, чтобы агенты ИИ работали так, как их представляют сегодня. И важно понимать, что мы еще не достигли этого.
Эта история была первоначально опубликована 13 июля 2024 года и обновлена с целью включения новых агентов из Perplexity и Google.
Прочитайте что такое взгляд в будущее