logo

7 января Джейсен Хуанг, выступая на CES 25, назвал Agentic AI новым

7 января Джейсен Хуанг, выступая на CES 25, назвал Agentic AI новым
7 января Джейсен Хуанг, выступая на CES 25, назвал Agentic AI новым этапом эволюции предприятий и напророчил превращение агентского ИИ в многотриллионную индустрию. Мы попросили рассказать о том, что же из себя представляют ИИ-агенты руководителя научной группы «Адаптивные агенты» Института AIRI Владислава Куренкова.

🤖 Что такое агенты?
Представьте, что достаточно попросить ИИ забронировать билеты в Токио, и он сам найдет подходящие предложения и оформит бронирование. Вот что сегодня подразумевается под ИИ-агентами — модели, которые могут самостоятельно выполнять задачи под минимальным присмотром (мы называем это supervision) со стороны человека. Это может быть мир информационный, а может быть физический. Например, стартап Physical Intelligence, которым занимается Сергей Лёвин из Беркли, и который в ноябре 24 года привлек $400млн, показал демо: робот кладет вещи в стирку, вытаскивает, везет их к столу и вкладывает для сушки. Это тоже ИИ-агент.

Может показаться, что многие уже привычных нам ИИ-сервисы готовы стать нашими агентами, но это не так:

✔️ Большинство моделей на нынешнем уровне развития совершает ошибки, их нужно корректировать. Агент должен быть автономен и безошибочен.
✔️ Агент не просто выполняет заданный алгоритм решения задачи, а декомпозирует ее на множество промежуточных действий и выбирает подходящие.
✔️ Агент адаптируется. Система, наученная бронировать авиабилеты, должна понять аналогию и забронировать ЖД-билеты несмотря на то, что ее учили работать только с билетами на самолет.

Как их обучают и из чего они состоят?

Есть два основных подхода, и пока не ясно, какой из них окажется лучшим:

✔️ Под каждую задачу заводится отдельная LLM. Аккуратно делаем несколько специализированных языковых моделей, каждая из которых делает хорошо одну-две задачи. Потом создаем оркестратор – модель, которая умеет управлять предыдущими моделями и вызывать их в нужный момент.

✔️ Есть одна модель, которая умеет решать много разных задач одновременно благодаря взаимодействию с компонентами нужного ПО. Доподлинно неизвестно, но есть много предположений о том, что Apple Intelligence строится именно по такому принципу.

Агенты — это уже AGI?

Нет, это не AGI. Рамки автономности все еще строго определяются разработчиками. У вас есть модель, вы можете дать ей набор инструментов, которыми она будет сама учиться пользоваться, и на каждый из них вы накладываете различные ограничения: и на то, как пользоваться, и на то когда. Посмотрите на машины: они не автономны в смысле принятия решений. У ребят, которые занимаются автономными авто, есть множество сценариев, которые они проверяют в сотнях тысяч ситуаций и прописывают алгоритмы действий, чтобы заранее знать, как поведет себя автомобиль через несколько секунд в реальном времени. А еще они могут написать «код-рубильник», который в нужный момент заставляет систему действовать строго определенным образом.

Главные тренды, связанные с ИИ-агентами

✔️ В робототехнике продолжится вовлечение языковых моделей в планирование, постановку задач и управление инженерной оболочкой. Обучение с подкреплением и языковые модели будут работать в связке.

✔️ Говоря об агентах в вебе, улучшений стоит ждать в том, насколько хорошо получится у больших языковых моделей и VLM-моделей пользоваться инструментами, которых они не видели до этого.

🔤🔤Для того, чтобы получались адаптивные агенты, они должны видеть сотни тысяч разных задач, но в реальности это очень медленно и дорого. А вот если мы напишем симулятор, который не только содержит в себе задачи для обучения, но и может генерировать новые, то за счет разнообразия задач внутри симуляторов можно будет создавать агентов,  которые бы успешно адаптировались к реальной жизни. Не удивительно, что в создание симуляторов супер-активно вкладывается Nvidia. Отметим, что на CES и других техно-тусовках представляют уже макеты готовых зданий, тогда как о таких вот «кирпичах» для стройки можно услышать только на профильных научных конференциях.

Канал источник:@antidigital