Введение в ИИ

Теория: Агенты

Полный доступ к материалам

Зарегистрируйтесь и получите доступ к этому и десяткам других курсов

Агентский режим позволяет использовать ИИ не просто как собеседника, а как самостоятельного помощника, который строит шаги и движется к цели. Например, в обучении такой агент может выступать как тьютор: давать задания, проверять ответы, возвращаться к ошибкам и предлагать новые упражнения. Вместо того чтобы каждый раз задавать вопрос вручную, вы получаете систему, которая сама ведёт процесс обучения шаг за шагом.

ИИ Агент

В этом уроке мы разберём, как устроены агенты, какие у них есть основные части и как они работают на практике. Мы посмотрим, из каких компонентов состоит агент, как он принимает решения, какие задачи ему можно доверить и где у такого подхода есть ограничения.

Будущее

Есть целый класс задач, которые чат заменить не может. Чтобы их решать, человеку приходится самому держать в голове все шаги, следить за последовательностью и помнить контекст.

Примеры:

Обучение. Недостаточно спросить «что такое циклы в Python» — нужно планировать программу, подбирать упражнения, проверять результаты и постепенно усложнять задания. Чат даёт ответы, но не ведёт весь процесс.
Подготовка к интервью. Нужно не только разово узнать «топ-10 вопросов», а отрабатывать их последовательно, получать обратную связь и видеть прогресс. В чате это возможно только при полной инициативе пользователя.
Работа над проектом. Нельзя просто спросить «какие задачи по бэкенду важные» и всё. Нужно следить за приоритетами, сроками, зависимостями, возвращаться к пропущенным пунктам. Чат тут беспомощен без постоянных уточнений.

Сейчас именно человек выполняет роль «агента для самого себя»: он ставит цели, собирает материалы, проверяет результаты и двигается дальше. Но это требует времени, внимания и дисциплины.

Если подход с агентами будет развиваться, картина может измениться. Вместо того чтобы полностью контролировать процесс вручную, человек сможет больше сосредоточиться на понимании и принятии решений, а организацию шагов возьмёт на себя система.

Поэтому агентский режим рассматривается как главный шаг вперёд: он переводит ИИ из состояния «ответчик на вопросы» в формат активного помощника, который берёт на себя сам процесс работы.

Техническая основа

Агент — это не сама языковая модель. Модель играет роль «мозга», который умеет рассуждать и предлагать шаги, но управлением процесса занимается программа вокруг неё. По сути, агент — это обычное приложение, в котором LLM встроена как один из компонентов.

У такой программы есть доступ к инструментам: она может вызвать API, прочитать файл, выполнить код или сходить в поиск. Модель сама ничего из этого сделать не способна — она лишь формулирует, что именно стоит попробовать. Агент берёт это решение, выполняет действие и возвращает результат обратно в модель.

Чтобы быть активным помощником, агенту нужна встроенная логика. Он не ждёт, пока его спросят ещё раз, а сам проверяет состояние задачи: достигнута ли цель, есть ли новые данные, нужно ли повторить шаг или попробовать другой инструмент. За это отвечает планировщик — часть программы, которая постоянно следит за ходом процесса и решает, когда переходить к следующему шагу.

┌───────────────┐    ┌──────────────┐    ┌──────────────┐
│   Наблюдать   │ => │    Думать    │ => │  Действовать │
└───────────────┘    └──────────────┘    └──────────────┘
        │                     │                   │
        ▼                     ▼                   ▼
  новые данные          план (LLM)          вызов инструмента
  (запрос, ввод)        рассуждения         (API, код, поиск)

                 ┌───────────────────────────┐
                 │        Агент (программа)  │
                 │ ┌───────────────────────┐ │
                 │ │        Память         │ │
                 │ └───────────────────────┘ │
                 │ ┌───────────────────────┐ │
                 │ │  Планировщик / Логика │ │
                 │ └───────────────────────┘ │
                 │ ┌───────────────────────┐ │
                 │ │        LLM («мозг»)   │ │
                 │ └───────────────────────┘ │
                 │ ┌───────────────────────┐ │
                 │ │      Инструменты      │ │
                 │ │ (API, код, файлы, ...)│ │
                 │ └───────────────────────┘ │
                 └───────────────────────────┘

Получается связка:

модель строит план и предлагает следующий шаг,
агент делает действие и приносит результат,
модель анализирует новые данные и решает, что делать дальше.

Такой обмен превращается в цикл: наблюдать → думать → действовать. Агент собирает данные, модель их осмысляет и предлагает шаг, потом всё повторяется. Благодаря этому агент не ограничивается одним ответом, а ведёт процесс до завершения цели.

Сегодня появились решения, которые позволяют собирать агентов как конструктор. Не нужно писать всю логику с нуля: можно выбрать, какие инструменты будут доступны, как хранить память и каким образом контролировать шаги. Это упрощает создание агентов под конкретные задачи — от анализа данных до обучения.

Структура агента

Цель

У агента всегда есть конечная цель. Она задаётся один раз в начале — либо в коде, либо при запуске. Это ориентир, ради которого запускается весь процесс. В отличие от чата, где вы формулируете каждый вопрос отдельно, агент работает в долгую: он держит цель в фокусе и шаг за шагом приближается к результату.

Пример: «вести учебный курс и подстраивать задания под ученика» или «следить за обновлениями зависимостей в проекте». Пользователь не подсказывает каждый шаг — он получает уже готовые действия и результаты.

Инструменты

Агент не ограничивается текстом. У него есть набор действий, которые он может выполнять: делать запрос в поиск, читать или изменять файлы, вызывать API, запускать код.

То, какие инструменты доступны, определяет границы возможностей агента. Если у него есть доступ к GitHub API, он может проверять статус репозитория. Если есть подключение к базе данных — собирать статистику и находить аномалии.

Пример: агент для разработки может запускать тесты и проверять ошибки сборки, а агент для обучения — подбирать задачи из базы упражнений.

Память

Чтобы двигаться последовательно, агент хранит свои промежуточные шаги. Это может быть простая история — что уже сделано и какие ответы получены. В более сложных случаях это полноценная база заметок, куда агент складывает всё, что может пригодиться дальше.

Благодаря памяти агент не начинает заново каждый раз, а накапливает контекст. Например, тьютор-агент фиксирует, какие задания ученик решил правильно, а где ошибся, и на основе этого подбирает следующий уровень сложности.

Планировщик

Главная часть агента — логика, которая управляет процессом. Она получает текущие данные, сверяется с целью и решает, что делать дальше: продолжить тем же путём, попробовать другой инструмент или завершить задачу.

Планировщик делает агента активным. Он не ждёт, пока вы снова зададите вопрос, а сам следит за прогрессом и корректирует стратегию.

Пример: агент, который отслеживает состояние зависимостей в проекте, может сначала проверить версии пакетов, потом скачать релиз-ноты, а если найдёт критическое обновление — предложить план миграции. Всё это он делает без дополнительных подсказок от пользователя.

Принцип работы

Агент начинает с того, что принимает цель. Дальше в дело вступает цикл: он наблюдает за состоянием задачи, думает о том, какой шаг приблизит его к результату, и выполняет действие. После этого снова смотрит на контекст и решает, что делать дальше.

Главное отличие от чата в том, что агент работает непрерывно. Он сам проверяет, достигнута ли цель, нужно ли повторить шаг, стоит ли поменять стратегию или использовать другой инструмент. Благодаря этому процесс движется вперёд без постоянных подсказок со стороны пользователя.

Например, агент-тьютор может начать с объяснения темы, затем выдать упражнение, проверить решение и при ошибке вернуться к объяснению. Агент для разработки — проверить зависимости, изучить релиз-ноты и сформировать pull request. В обоих случаях последовательность шагов формируется и контролируется самим агентом.

Работа завершается тогда, когда цель достигнута. Результат может выглядеть по-разному: отчёт, список рекомендаций, pull request или набор статистики.

Ограничения

Агенты могут автоматизировать многие процессы, но у такого подхода есть границы. Допустим мы сделали агента-тютора. Что может пойти не так?

Первое ограничение связано с психологией. Настоящий тьютор или наставник чувствует усталость ученика, подбадривает или, наоборот, даёт отдохнуть. Агент этого не умеет: он может бесконечно выдавать задания, не замечая, что человек перегружен.

Второе ограничение — баланс нагрузки. Определить, сколько заданий давать в день и какой темп выбрать, пока может только человек. Агент способен рассчитать прогрессию по формуле, но не поймёт, что у студента сегодня экзамены или аврал на работе.

Третье — реакция на настроение. В обучении или на собеседовании важно чувствовать эмоциональное состояние. Агент может анализировать текстовые ответы, но не умеет уловить иронию, раздражение или усталость. Это делает его помощником, но не полноценным заменителем живого взаимодействия.

Эти ограничения не отменяют ценности агентов, но напоминают, что они должны работать в паре с человеком, а не вместо него.