Агенты

Из чего состоит агент, как написать хороший промпт, как выбрать модель и инструменты.

Агент — цифровой сотрудник с именем, характером и списком обязанностей. Один продаёт, другой отвечает на вопросы про тарифы, третий записывает на приём. Каждый агент — отдельная сущность со своим промптом, моделью и инструментами.

Этот раздел — основной. Если вы только знакомитесь с платформой — прочитайте целиком. Остальные разделы полагаются на понимание, что такое агент и как его настраивать правильно.

Философия: один агент — одна роль

Самая частая ошибка новичков: создаём одного «универсального» агента, который умеет всё. Этот подход не работает на дистанции.

Почему:

LLM теряет фокус. Чем шире промпт — тем хуже каждый отдельный кейс.
Инструменты путаются. Если у агента 20 MCP-инструментов, он начинает вызывать их не по делу.
Аналитика смешивается. Вы не видите, где проблема: в продажах, в поддержке, или в записи.
Обновить сложно. Меняете промпт для одной задачи — ломаете другую.

Правильный подход: один агент — одна чёткая роль с чёткими обязанностями. Как в компании: менеджер по продажам ≠ оператор техподдержки ≠ HR-специалист.

Типичные роли агентов в разных доменах

Клиентские (общение с клиентами):

Первая линия — принимает входящий поток, определяет намерение, маршрутизирует на других агентов или операторов.
Продажник — квалифицирует заинтересованных, назначает демо, отвечает на возражения.
Техподдержка — FAQ, статусы заказов, типовые проблемы.
Записатор — бронирование приёмов, встреч, услуг.
Консультант по продукту — подбирает товар / тариф / услугу под нужды клиента.
Retention-агент — удержание (мягко удерживает при попытке отмены).
Коллектор — мягкое напоминание о задолженности.
NPS-интервьюер — собирает обратную связь после сделки.

HR (соискатели и сотрудники):

HR-рекрутер — общается с соискателями, скрининг, запись на собеседование.
Массовый hiring — обзвон большой базы откликов (курьеры, линейный персонал).
Onboarding-ассистент — помогает новичкам (доступы, документы, процессы).
Exit-интервьюер — уходящих собирает feedback.

Внутренние (для ваших сотрудников):

IT-helpdesk — пароли, доступы, базовые проблемы.
Внутренний HR-бот — отпуска, ДМС, расчётки, регламенты.
Юр-консультант — типовые вопросы по договорам, процедурам.
BI-аналитик — сотрудник спрашивает «сколько продаж» → SQL → ответ.
SOP-гид — показывает нужный внутренний регламент по вопросу.

Автоматизация (без людей):

Webhook-обработчик — парсит входящие события, запускает цепочки.
Cron-репортёр — утренние сводки, еженедельные отчёты.
Классификатор — категоризирует входящие обращения, тикеты.
Суммаризатор — обрабатывает длинные тексты, отзывы, звонки.
Synchronizer — переносит данные между системами (CRM ↔ ERP ↔ BI).

Маршрутизация между агентами — через flow с нодой intent-router или через subagent внутри большого flow.

Из чего состоит агент

У каждого агента шесть ключевых настроек:

Имя

Как представляется клиенту. Влияет на восприятие. «Анна из поддержки» звучит дружелюбнее, чем «Бот поддержки №1».

Хорошие примеры:

«Мария — консультант Улыбки»
«Алекс из тех поддержки»
«Ева, ассистент по продажам»

Плохие:

«AI-bot» — холодно, клиенту сразу хочется человека.
«Alexa 2.0» — путаница с Amazon.
«Ваш помощник» — безлико.

Описание

Не для клиента, а для вашей команды. Одна строка про его работу: «Отвечает на вопросы про тарифы и записывает заявки от B2B-клиентов». Удобно для коллег, которые видят список агентов в админке.

Тип (пресет)

Три варианта, стартовые наборы настроек:

Пустой шаблон. Без специализаций. Берите, если ни один другой пресет не подходит — и наполняйте сами. Большинство клиентов стартуют отсюда.

Агент для работы с документами. Настроен цитировать, сохранять структуру, ссылаться на источники. Подойдёт для:

юридической поддержки (ссылки на статьи регламентов);
HR-ассистента (цитаты из кадровой политики);
FAQ-бота с большой документацией;
бота-консультанта по инструкциям.

Аналитик. Умеет формулировать SQL-запросы, строить агрегации, объяснять числа. Подключается к вашей БД через MCP-инструмент sql. Подойдёт для:

внутреннего bi-ассистента («сколько продаж за неделю?»);
оператора-аналитика (отвечает клиенту на вопрос «где мой заказ №12345»);
автоотчётов (cron-flow с этим агентом).

Тип — это стартовый набор настроек. После создания вы всё равно можете поменять любое поле независимо. Не бойтесь начать с custom и докрутить.

Системный промпт — главный инструмент

Промпт — самое важное поле. Это инструкция, которую агент читает перед каждым диалогом и которую клиент не видит.

90% успеха или провала агента — в качестве промпта.

Системный промпт: подробный гайд

Анатомия хорошего промпта

Хороший промпт содержит четыре обязательных блока:

Идентичность. Кто ты?
Задачи. Что ты делаешь?
Правила поведения. Как ты себя ведёшь?
Границы. Что делать в неожиданных ситуациях?

Плохой промпт

Ты помощник клиники. Помогай клиентам.

Что не так:

Нет имени → агент отвечает безлично.
Нет тона → говорит то формально, то фамильярно (непредсказуемо).
Нет границ → уходит в off-topic (обсуждает погоду, рассказывает шутки).
Нет инструкции про инструменты → не вызывает CRM, хотя должен.
Нет правил эскалации → не переводит на человека в жалобах.

Результат: 40% клиентов получают «не то», 20% уходят к живому оператору.

Хороший промпт

Ты — Анна, консультант стоматологической клиники «Улыбка».

Твоя задача:
- отвечать на вопросы про услуги, цены, адреса;
- записывать клиентов на приём через инструмент `book_appointment`;
- проверять свободные слоты через `check_availability`;
- при жалобах — переводить разговор на администратора.

Правила поведения:
- говори кратко: 1-2 предложения в ответе;
- обращайся на «вы», уважительно, но дружелюбно;
- не обещай медицинский результат («гарантированно вылечим»);
- цены называй точно, как в базе знаний; никогда не выдумывай;
- не используй медицинскую терминологию без объяснения;
- если клиент говорит о боли 8/10 или выше — экстренно переводи
  администратору.

Границы:
- если клиент спрашивает что-то вне темы стоматологии (политика, погода,
  личные вопросы) — вежливо возвращай к делу: «Я консультирую только по
  вопросам стоматологии. Что вас интересует по нашим услугам?».
- если клиент рассержен или использует слова «жалоба», «претензия»,
  «оператор», «человек» — сразу вызывай `transfer_to_human`.
- если ты 3 раза подряд не понял клиента — переводи на человека.

Что хорошо:

Имя и роль в первой строке — агент не теряет идентичность.
Конкретные задачи с именами инструментов — агент знает, что вызывать.
Правила — короткий ответ, тон, ограничения.
Явные границы — что делать в нестандартных случаях.
Механизм эскалации — явное указание когда передавать человеку.

Результат: в реальных замерах — около 85% сессий закрываются без участия оператора, NPS — 4.6/5.

Правило трёх слоёв

Минимальный промпт для MVP

Кто ты → что делаешь → как себя ведёшь. Этого достаточно на старте. Через неделю замеров добавите правил и границ по увиденному.

Длина промпта

Минимум: 100-200 слов (для простого FAQ-бота).
Норма: 300-700 слов (типичный продакшен-агент).
Максимум: 2000-3000 слов (сложная регулируемая индустрия — банки, медицина). Дольше — LLM начинает «забывать» середину.

Что НЕ запихивать в промпт

Выбор модели

На уровне агента выбираете конкретную модель от подключённого провайдера. Выбор сильно влияет на качество и стоимость.

Средняя модель. Быстрые короткие ответы в чате.

GPT-4o-mini — баланс цены/качества, OpenAI надёжен.
Claude Haiku — быстрее GPT, чуть дороже.
Qwen 14B / Llama 3.1 8B — open-source, можно self-host.

Цена: $0.15–1 за 1M токенов. Типичная сессия: 20-50 токенов на запрос + 50-150 на ответ. При 10K диалогов в месяц — около $5–15 на LLM.

Топовая модель. Юр-вопросы, длинные цепочки, тонкие формулировки, чувствительные ответы.

GPT-4o — эталон для «умных» задач.
Claude Sonnet — лучший следователь инструкций, меньше «галлюцинаций».
Qwen 72B / Llama 3.1 70B — open-source flagships.

Цена: $3–15 за 1M. Когда оправдано: ошибка стоит денег (юр-консультация, мед-советы, финансовые продукты) или репутации.

Маленькая модель. Высокие объёмы, приоритет цены.

GPT-3.5 — классика, устарела но дешёвая.
Qwen 7B / Llama 3.1 3B — open-source, быстрый inference.
Self-hosted Ollama — бесплатно, но нужен сервер.

Цена: от $0.1 / 1M или вообще бесплатно. Когда оправдано: 100K+ запросов в день, простые ответы, можно смириться с падением качества на 5–10%.

Self-hosted. Никаких данных наружу, полный контроль.

vLLM + Llama 70B / Qwen 72B / Mistral — production-grade.
Ollama — для dev и малых нагрузок (< 100 req/min).
TGI от HuggingFace — стабильная альтернатива vLLM.

Железо: GPU от 80 ГБ VRAM для 70B моделей, 24 ГБ для 14B. Типичный кейс: банки, медицина, госсектор, корпоративные внутренние ассистенты с PII.

Decision tree для выбора

Это клиентский бот или внутренний?

Клиентский — качество важнее цены. Внутренний — можно экономить.

Данные чувствительные?

Да → self-hosted. Нет → облако (быстрее и проще).

Какой объём?

До 10K/день — любая модель. Больше — смотрите на цену токена.

Насколько сложная задача?

FAQ → mini/Haiku. Консультация → 4o/Sonnet. Юр-анализ → Opus/o1.

Начните со средней

Через 2 недели замеров увидите, надо ли поднимать/опускать.

Универсальный совет: стартуйте с GPT-4o-mini (если облако) или Qwen 14B (если self-hosted). 80% кейсов закроет. Ответы плохие → поднимайте до GPT-4o / Qwen 72B. Деньги жмут и ответы приемлемые → опускайте до mini.

Инструменты (MCP)

Агент может вызывать внешние инструменты для получения данных или выполнения действий. В настройках агента отмечаете галочками, какие доступны.

Принципы выбора инструментов

Чем меньше инструментов у агента, тем лучше он работает. Не давайте ему «всё подряд» — модель начнёт путаться, вызывать не по делу, съедать контекст.

Хорошо: у агента записи есть book_appointment, check_availability, cancel_appointment. Всё по делу.

Плохо: у того же агента записи есть ещё search_web, send_sms, query_sql, read_files. Лишние инструменты повышают шанс, что агент «полезет не туда».

Типичные наборы

Тип агента	Инструменты
Агент записи	`book_appointment`, `check_availability`, `cancel_appointment`
Агент поддержки	`order_status`, `search_docs`, `create_ticket`
Агент продаж	`get_lead_info`, `qualify_lead`, `schedule_demo`, `send_quote`
Агент-исследователь	`exa`, `tavily`, `fetch_url`
Внутренний аналитик	`sql`, `generate_report`

Подробно про MCP →

Что это, какие есть готовые, как подключить свой.

Коллекции знаний

Папки документов, которые агент может цитировать. В настройках агента отмечаете, какие коллекции доступны — он будет искать в них перед ответом.

Типичное разделение коллекций:

pricing — прайс-листы;
faq — вопросы и ответы;
internal-policies — регламенты (не показываем клиенту напрямую, используем как контекст);
product-docs — описания продуктов;
legal — юр-документы.

Агент поддержки видит faq + product-docs. Юр-бот — только legal. Продажник — pricing + product-docs.

Подробно про базу знаний →

Загрузка, чанкинг, embedding, отладка поиска.

Как создать агента: пошагово

Откройте раздел «Агенты»

В сайдбаре слева. Нажмите «Новый агент».

Заполните имя и описание

Имя: говорящее, с личностью («Анна из поддержки»).
Описание: одна строка для коллег («Отвечает на вопросы про тарифы»).

Выберите тип

Обычно — custom. Остальные (reports/data) только если точно нужны их преимущества.

Выберите модель

Из списка подключённых LLM-провайдеров. Если список пуст — сначала подключите хотя бы одного в Настройки → Модели и API.

Рекомендация на старте: GPT-4o-mini или Claude Haiku.

Напишите системный промпт

Самое важное. По правилу трёх слоёв: кто ты → что делаешь → как себя ведёшь.

200–500 слов на старте. Пересматривайте каждую неделю по реальным логам.

Подключите инструменты

Галочки у MCP-серверов, которые агенту реально нужны. Не давайте лишнего.

Привяжите коллекции знаний

Галочки у документов, которые агент должен цитировать.

Сохранить → тест в песочнице

После сохранения агент сразу доступен. В разделе Чаты → Новый чат выберите этого агента и протестируйте.

Привяжите к каналу

Когда агент работает хорошо в песочнице — привяжите к flow, голосовому каналу, или виджету на сайте.

Продвинутые настройки

Открываются кнопкой «Дополнительно» в форме агента.

Температура — «творчество» модели. 0 = сухо и предсказуемо, 2 = хаос. По умолчанию 0.7. Если агент фантазирует — опустите до 0.2. Для креативного копирайтинга (редкий кейс) можно поднять до 1.0.
Максимальная длина ответа — сколько токенов максимум в одном ответе. По умолчанию 2000. Поднимите, если ответы обрываются. Опустите до 500, если агент пишет «романы».
Максимальное число раундов инструментов — сколько раз подряд агент может вызвать инструменты в одном ответе. По умолчанию 16. Уменьшите до 4-8, если агент уходит в «слишком глубокие» цепочки.
Стриминг — печатать ответ по мере генерации. Для чата — true (живо). Для голоса — не имеет смысла (включается автоматически).
Инструменты — разрешить вызов MCP-серверов. Если false — агент превращается в «текстового консультанта» без действий.
Автоязык — отвечать на языке клиента автоматически. Если клиент написал по-английски — бот ответит по-английски, даже если промпт на русском.

Паттерны промптов

Short-answer паттерн

Для FAQ-ботов. В промпт добавьте:

Отвечай в 1-2 коротких предложениях. Не используй списки. Не объясняй
долго. Если клиент хочет подробностей, спрашивай: «Рассказать
подробнее?».

Сокращает среднюю длину ответа с 300 до 50 токенов → экономия 6× на LLM + лучше восприятие клиентом.

Confirmation паттерн

Для действий с CRM. В промпт:

Перед любым действием (запись, оплата, отмена) — подтверждай у клиента:
«Правильно я понял, вы хотите X? Подтверждаете?». Выполняй действие
только после явного «да», «подтверждаю», «верно».

Снижает процент ошибочных записей с 3-5% до 0.5%.

Empathy паттерн

Для жалоб и конфликтов. В промпт:

Если клиент расстроен, рассержен, или использует негативную лексику:
1. Сначала извинись («мне очень жаль что так получилось»);
2. Подтверди, что услышал проблему («понимаю, это действительно
   неприятно»);
3. Только после этого предлагай решение или перевод на оператора.

NPS в жалобных кейсах вырастает на 1.5-2 пункта.

Tool-selector паттерн

Если у агента 3+ инструментов с похожими именами. В промпт:

Для поиска заказа — используй `order_status(id)`.
Для поиска клиента — используй `customer_lookup(phone)`.
Не путай их: order_status ищет ПО НОМЕРУ заказа, customer_lookup —
по номеру телефона клиента.

Сокращает неправильные вызовы инструментов в 4-5 раз.

Антипаттерны промптов

Метрики здоровья агента

Смотрите раз в неделю. Триггеры для вмешательства:

Метрика	Здоровое значение	Плохое — что делать
Доля эскалаций на человека	15–30%	>40% — упростить промпт, расширить базу знаний
Средняя длина сессии (сообщений)	5–10	>15 — агент «топчется», уточните намерения в промпте
Доля сессий с целевым действием	30–60%	<20% — flow не ведёт к цели, перестройте
CSAT (если настроен)	4.0+ / 5	<3.5 — агент раздражает, смотрите негативные отзывы
Средний ответ (секунды)	<3 сек	>5 сек — модель слишком тяжёлая, переключитесь на mini
Стоимость на сессию	$0.005–0.05	>$0.1 — промпт слишком длинный, сократите

Агенты

Список всех услуг и цен

Историю всех предыдущих разговоров

Весь ваш регламент как отдельный документ

Примеры диалогов по 20 шт

Подробно про MCP →

Подробно про базу знаний →

❌ Излишне вежливый тон

❌ Обещания от имени компании

❌ Упоминание, что это бот

❌ Слишком много эмодзи

❌ Пересказ истории разговора

❌ Многошаговые инструкции по ссылкам

Агент отвечает не по теме

Агент выдумывает факты («галлюцинирует»)

Агент не вызывает инструменты

Ответы слишком длинные

Ответы обрываются на полуслове

Агент говорит формально, хочется дружелюбнее

Агент игнорирует часть моих инструкций

Клиенты жалуются, что «отвечает бот»

Дальше — Flows →

On this page