Агенты
Из чего состоит агент, как написать хороший промпт, как выбрать модель и инструменты.
Агент — цифровой сотрудник с именем, характером и списком обязанностей. Один продаёт, другой отвечает на вопросы про тарифы, третий записывает на приём. Каждый агент — отдельная сущность со своим промптом, моделью и инструментами.
Этот раздел — основной. Если вы только знакомитесь с платформой — прочитайте целиком. Остальные разделы полагаются на понимание, что такое агент и как его настраивать правильно.
Философия: один агент — одна роль
Самая частая ошибка новичков: создаём одного «универсального» агента, который умеет всё. Этот подход не работает на дистанции.
Почему:
- LLM теряет фокус. Чем шире промпт — тем хуже каждый отдельный кейс.
- Инструменты путаются. Если у агента 20 MCP-инструментов, он начинает вызывать их не по делу.
- Аналитика смешивается. Вы не видите, где проблема: в продажах, в поддержке, или в записи.
- Обновить сложно. Меняете промпт для одной задачи — ломаете другую.
Правильный подход: один агент — одна чёткая роль с чёткими обязанностями. Как в компании: менеджер по продажам ≠ оператор техподдержки ≠ HR-специалист.
Типичные роли агентов в разных доменах
Клиентские (общение с клиентами):
- Первая линия — принимает входящий поток, определяет намерение, маршрутизирует на других агентов или операторов.
- Продажник — квалифицирует заинтересованных, назначает демо, отвечает на возражения.
- Техподдержка — FAQ, статусы заказов, типовые проблемы.
- Записатор — бронирование приёмов, встреч, услуг.
- Консультант по продукту — подбирает товар / тариф / услугу под нужды клиента.
- Retention-агент — удержание (мягко удерживает при попытке отмены).
- Коллектор — мягкое напоминание о задолженности.
- NPS-интервьюер — собирает обратную связь после сделки.
HR (соискатели и сотрудники):
- HR-рекрутер — общается с соискателями, скрининг, запись на собеседование.
- Массовый hiring — обзвон большой базы откликов (курьеры, линейный персонал).
- Onboarding-ассистент — помогает новичкам (доступы, документы, процессы).
- Exit-интервьюер — уходящих собирает feedback.
Внутренние (для ваших сотрудников):
- IT-helpdesk — пароли, доступы, базовые проблемы.
- Внутренний HR-бот — отпуска, ДМС, расчётки, регламенты.
- Юр-консультант — типовые вопросы по договорам, процедурам.
- BI-аналитик — сотрудник спрашивает «сколько продаж» → SQL → ответ.
- SOP-гид — показывает нужный внутренний регламент по вопросу.
Автоматизация (без людей):
- Webhook-обработчик — парсит входящие события, запускает цепочки.
- Cron-репортёр — утренние сводки, еженедельные отчёты.
- Классификатор — категоризирует входящие обращения, тикеты.
- Суммаризатор — обрабатывает длинные тексты, отзывы, звонки.
- Synchronizer — переносит данные между системами (CRM ↔ ERP ↔ BI).
Маршрутизация между агентами — через flow с нодой
intent-router или через subagent внутри большого flow.
Из чего состоит агент
У каждого агента шесть ключевых настроек:
Имя
Как представляется клиенту. Влияет на восприятие. «Анна из поддержки» звучит дружелюбнее, чем «Бот поддержки №1».
Хорошие примеры:
- «Мария — консультант Улыбки»
- «Алекс из тех поддержки»
- «Ева, ассистент по продажам»
Плохие:
- «AI-bot» — холодно, клиенту сразу хочется человека.
- «Alexa 2.0» — путаница с Amazon.
- «Ваш помощник» — безлико.
Описание
Не для клиента, а для вашей команды. Одна строка про его работу: «Отвечает на вопросы про тарифы и записывает заявки от B2B-клиентов». Удобно для коллег, которые видят список агентов в админке.
Тип (пресет)
Три варианта, стартовые наборы настроек:
Пустой шаблон. Без специализаций. Берите, если ни один другой пресет не подходит — и наполняйте сами. Большинство клиентов стартуют отсюда.
Агент для работы с документами. Настроен цитировать, сохранять структуру, ссылаться на источники. Подойдёт для:
- юридической поддержки (ссылки на статьи регламентов);
- HR-ассистента (цитаты из кадровой политики);
- FAQ-бота с большой документацией;
- бота-консультанта по инструкциям.
Аналитик. Умеет формулировать SQL-запросы, строить агрегации,
объяснять числа. Подключается к вашей БД через MCP-инструмент sql.
Подойдёт для:
- внутреннего bi-ассистента («сколько продаж за неделю?»);
- оператора-аналитика (отвечает клиенту на вопрос «где мой заказ №12345»);
- автоотчётов (cron-flow с этим агентом).
Тип — это стартовый набор настроек. После создания вы всё равно
можете поменять любое поле независимо. Не бойтесь начать с custom и
докрутить.
Системный промпт — главный инструмент
Промпт — самое важное поле. Это инструкция, которую агент читает перед каждым диалогом и которую клиент не видит.
90% успеха или провала агента — в качестве промпта.
Системный промпт: подробный гайд
Анатомия хорошего промпта
Хороший промпт содержит четыре обязательных блока:
- Идентичность. Кто ты?
- Задачи. Что ты делаешь?
- Правила поведения. Как ты себя ведёшь?
- Границы. Что делать в неожиданных ситуациях?
Плохой промпт
Ты помощник клиники. Помогай клиентам.Что не так:
- Нет имени → агент отвечает безлично.
- Нет тона → говорит то формально, то фамильярно (непредсказуемо).
- Нет границ → уходит в off-topic (обсуждает погоду, рассказывает шутки).
- Нет инструкции про инструменты → не вызывает CRM, хотя должен.
- Нет правил эскалации → не переводит на человека в жалобах.
Результат: 40% клиентов получают «не то», 20% уходят к живому оператору.
Хороший промпт
Ты — Анна, консультант стоматологической клиники «Улыбка».
Твоя задача:
- отвечать на вопросы про услуги, цены, адреса;
- записывать клиентов на приём через инструмент `book_appointment`;
- проверять свободные слоты через `check_availability`;
- при жалобах — переводить разговор на администратора.
Правила поведения:
- говори кратко: 1-2 предложения в ответе;
- обращайся на «вы», уважительно, но дружелюбно;
- не обещай медицинский результат («гарантированно вылечим»);
- цены называй точно, как в базе знаний; никогда не выдумывай;
- не используй медицинскую терминологию без объяснения;
- если клиент говорит о боли 8/10 или выше — экстренно переводи
администратору.
Границы:
- если клиент спрашивает что-то вне темы стоматологии (политика, погода,
личные вопросы) — вежливо возвращай к делу: «Я консультирую только по
вопросам стоматологии. Что вас интересует по нашим услугам?».
- если клиент рассержен или использует слова «жалоба», «претензия»,
«оператор», «человек» — сразу вызывай `transfer_to_human`.
- если ты 3 раза подряд не понял клиента — переводи на человека.Что хорошо:
- Имя и роль в первой строке — агент не теряет идентичность.
- Конкретные задачи с именами инструментов — агент знает, что вызывать.
- Правила — короткий ответ, тон, ограничения.
- Явные границы — что делать в нестандартных случаях.
- Механизм эскалации — явное указание когда передавать человеку.
Результат: в реальных замерах — около 85% сессий закрываются без участия оператора, NPS — 4.6/5.
Правило трёх слоёв
Минимальный промпт для MVP
Кто ты → что делаешь → как себя ведёшь. Этого достаточно на старте. Через неделю замеров добавите правил и границ по увиденному.
Длина промпта
- Минимум: 100-200 слов (для простого FAQ-бота).
- Норма: 300-700 слов (типичный продакшен-агент).
- Максимум: 2000-3000 слов (сложная регулируемая индустрия — банки, медицина). Дольше — LLM начинает «забывать» середину.
Что НЕ запихивать в промпт
Выбор модели
На уровне агента выбираете конкретную модель от подключённого провайдера. Выбор сильно влияет на качество и стоимость.
Средняя модель. Быстрые короткие ответы в чате.
- GPT-4o-mini — баланс цены/качества, OpenAI надёжен.
- Claude Haiku — быстрее GPT, чуть дороже.
- Qwen 14B / Llama 3.1 8B — open-source, можно self-host.
Цена: $0.15–1 за 1M токенов. Типичная сессия: 20-50 токенов на запрос + 50-150 на ответ. При 10K диалогов в месяц — около $5–15 на LLM.
Топовая модель. Юр-вопросы, длинные цепочки, тонкие формулировки, чувствительные ответы.
- GPT-4o — эталон для «умных» задач.
- Claude Sonnet — лучший следователь инструкций, меньше «галлюцинаций».
- Qwen 72B / Llama 3.1 70B — open-source flagships.
Цена: $3–15 за 1M. Когда оправдано: ошибка стоит денег (юр-консультация, мед-советы, финансовые продукты) или репутации.
Маленькая модель. Высокие объёмы, приоритет цены.
- GPT-3.5 — классика, устарела но дешёвая.
- Qwen 7B / Llama 3.1 3B — open-source, быстрый inference.
- Self-hosted Ollama — бесплатно, но нужен сервер.
Цена: от $0.1 / 1M или вообще бесплатно. Когда оправдано: 100K+ запросов в день, простые ответы, можно смириться с падением качества на 5–10%.
Self-hosted. Никаких данных наружу, полный контроль.
- vLLM + Llama 70B / Qwen 72B / Mistral — production-grade.
- Ollama — для dev и малых нагрузок (< 100 req/min).
- TGI от HuggingFace — стабильная альтернатива vLLM.
Железо: GPU от 80 ГБ VRAM для 70B моделей, 24 ГБ для 14B. Типичный кейс: банки, медицина, госсектор, корпоративные внутренние ассистенты с PII.
Decision tree для выбора
Это клиентский бот или внутренний?
Клиентский — качество важнее цены. Внутренний — можно экономить.
Данные чувствительные?
Да → self-hosted. Нет → облако (быстрее и проще).
Какой объём?
До 10K/день — любая модель. Больше — смотрите на цену токена.
Насколько сложная задача?
FAQ → mini/Haiku. Консультация → 4o/Sonnet. Юр-анализ → Opus/o1.
Начните со средней
Через 2 недели замеров увидите, надо ли поднимать/опускать.
Универсальный совет: стартуйте с GPT-4o-mini (если облако) или Qwen 14B (если self-hosted). 80% кейсов закроет. Ответы плохие → поднимайте до GPT-4o / Qwen 72B. Деньги жмут и ответы приемлемые → опускайте до mini.
Инструменты (MCP)
Агент может вызывать внешние инструменты для получения данных или выполнения действий. В настройках агента отмечаете галочками, какие доступны.
Принципы выбора инструментов
Чем меньше инструментов у агента, тем лучше он работает. Не давайте ему «всё подряд» — модель начнёт путаться, вызывать не по делу, съедать контекст.
Хорошо: у агента записи есть book_appointment, check_availability,
cancel_appointment. Всё по делу.
Плохо: у того же агента записи есть ещё search_web, send_sms,
query_sql, read_files. Лишние инструменты повышают шанс, что агент
«полезет не туда».
Типичные наборы
| Тип агента | Инструменты |
|---|---|
| Агент записи | book_appointment, check_availability, cancel_appointment |
| Агент поддержки | order_status, search_docs, create_ticket |
| Агент продаж | get_lead_info, qualify_lead, schedule_demo, send_quote |
| Агент-исследователь | exa, tavily, fetch_url |
| Внутренний аналитик | sql, generate_report |
Коллекции знаний
Папки документов, которые агент может цитировать. В настройках агента отмечаете, какие коллекции доступны — он будет искать в них перед ответом.
Типичное разделение коллекций:
pricing— прайс-листы;faq— вопросы и ответы;internal-policies— регламенты (не показываем клиенту напрямую, используем как контекст);product-docs— описания продуктов;legal— юр-документы.
Агент поддержки видит faq + product-docs. Юр-бот — только legal.
Продажник — pricing + product-docs.
Как создать агента: пошагово
Откройте раздел «Агенты»
В сайдбаре слева. Нажмите «Новый агент».
Заполните имя и описание
- Имя: говорящее, с личностью («Анна из поддержки»).
- Описание: одна строка для коллег («Отвечает на вопросы про тарифы»).
Выберите тип
Обычно — custom. Остальные (reports/data) только если точно
нужны их преимущества.
Выберите модель
Из списка подключённых LLM-провайдеров. Если список пуст — сначала подключите хотя бы одного в Настройки → Модели и API.
Рекомендация на старте: GPT-4o-mini или Claude Haiku.
Напишите системный промпт
Самое важное. По правилу трёх слоёв: кто ты → что делаешь → как себя ведёшь.
200–500 слов на старте. Пересматривайте каждую неделю по реальным логам.
Подключите инструменты
Галочки у MCP-серверов, которые агенту реально нужны. Не давайте лишнего.
Привяжите коллекции знаний
Галочки у документов, которые агент должен цитировать.
Сохранить → тест в песочнице
После сохранения агент сразу доступен. В разделе Чаты → Новый чат выберите этого агента и протестируйте.
Привяжите к каналу
Когда агент работает хорошо в песочнице — привяжите к flow, голосовому каналу, или виджету на сайте.
Продвинутые настройки
Открываются кнопкой «Дополнительно» в форме агента.
- Температура — «творчество» модели. 0 = сухо и предсказуемо, 2 =
хаос. По умолчанию
0.7. Если агент фантазирует — опустите до0.2. Для креативного копирайтинга (редкий кейс) можно поднять до 1.0. - Максимальная длина ответа — сколько токенов максимум в одном
ответе. По умолчанию
2000. Поднимите, если ответы обрываются. Опустите до 500, если агент пишет «романы». - Максимальное число раундов инструментов — сколько раз подряд агент
может вызвать инструменты в одном ответе. По умолчанию
16. Уменьшите до4-8, если агент уходит в «слишком глубокие» цепочки. - Стриминг — печатать ответ по мере генерации. Для чата —
true(живо). Для голоса — не имеет смысла (включается автоматически). - Инструменты — разрешить вызов MCP-серверов. Если
false— агент превращается в «текстового консультанта» без действий. - Автоязык — отвечать на языке клиента автоматически. Если клиент написал по-английски — бот ответит по-английски, даже если промпт на русском.
Паттерны промптов
Short-answer паттерн
Для FAQ-ботов. В промпт добавьте:
Отвечай в 1-2 коротких предложениях. Не используй списки. Не объясняй
долго. Если клиент хочет подробностей, спрашивай: «Рассказать
подробнее?».Сокращает среднюю длину ответа с 300 до 50 токенов → экономия 6× на LLM + лучше восприятие клиентом.
Confirmation паттерн
Для действий с CRM. В промпт:
Перед любым действием (запись, оплата, отмена) — подтверждай у клиента:
«Правильно я понял, вы хотите X? Подтверждаете?». Выполняй действие
только после явного «да», «подтверждаю», «верно».Снижает процент ошибочных записей с 3-5% до 0.5%.
Empathy паттерн
Для жалоб и конфликтов. В промпт:
Если клиент расстроен, рассержен, или использует негативную лексику:
1. Сначала извинись («мне очень жаль что так получилось»);
2. Подтверди, что услышал проблему («понимаю, это действительно
неприятно»);
3. Только после этого предлагай решение или перевод на оператора.NPS в жалобных кейсах вырастает на 1.5-2 пункта.
Tool-selector паттерн
Если у агента 3+ инструментов с похожими именами. В промпт:
Для поиска заказа — используй `order_status(id)`.
Для поиска клиента — используй `customer_lookup(phone)`.
Не путай их: order_status ищет ПО НОМЕРУ заказа, customer_lookup —
по номеру телефона клиента.Сокращает неправильные вызовы инструментов в 4-5 раз.
Антипаттерны промптов
Метрики здоровья агента
Смотрите раз в неделю. Триггеры для вмешательства:
| Метрика | Здоровое значение | Плохое — что делать |
|---|---|---|
| Доля эскалаций на человека | 15–30% | >40% — упростить промпт, расширить базу знаний |
| Средняя длина сессии (сообщений) | 5–10 | >15 — агент «топчется», уточните намерения в промпте |
| Доля сессий с целевым действием | 30–60% | <20% — flow не ведёт к цели, перестройте |
| CSAT (если настроен) | 4.0+ / 5 | <3.5 — агент раздражает, смотрите негативные отзывы |
| Средний ответ (секунды) | <3 сек | >5 сек — модель слишком тяжёлая, переключитесь на mini |
| Стоимость на сессию | $0.005–0.05 | >$0.1 — промпт слишком длинный, сократите |
Частые ошибки и как их исправить
Жизненный цикл агента
Неделя 1 — MVP
Создаёте с базовым промптом (правило трёх слоёв). Тестируете в песочнице. Подключаете 1-2 обязательных инструмента. Загружаете ключевые документы.
Неделя 2 — сбор данных
Запускаете в ограниченном канале (внутренний тест, 10% клиентов). Смотрите реальные диалоги: где бот теряется, где клиенты переспрашивают, где отваливаются.
Неделя 3 — доработка
По увиденному: дописываете промпт, добавляете правила, расширяете базу знаний, докручиваете flow. Добавляете отсутствующие инструменты.
Неделя 4 — полный rollout
Раскатываете на 100% трафика. Следите за метриками ежедневно первую неделю, потом еженедельно.
Далее — continuous improvement
Раз в месяц — разбор неудачных диалогов. Раз в квартал — пересмотр промпта и инструментов. При запуске новых продуктов — новые агенты или новые flow.