AGONTS

Агенты

Из чего состоит агент, как написать хороший промпт, как выбрать модель и инструменты.

Агент — цифровой сотрудник с именем, характером и списком обязанностей. Один продаёт, другой отвечает на вопросы про тарифы, третий записывает на приём. Каждый агент — отдельная сущность со своим промптом, моделью и инструментами.

Этот раздел — основной. Если вы только знакомитесь с платформой — прочитайте целиком. Остальные разделы полагаются на понимание, что такое агент и как его настраивать правильно.

Философия: один агент — одна роль

Самая частая ошибка новичков: создаём одного «универсального» агента, который умеет всё. Этот подход не работает на дистанции.

Почему:

  • LLM теряет фокус. Чем шире промпт — тем хуже каждый отдельный кейс.
  • Инструменты путаются. Если у агента 20 MCP-инструментов, он начинает вызывать их не по делу.
  • Аналитика смешивается. Вы не видите, где проблема: в продажах, в поддержке, или в записи.
  • Обновить сложно. Меняете промпт для одной задачи — ломаете другую.

Правильный подход: один агент — одна чёткая роль с чёткими обязанностями. Как в компании: менеджер по продажам ≠ оператор техподдержки ≠ HR-специалист.

Типичные роли агентов в разных доменах

Клиентские (общение с клиентами):

  • Первая линия — принимает входящий поток, определяет намерение, маршрутизирует на других агентов или операторов.
  • Продажник — квалифицирует заинтересованных, назначает демо, отвечает на возражения.
  • Техподдержка — FAQ, статусы заказов, типовые проблемы.
  • Записатор — бронирование приёмов, встреч, услуг.
  • Консультант по продукту — подбирает товар / тариф / услугу под нужды клиента.
  • Retention-агент — удержание (мягко удерживает при попытке отмены).
  • Коллектор — мягкое напоминание о задолженности.
  • NPS-интервьюер — собирает обратную связь после сделки.

HR (соискатели и сотрудники):

  • HR-рекрутер — общается с соискателями, скрининг, запись на собеседование.
  • Массовый hiring — обзвон большой базы откликов (курьеры, линейный персонал).
  • Onboarding-ассистент — помогает новичкам (доступы, документы, процессы).
  • Exit-интервьюер — уходящих собирает feedback.

Внутренние (для ваших сотрудников):

  • IT-helpdesk — пароли, доступы, базовые проблемы.
  • Внутренний HR-бот — отпуска, ДМС, расчётки, регламенты.
  • Юр-консультант — типовые вопросы по договорам, процедурам.
  • BI-аналитик — сотрудник спрашивает «сколько продаж» → SQL → ответ.
  • SOP-гид — показывает нужный внутренний регламент по вопросу.

Автоматизация (без людей):

  • Webhook-обработчик — парсит входящие события, запускает цепочки.
  • Cron-репортёр — утренние сводки, еженедельные отчёты.
  • Классификатор — категоризирует входящие обращения, тикеты.
  • Суммаризатор — обрабатывает длинные тексты, отзывы, звонки.
  • Synchronizer — переносит данные между системами (CRM ↔ ERP ↔ BI).

Маршрутизация между агентами — через flow с нодой intent-router или через subagent внутри большого flow.


Из чего состоит агент

У каждого агента шесть ключевых настроек:

Имя

Как представляется клиенту. Влияет на восприятие. «Анна из поддержки» звучит дружелюбнее, чем «Бот поддержки №1».

Хорошие примеры:

  • «Мария — консультант Улыбки»
  • «Алекс из тех поддержки»
  • «Ева, ассистент по продажам»

Плохие:

  • «AI-bot» — холодно, клиенту сразу хочется человека.
  • «Alexa 2.0» — путаница с Amazon.
  • «Ваш помощник» — безлико.

Описание

Не для клиента, а для вашей команды. Одна строка про его работу: «Отвечает на вопросы про тарифы и записывает заявки от B2B-клиентов». Удобно для коллег, которые видят список агентов в админке.

Тип (пресет)

Три варианта, стартовые наборы настроек:

Пустой шаблон. Без специализаций. Берите, если ни один другой пресет не подходит — и наполняйте сами. Большинство клиентов стартуют отсюда.

Агент для работы с документами. Настроен цитировать, сохранять структуру, ссылаться на источники. Подойдёт для:

  • юридической поддержки (ссылки на статьи регламентов);
  • HR-ассистента (цитаты из кадровой политики);
  • FAQ-бота с большой документацией;
  • бота-консультанта по инструкциям.

Аналитик. Умеет формулировать SQL-запросы, строить агрегации, объяснять числа. Подключается к вашей БД через MCP-инструмент sql. Подойдёт для:

  • внутреннего bi-ассистента («сколько продаж за неделю?»);
  • оператора-аналитика (отвечает клиенту на вопрос «где мой заказ №12345»);
  • автоотчётов (cron-flow с этим агентом).

Тип — это стартовый набор настроек. После создания вы всё равно можете поменять любое поле независимо. Не бойтесь начать с custom и докрутить.

Системный промпт — главный инструмент

Промпт — самое важное поле. Это инструкция, которую агент читает перед каждым диалогом и которую клиент не видит.

90% успеха или провала агента — в качестве промпта.


Системный промпт: подробный гайд

Анатомия хорошего промпта

Хороший промпт содержит четыре обязательных блока:

  1. Идентичность. Кто ты?
  2. Задачи. Что ты делаешь?
  3. Правила поведения. Как ты себя ведёшь?
  4. Границы. Что делать в неожиданных ситуациях?

Плохой промпт

Ты помощник клиники. Помогай клиентам.

Что не так:

  • Нет имени → агент отвечает безлично.
  • Нет тона → говорит то формально, то фамильярно (непредсказуемо).
  • Нет границ → уходит в off-topic (обсуждает погоду, рассказывает шутки).
  • Нет инструкции про инструменты → не вызывает CRM, хотя должен.
  • Нет правил эскалации → не переводит на человека в жалобах.

Результат: 40% клиентов получают «не то», 20% уходят к живому оператору.

Хороший промпт

Ты — Анна, консультант стоматологической клиники «Улыбка».

Твоя задача:
- отвечать на вопросы про услуги, цены, адреса;
- записывать клиентов на приём через инструмент `book_appointment`;
- проверять свободные слоты через `check_availability`;
- при жалобах — переводить разговор на администратора.

Правила поведения:
- говори кратко: 1-2 предложения в ответе;
- обращайся на «вы», уважительно, но дружелюбно;
- не обещай медицинский результат («гарантированно вылечим»);
- цены называй точно, как в базе знаний; никогда не выдумывай;
- не используй медицинскую терминологию без объяснения;
- если клиент говорит о боли 8/10 или выше — экстренно переводи
  администратору.

Границы:
- если клиент спрашивает что-то вне темы стоматологии (политика, погода,
  личные вопросы) — вежливо возвращай к делу: «Я консультирую только по
  вопросам стоматологии. Что вас интересует по нашим услугам?».
- если клиент рассержен или использует слова «жалоба», «претензия»,
  «оператор», «человек» — сразу вызывай `transfer_to_human`.
- если ты 3 раза подряд не понял клиента — переводи на человека.

Что хорошо:

  • Имя и роль в первой строке — агент не теряет идентичность.
  • Конкретные задачи с именами инструментов — агент знает, что вызывать.
  • Правила — короткий ответ, тон, ограничения.
  • Явные границы — что делать в нестандартных случаях.
  • Механизм эскалации — явное указание когда передавать человеку.

Результат: в реальных замерах — около 85% сессий закрываются без участия оператора, NPS — 4.6/5.

Правило трёх слоёв

Минимальный промпт для MVP

Кто ты → что делаешь → как себя ведёшь. Этого достаточно на старте. Через неделю замеров добавите правил и границ по увиденному.

Длина промпта

  • Минимум: 100-200 слов (для простого FAQ-бота).
  • Норма: 300-700 слов (типичный продакшен-агент).
  • Максимум: 2000-3000 слов (сложная регулируемая индустрия — банки, медицина). Дольше — LLM начинает «забывать» середину.

Что НЕ запихивать в промпт


Выбор модели

На уровне агента выбираете конкретную модель от подключённого провайдера. Выбор сильно влияет на качество и стоимость.

Средняя модель. Быстрые короткие ответы в чате.

  • GPT-4o-mini — баланс цены/качества, OpenAI надёжен.
  • Claude Haiku — быстрее GPT, чуть дороже.
  • Qwen 14B / Llama 3.1 8B — open-source, можно self-host.

Цена: $0.15–1 за 1M токенов. Типичная сессия: 20-50 токенов на запрос + 50-150 на ответ. При 10K диалогов в месяц — около $5–15 на LLM.

Топовая модель. Юр-вопросы, длинные цепочки, тонкие формулировки, чувствительные ответы.

  • GPT-4o — эталон для «умных» задач.
  • Claude Sonnet — лучший следователь инструкций, меньше «галлюцинаций».
  • Qwen 72B / Llama 3.1 70B — open-source flagships.

Цена: $3–15 за 1M. Когда оправдано: ошибка стоит денег (юр-консультация, мед-советы, финансовые продукты) или репутации.

Маленькая модель. Высокие объёмы, приоритет цены.

  • GPT-3.5 — классика, устарела но дешёвая.
  • Qwen 7B / Llama 3.1 3B — open-source, быстрый inference.
  • Self-hosted Ollama — бесплатно, но нужен сервер.

Цена: от $0.1 / 1M или вообще бесплатно. Когда оправдано: 100K+ запросов в день, простые ответы, можно смириться с падением качества на 5–10%.

Self-hosted. Никаких данных наружу, полный контроль.

  • vLLM + Llama 70B / Qwen 72B / Mistral — production-grade.
  • Ollama — для dev и малых нагрузок (< 100 req/min).
  • TGI от HuggingFace — стабильная альтернатива vLLM.

Железо: GPU от 80 ГБ VRAM для 70B моделей, 24 ГБ для 14B. Типичный кейс: банки, медицина, госсектор, корпоративные внутренние ассистенты с PII.

Decision tree для выбора

Это клиентский бот или внутренний?

Клиентский — качество важнее цены. Внутренний — можно экономить.

Данные чувствительные?

Да → self-hosted. Нет → облако (быстрее и проще).

Какой объём?

До 10K/день — любая модель. Больше — смотрите на цену токена.

Насколько сложная задача?

FAQ → mini/Haiku. Консультация → 4o/Sonnet. Юр-анализ → Opus/o1.

Начните со средней

Через 2 недели замеров увидите, надо ли поднимать/опускать.

Универсальный совет: стартуйте с GPT-4o-mini (если облако) или Qwen 14B (если self-hosted). 80% кейсов закроет. Ответы плохие → поднимайте до GPT-4o / Qwen 72B. Деньги жмут и ответы приемлемые → опускайте до mini.


Инструменты (MCP)

Агент может вызывать внешние инструменты для получения данных или выполнения действий. В настройках агента отмечаете галочками, какие доступны.

Принципы выбора инструментов

Чем меньше инструментов у агента, тем лучше он работает. Не давайте ему «всё подряд» — модель начнёт путаться, вызывать не по делу, съедать контекст.

Хорошо: у агента записи есть book_appointment, check_availability, cancel_appointment. Всё по делу.

Плохо: у того же агента записи есть ещё search_web, send_sms, query_sql, read_files. Лишние инструменты повышают шанс, что агент «полезет не туда».

Типичные наборы

Тип агентаИнструменты
Агент записиbook_appointment, check_availability, cancel_appointment
Агент поддержкиorder_status, search_docs, create_ticket
Агент продажget_lead_info, qualify_lead, schedule_demo, send_quote
Агент-исследовательexa, tavily, fetch_url
Внутренний аналитикsql, generate_report

Коллекции знаний

Папки документов, которые агент может цитировать. В настройках агента отмечаете, какие коллекции доступны — он будет искать в них перед ответом.

Типичное разделение коллекций:

  • pricing — прайс-листы;
  • faq — вопросы и ответы;
  • internal-policies — регламенты (не показываем клиенту напрямую, используем как контекст);
  • product-docs — описания продуктов;
  • legal — юр-документы.

Агент поддержки видит faq + product-docs. Юр-бот — только legal. Продажник — pricing + product-docs.


Как создать агента: пошагово

Откройте раздел «Агенты»

В сайдбаре слева. Нажмите «Новый агент».

Заполните имя и описание

  • Имя: говорящее, с личностью («Анна из поддержки»).
  • Описание: одна строка для коллег («Отвечает на вопросы про тарифы»).

Выберите тип

Обычно — custom. Остальные (reports/data) только если точно нужны их преимущества.

Выберите модель

Из списка подключённых LLM-провайдеров. Если список пуст — сначала подключите хотя бы одного в Настройки → Модели и API.

Рекомендация на старте: GPT-4o-mini или Claude Haiku.

Напишите системный промпт

Самое важное. По правилу трёх слоёв: кто ты → что делаешь → как себя ведёшь.

200–500 слов на старте. Пересматривайте каждую неделю по реальным логам.

Подключите инструменты

Галочки у MCP-серверов, которые агенту реально нужны. Не давайте лишнего.

Привяжите коллекции знаний

Галочки у документов, которые агент должен цитировать.

Сохранить → тест в песочнице

После сохранения агент сразу доступен. В разделе Чаты → Новый чат выберите этого агента и протестируйте.

Привяжите к каналу

Когда агент работает хорошо в песочнице — привяжите к flow, голосовому каналу, или виджету на сайте.


Продвинутые настройки

Открываются кнопкой «Дополнительно» в форме агента.

  • Температура — «творчество» модели. 0 = сухо и предсказуемо, 2 = хаос. По умолчанию 0.7. Если агент фантазирует — опустите до 0.2. Для креативного копирайтинга (редкий кейс) можно поднять до 1.0.
  • Максимальная длина ответа — сколько токенов максимум в одном ответе. По умолчанию 2000. Поднимите, если ответы обрываются. Опустите до 500, если агент пишет «романы».
  • Максимальное число раундов инструментов — сколько раз подряд агент может вызвать инструменты в одном ответе. По умолчанию 16. Уменьшите до 4-8, если агент уходит в «слишком глубокие» цепочки.
  • Стриминг — печатать ответ по мере генерации. Для чата — true (живо). Для голоса — не имеет смысла (включается автоматически).
  • Инструменты — разрешить вызов MCP-серверов. Если false — агент превращается в «текстового консультанта» без действий.
  • Автоязык — отвечать на языке клиента автоматически. Если клиент написал по-английски — бот ответит по-английски, даже если промпт на русском.

Паттерны промптов

Short-answer паттерн

Для FAQ-ботов. В промпт добавьте:

Отвечай в 1-2 коротких предложениях. Не используй списки. Не объясняй
долго. Если клиент хочет подробностей, спрашивай: «Рассказать
подробнее?».

Сокращает среднюю длину ответа с 300 до 50 токенов → экономия 6× на LLM + лучше восприятие клиентом.

Confirmation паттерн

Для действий с CRM. В промпт:

Перед любым действием (запись, оплата, отмена) — подтверждай у клиента:
«Правильно я понял, вы хотите X? Подтверждаете?». Выполняй действие
только после явного «да», «подтверждаю», «верно».

Снижает процент ошибочных записей с 3-5% до 0.5%.

Empathy паттерн

Для жалоб и конфликтов. В промпт:

Если клиент расстроен, рассержен, или использует негативную лексику:
1. Сначала извинись («мне очень жаль что так получилось»);
2. Подтверди, что услышал проблему («понимаю, это действительно
   неприятно»);
3. Только после этого предлагай решение или перевод на оператора.

NPS в жалобных кейсах вырастает на 1.5-2 пункта.

Tool-selector паттерн

Если у агента 3+ инструментов с похожими именами. В промпт:

Для поиска заказа — используй `order_status(id)`.
Для поиска клиента — используй `customer_lookup(phone)`.
Не путай их: order_status ищет ПО НОМЕРУ заказа, customer_lookup —
по номеру телефона клиента.

Сокращает неправильные вызовы инструментов в 4-5 раз.


Антипаттерны промптов


Метрики здоровья агента

Смотрите раз в неделю. Триггеры для вмешательства:

МетрикаЗдоровое значениеПлохое — что делать
Доля эскалаций на человека15–30%>40% — упростить промпт, расширить базу знаний
Средняя длина сессии (сообщений)5–10>15 — агент «топчется», уточните намерения в промпте
Доля сессий с целевым действием30–60%<20% — flow не ведёт к цели, перестройте
CSAT (если настроен)4.0+ / 5<3.5 — агент раздражает, смотрите негативные отзывы
Средний ответ (секунды)<3 сек>5 сек — модель слишком тяжёлая, переключитесь на mini
Стоимость на сессию$0.005–0.05>$0.1 — промпт слишком длинный, сократите

Частые ошибки и как их исправить


Жизненный цикл агента

Неделя 1 — MVP

Создаёте с базовым промптом (правило трёх слоёв). Тестируете в песочнице. Подключаете 1-2 обязательных инструмента. Загружаете ключевые документы.

Неделя 2 — сбор данных

Запускаете в ограниченном канале (внутренний тест, 10% клиентов). Смотрите реальные диалоги: где бот теряется, где клиенты переспрашивают, где отваливаются.

Неделя 3 — доработка

По увиденному: дописываете промпт, добавляете правила, расширяете базу знаний, докручиваете flow. Добавляете отсутствующие инструменты.

Неделя 4 — полный rollout

Раскатываете на 100% трафика. Следите за метриками ежедневно первую неделю, потом еженедельно.

Далее — continuous improvement

Раз в месяц — разбор неудачных диалогов. Раз в квартал — пересмотр промпта и инструментов. При запуске новых продуктов — новые агенты или новые flow.


On this page

Философия: один агент — одна рольТипичные роли агентов в разных доменахИз чего состоит агентИмяОписаниеТип (пресет)Системный промпт — главный инструментСистемный промпт: подробный гайдАнатомия хорошего промптаПлохой промптХороший промптПравило трёх слоёвДлина промптаЧто НЕ запихивать в промптВыбор моделиDecision tree для выбораЭто клиентский бот или внутренний?Данные чувствительные?Какой объём?Насколько сложная задача?Начните со среднейИнструменты (MCP)Принципы выбора инструментовТипичные наборыКоллекции знанийКак создать агента: пошаговоОткройте раздел «Агенты»Заполните имя и описаниеВыберите типВыберите модельНапишите системный промптПодключите инструментыПривяжите коллекции знанийСохранить → тест в песочницеПривяжите к каналуПродвинутые настройкиПаттерны промптовShort-answer паттернConfirmation паттернEmpathy паттернTool-selector паттернАнтипаттерны промптовМетрики здоровья агентаЧастые ошибки и как их исправитьЖизненный цикл агентаНеделя 1 — MVPНеделя 2 — сбор данныхНеделя 3 — доработкаНеделя 4 — полный rolloutДалее — continuous improvement