Загрузить документы
Форматы, лимиты и организация. Как загрузить PDF, Word, Excel и ссылки в базу знаний AI-сотрудника.
Документы — это фактура, на которой AI-сотрудник строит ответы. Чем качественнее и структурированнее документы, тем точнее реплики и меньше галлюцинаций.
Поддерживаемые форматы
| Формат | Пример | Особенности |
|---|---|---|
| регламенты, коммерческие предложения | если скан — нужен OCR | |
| Word | DOCX, DOC | таблицы читаются корректно |
| Excel | XLSX, CSV | первая строка используется как заголовки колонок |
| TXT | plain text | UTF-8 по умолчанию |
| Markdown | MD | хорошо структурируется, заголовки сохраняются |
| HTML | выгрузка с сайта | стили отбрасываются, текст остаётся |
| Ссылки на сайт | https://example.com | бот обходит страницы сам, до 200 страниц с одного домена |
Сайт под VPN или авторизацией
Если страница доступна только из вашей сети, требует авторизацию или живёт за HTTP basic — наш краулер её не увидит. Варианты: выгрузите HTML-снимок страниц вручную и загрузите как файлы, или подключите ваш API через Custom MCP — AI-сотрудник будет ходить за данными напрямую, без публичной страницы.
Что выбрать
Предпочитайте Word или Markdown, а не PDF со сканом. Текстовые форматы индексируются быстрее и лучше разбиваются на смысловые фрагменты. PDF со сканом тоже работает, но сначала проходит через OCR, что удлиняет обработку.
Лимиты по тарифам
| Тариф | Максимум документов | Размер файла | Обновление |
|---|---|---|---|
| Starter | 50 | 20 МБ | ручное |
| Pro | 500 | 100 МБ | ручное + расписание |
| Business | без лимита | 500 МБ | ручное + расписание + API |
Ссылки на сайт считаются как один документ на страницу. Если у вас статья на 10 страницах — это 10 строк в списке.
Как загрузить
Откройте карточку AI-сотрудника и перейдите в раздел Документы. Перетащите файлы в зону загрузки или нажмите Выбрать файлы. Можно загружать сразу до 20 файлов.
После загрузки каждый документ проходит три шага:
- Проверка формата. AG0NTS определяет тип файла и извлекает текст. Для PDF со сканом автоматически запускается OCR.
- Разбиение на фрагменты. Длинный документ режется на смысловые блоки по 200–500 слов. Разрезы идут по заголовкам и границам параграфов, чтобы не ломать смысл.
- Индексация. Каждый фрагмент сохраняется в поисковую базу. AI-сотрудник будет находить нужные блоки во время диалога за миллисекунды.
Средняя скорость — 30–90 секунд на документ в 10–30 страниц. Большие PDF со сканом могут занять до 5 минут.
Как редактировать документ
Бизнес меняется: выходят новые цены, правила возвратов, акции. Документы в AG0NTS — живые.
Способ 1: загрузить новую версию. В списке документов нажмите Заменить. Загрузите обновлённый файл — старая версия автоматически архивируется, AI-сотрудник переучивается на новую. Ссылки в истории диалогов продолжают работать на старые версии, так что аудит не ломается.
Способ 2: редактировать прямо в AG0NTS. Для текстовых форматов (TXT, Markdown) доступен встроенный редактор. Правки вступают в силу через минуту после сохранения.
Способ 3: обновить по расписанию. На тарифах Pro и Business можно задать источник и расписание — например, раз в сутки перечитывать страницы сайта или забирать прайс с облачного диска. AG0NTS скачает, сравнит с предыдущей версией и переиндексирует только изменившееся.
Задержка индексации
После загрузки или замены документа AI-сотрудник видит обновления не мгновенно. На Starter задержка до 2 минут, на Pro — до 30 секунд, на Business — меньше 10 секунд. В это время реплики могут опираться на старую версию.
Организация: коллекции
Когда документов становится больше 10–15, удобно разложить их по коллекциям. Коллекция — это папка с общей темой: «Цены», «Юридические», «Инструкции клиенту», «Внутренние регламенты».
Что это даёт:
- В границах работы AI-сотрудника можно писать «Используй только коллекцию Юридические для ответов про договор» — это уменьшает шум и ускоряет ответы
- Можно назначить одному AI-сотруднику только «Цены и прайс», а другому — «Поддержка и возвраты»
- При экспорте и аудите видно, какая коллекция чаще всего цитируется
Создайте коллекцию кнопкой Новая коллекция в разделе «Документы», потом перетащите документы в неё.
Удаление и архив
Удаление документа мягкое: он попадает в архив, но связанные цитаты в истории диалогов продолжают открываться (для аудита и претензий). Через 90 дней документ физически удаляется с серверов.
Если нужно удалить документ навсегда и сразу (например, содержал персональные данные) — откройте документ и нажмите Удалить безвозвратно. Это действие пишется в журнал аудита, его увидят все администраторы воркспейса.